বিশ্লেষণের জন্য সিডিএফ এবং পিডিএফ পরিসংখ্যান কীভাবে ব্যবহার করবেন


12

এটি সাধারণ প্রশ্নের খুব বেশি হতে পারে তবে আমি আশা করি আমি এখানে সহায়তা পেতে পারি। আমি আমার বিশ্ববিদ্যালয়ে আরএ জব শুরু করছি এবং আমার বিষয় ইন্টারনেট ট্রাফিক বিশ্লেষণ সম্পর্কিত হবে। বিশ্লেষণের জগতে আমি মোটামুটি নতুন, তবে আমার ধারণা গবেষণার জগতে এটি আমাকে অনেক কিছু করতে হবে।

আমি কয়েকটি কাগজপত্র দিয়েছি এবং অনেকগুলিতে আমি দেখতে পেয়েছি তারা প্রাপ্ত ফলাফলগুলি ব্যাখ্যা করার জন্য তারা সম্ভাব্যতা ঘনত্ব (পিডিএফ), সিডিএফ, সিসিডিএফ ইত্যাদি ব্যবহার করে। উদাহরণস্বরূপ, ব্যবহারকারীর সেশন পিরিয়ডের পিডিএফ, প্রতিদিন স্থানান্তরিত বাইটের সিডিএফ ইত্যাদি আমি সম্ভাব্যতা এবং পরিসংখ্যান শ্রেণি নিয়েছি তাই আমি বুঝতে পারি সেগুলি কী তবে আমি এখনও এমন মামলায় বিভ্রান্ত হয়েছি যে ক্ষেত্রে এই জাতীয় প্রতিনিধিত্ব বাছাই হবে।

সুতরাং, যদি এমন কেউ যদি এই জাতীয় গ্রাফ এবং বিশ্লেষণ করে থাকেন (সাধারণভাবে বা অন্য কোনও বিষয়ে) আপনি কি আমাকে বলতে পারেন যে কোন পরিস্থিতিতে আমি এই উপস্থাপনাগুলির একটি বা অন্যটি ব্যবহার করব?

উত্তর:


17

এটি আংশিক স্বাদ এবং সম্মেলনের বিষয়, তবে তত্ত্ব, আপনার উদ্দেশ্যগুলির প্রতি মনোযোগ এবং জ্ঞানীয় নিউরোসায়েন্সের একটি স্মিডজেন [রেফারেন্সগুলি দেখুন] কিছু দিকনির্দেশনা সরবরাহ করতে পারে।

যেহেতু একটি পিডিএফ এবং সিডিএফ একই তথ্য দেয়, তাদের মধ্যে পার্থক্য তারা কীভাবে এটি করে তা থেকে উদ্ভূত হয় : একটি পিডিএফ অঞ্চলগুলির সাথে সম্ভাব্যতা উপস্থাপন করে যখন একটি সিডিএফ (উল্লম্ব) দূরত্ব সহ সম্ভাবনার প্রতিনিধিত্ব করে । অধ্যয়নগুলি দেখায় যে লোকেরা অঞ্চলগুলির তুলনা করার চেয়ে দূরত্বগুলি দ্রুত এবং আরও নির্ভুলভাবে তুলনা করে এবং তারা অঞ্চলগুলি পদ্ধতিগতভাবে ভুল অনুমান করে। সুতরাং, যদি আপনার উদ্দেশ্য সম্ভাবনাগুলি পড়ার জন্য কোনও গ্রাফিকাল সরঞ্জাম সরবরাহ করা হয় তবে আপনার সিডিএফ ব্যবহার করা উচিত।

PDF গুলি এবং cdfs এছাড়াও সম্ভাব্যতা প্রতিনিধিত্ব ঘনত্ব : সাবেক মাধ্যমে যাতে করে উচ্চতা যখন আধুনিক দ্বারা ঘনত্ব প্রতিনিধিত্ব করে ঢাল । এখন টেবিলগুলি ঘুরিয়ে দেওয়া হয়েছে, কারণ লোকেরা opeালের নিরিমান অনুমানকারী (যা একটি কোণের স্পর্শক; আমরা নিজেই কোণটি দেখতে পাই)। মোডগুলি, লেজগুলির ভারীতা এবং ফাঁকগুলি সম্পর্কে তথ্য জানাতে ঘনত্বগুলি ভাল। পিডিএফ ব্যবহার করে এমন পরিস্থিতিতে এবং অন্য কোথাও যেখানে সম্ভাব্যতা বিতরণের স্থানীয় বিবরণের উপর জোর দেওয়া দরকার Favor

কখনও কখনও একটি পিডিএফ বা সিডিএফ দরকারী তাত্ত্বিক তথ্য সরবরাহ করে। এর মান (বা বরং এর বিপরীতে) কোয়ান্টাইলস, চূড়ান্তকরণ এবং র‌্যাঙ্কের পরিসংখ্যানের স্ট্যান্ডার্ড ত্রুটির সূত্রগুলিতে জড়িত। এ জাতীয় পরিস্থিতিতে সিডিএফের চেয়ে পিডিএফ প্রদর্শন করুন। কোপুলাসের মতো ননপ্যারমেট্রিক সেটিংয়ে মাল্টিভারিয়েট রিলেশনশিপগুলি অধ্যয়ন করার সময় সিডিএফ আরও কার্যকর হতে পারে (সম্ভবত এটি এমন ক্রিয়া যা একটি অবিচ্ছিন্ন সম্ভাবনার আইনটিকে অভিন্ন হিসাবে রূপান্তরিত করে)।

একটি পিডিএফ বা সিডিএফ একটি নির্দিষ্ট পরিসংখ্যান পরীক্ষার সাথে নিবিড়ভাবে যুক্ত হতে পারে। Kolmogorov-Smirnov পরীক্ষা (এবং কে এস পরিসংখ্যাত) সিডিএফ কাছাকাছি একটি উল্লম্ব বাফার পরিপ্রেক্ষিতে একটি সহজ গ্রাফিকাল উপস্থাপনা আছে; এটির পিডিএফ (যা আমি জানি) এর ক্ষেত্রে কোনও সাধারণ গ্রাফিকাল উপস্থাপনা নেই।

সিসিডিএফ (পরিপূরক সিডিএফ) বিশেষ অ্যাপ্লিকেশনগুলিতে ব্যবহৃত হয় যা বেঁচে থাকা এবং বিরল ইভেন্টগুলিতে ফোকাস করে। এর ব্যবহার কনভেনশন দ্বারা প্রতিষ্ঠিত হয় to

তথ্যসূত্র

ডাব্লুএস ক্লিভল্যান্ড (1994)। গ্রাফিং ডেটার উপাদানসমূহ। সামিট, এনজে, মার্কিন যুক্তরাষ্ট্র: হোবার্ট প্রেস Press আইএসবিএন 0-9634884-1-4

বিডি ডেন্ট (1999)। কার্টোগ্রাফি: থিম্যাটিক ম্যাপ ডিজাইন 5 তম এড। বোস্টন, এমএ, মার্কিন যুক্তরাষ্ট্র: ডাব্লুসিবি ম্যাকগ্রা-হিল।

এএম ম্যাকএচরেন (2004)। মানচিত্র কীভাবে কাজ করে। নিউ ইয়র্ক, এনওয়াই, মার্কিন যুক্তরাষ্ট্র: দ্যা গিলফোর্ড প্রেস। আইএসবিএন 1-57230-040-এক্স


(+1) বিশেষত দূরত্ব বনাম অঞ্চল এবং opeাল বনাম উচ্চতার ব্যাখ্যার অন্তর্দৃষ্টিগুলির জন্য।
স্টেফেন

8

আমি whuber এর উত্তর সাথে একমত, কিন্তু একটি অতিরিক্ত গৌণ পয়েন্ট আছে:

সিডিএফের একটি সাধারণ অ-প্যারামিট্রিক অনুমানকারী রয়েছে যা করার জন্য কোনও বিকল্পের প্রয়োজন নেই: অভিজ্ঞতা অভিজ্ঞতা বিতরণ কার্যক্রম । এটা না বেশ একটি PDF অনুমান করার জন্য এত সহজ। আপনি যদি একটি হিস্টোগ্রাম ব্যবহার করেন তবে আপনাকে বিনের প্রস্থ এবং প্রথম বিনের প্রারম্ভিক বিন্দু চয়ন করতে হবে। আপনি যদি কার্নেলের ঘনত্বের প্রাক্কলন ব্যবহার করেন তবে আপনাকে কার্নেল আকার এবং ব্যান্ডউইথ চয়ন করতে হবে। একটি সন্দেহজনক বা কঠোর পাঠক আশ্চর্য হতে পারেন যদি সত্যিই এই সম্পূর্ণভাবে বেছে নেওয়া হয়েছে অবরোহমার্গী অথবা আপনি কয়েক বিভিন্ন মান চেষ্টা যদি এবং বেশী যে ফলাফলের আপনি সবচেয়ে পছন্দ দিলেন বেছে নেওয়া হয়েছে।

যদিও এটি কেবল একটি সামান্য বিষয়। এই whuber তৈরি আরও গুরুত্বপূর্ণ, তাই আমি সম্ভবত এটি ব্যবহার করতে চাই যখন আমি এখনও সেগুলি বিবেচনা করার পরে সিদ্ধান্তহীন ছিল।


এটি এখনও একটি আকর্ষণীয় বিষয়। এটা আনার জন্য ধন্যবাদ.
whuber

2

আমি অনুমান করি এটি নির্ভর করে আপনি কোন পরিসংখ্যান বা অনুসন্ধানগুলি সন্ধান করতে চলেছেন, গবেষণা করছেন, গবেষণা করবেন বা রিপোর্ট করবেন। আমি ধরে নিচ্ছি আপনি সম্ভবত এই বিশ্ববিদ্যালয়গুলি আপনার বিশ্ববিদ্যালয়ের বিষয়ের অনুসন্ধানগুলি উপস্থাপনের জন্য এই গ্রাফগুলি ব্যবহার করবেন, তাই না?

উদাহরণস্বরূপ, আপনি যদি এই কথাটি সম্পর্কে অনুসন্ধান করতে চান যে 'ব্যবহারকারীরা কতক্ষণ এএ নির্দিষ্ট ওয়েবসাইটের উপরে থাকে' তবে এটি সিডিএফ এ দেখানো ভাল হতে পারে কারণ এটি সেই ওয়েবসাইটে, পৃষ্ঠাগুলির মাধ্যমে তিনি যে সময় কাটিয়েছিলেন তা দেখায় shows ।

অন্যদিকে, আপনি যদি কোনও বিজ্ঞাপনের লিঙ্কে ক্লিক করা ব্যবহারকারীদের সম্ভাব্যতা (উদাহরণস্বরূপ গুগল অ্যাডওয়ার্ডস লিঙ্ক) দেখাতে চান তবে আপনি এটি পিডিএফ আকারে উপস্থাপন করতে চাইতে পারেন কারণ এটি সম্ভবত একটি সাধারণ বিতরণের বেল বাঁক হবে এবং আপনি প্রদর্শন করতে পারেন যে হেন্পেন হওয়ার সম্ভাবনা।

আশা করি এটি সাহায্য করবে, জেফ

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.