একটি "সাধারণ বিতরণ" এর অর্থ = মধ্যমা = মোড থাকা দরকার?


17

আমি "সাধারণ বিতরণ" সম্পর্কে আমার স্নাতক স্তরের পরিসংখ্যান প্রফেসরের সাথে একটি বিতর্কে রয়েছি। আমি দাবি করি যে সত্যিকার অর্থে একটি সাধারণ বিতরণ পেতে আপনার অবশ্যই গড় = মিডিয়ান = মোড থাকা উচিত, সমস্ত ডেটা অবশ্যই বেলের বক্ররেখার নীচে এবং পুরোপুরি পুরোপুরি প্রতিসাম্হিকভাবে প্রতিলিপিযুক্ত থাকতে হবে। অতএব, প্রযুক্তিগতভাবে, বাস্তব গবেষণায় কার্যত কোনও সাধারণ বিতরণ নেই, এবং আমাদের তাদের অন্য কিছু বলা উচিত, সম্ভবত "কাছাকাছি-স্বাভাবিক"।

তিনি বলেন আমি খুব পিকেই এবং যদি স্কু / কুর্তোসিস ১.০ এর কম হয় তবে এটি একটি সাধারণ বিতরণ এবং পরীক্ষায় পয়েন্ট বন্ধ করে দেয়। 52 টি নার্সিং হোমের র্যান্ডম স্যাম্পলিংয়ে ডেটাসেটটি মোট ঝরনা / বছরের সংখ্যা যা একটি বৃহত জনসংখ্যার এলোমেলো নমুনা। কোন অন্তর্দৃষ্টি?

সমস্যা:

প্রশ্ন: ৩. এই ডেটার জন্য স্কিউনেস এবং কুর্তোসিসের পরিমাপগুলি গণনা করুন। একটি সাধারণ বক্ররেখার সাথে একটি হিস্টগ্রাম অন্তর্ভুক্ত করুন। আপনার অনুসন্ধানগুলি আলোচনা করুন। ডেটা কি সাধারণত বিতরণ করা হয়?

Statistics 
Number of falls  
N  Valid    52
   Missing   0
Mean        11.23
Median      11.50
Mode         4a

ক। একাধিক মোড বিদ্যমান। ক্ষুদ্রতম মান প্রদর্শিত হয়

Number of falls  
N  Valid    52
   Missing   0
Skewness      .114
Std. Error of Skewness    .330
Kurtosis  -.961
Std. Error of Kurtosis    .650

আমার উত্তর:

ডেটা প্ল্যাটিকার্টিক এবং কেবলমাত্র সামান্য ধনাত্মক স্কিউইং থাকে এবং এটি কোনও সাধারণ বিতরণ নয় কারণ গড় এবং মাঝারি এবং মোড সমান নয় এবং ডেটাটি প্রায় সমানভাবে বিতরণ করা হয় না। বাস্তবে কার্যত কোনও ডেটা কখনই নিখুঁত স্বাভাবিক বিতরণ হয় না, যদিও আমরা উচ্চতা, ওজন, তাপমাত্রা বা বড় জনগোষ্ঠীর মধ্যে প্রাপ্তবয়স্ক রিং আঙুলের দৈর্ঘ্যের মতো "প্রায় সাধারণ বিতরণ" নিয়ে আলোচনা করতে পারি।

অধ্যাপকের উত্তর:

আপনি সঠিক যে কোনও সঠিক বিতরণ নেই। তবে, আমরা পরিপূর্ণতা খুঁজছি না। হিস্টোগ্রাম এবং কেন্দ্রীয় প্রবণতার ব্যবস্থা ছাড়াও আমাদের ডেটা দেখতে হবে। Skewness এবং কুর্তোসিস পরিসংখ্যান বিতরণ সম্পর্কে আপনাকে কী বলে? যেহেতু তারা উভয়ই -1 এবং +1 এর সমালোচনামূলক মানগুলির মধ্যে রয়েছে, এই ডেটাটিকে সাধারণত বিতরণ করা হিসাবে বিবেচনা করা হয়।


3
আমি আপনার অধ্যাপকের সঠিক শব্দটি জানতে চাই। নীতিগতভাবে একটি সাধারণ বিতরণের অর্থ, মাঝারি এবং মোড অভিন্ন (তবে এটি অন্যান্য অনেকগুলি বন্টন করে) এবং স্কিউনেস 0 এবং (তথাকথিত অতিরিক্ত) কুর্তোসিস 0 (এবং অন্য কিছু বিতরণও রয়েছে)। সর্বোপরি (যেমন) সামান্য স্কিউনেস বা কুর্তোসিস সহ একটি বিতরণ প্রায় স্বাভাবিক। নোট করুন যে প্রায় সমস্ত আসল তথ্য তাত্ত্বিক মেনেজরিতে নামকরণের বিতরণে সর্বোত্তমভাবে হয়।
নিক কক্স

22
আমি @ ব্যবহারকারীর সাথে একমত নই 292995951 প্রতিটি ভাল পাঠ্যের সংস্থায় আমি জানি যে আমি সাধারণ বিতরণটির মাঝারি এবং মোড আছে তা ভেবে পুরোপুরি খুশি। এবং এটি নিয়মিত বিতরণে ব্যাপকভাবে প্রযোজ্য, যদিও আমি সন্দেহ করি না যে প্যাথলজিকাল কাউন্টার-উদাহরণগুলি চিহ্নিত করা যেতে পারে।
নিক কক্স

4
সুনির্দিষ্ট বিশদের জন্য ধন্যবাদ, যা উভয় পক্ষেই যোগ্যতা দেখায়, তবে আমি আপনার উভয়কেই গ্রেড দিচ্ছি না। যাইহোক, আমি আপনার অধ্যাপক দ্বারা ব্যবহৃত সমালোচনামূলক মানগুলি শব্দটি থেকে দৃ strongly়ভাবে অসন্তুষ্ট , কারণ স্কিউনেস এবং কুর্তোসিসের সীমা এর যে থাম্বের নিয়ম ব্যবহার করা যেতে পারে তার বাইরে আর কোনও অবস্থান নেই । আপনি ডেটা দিয়ে যা করছেন তার উপর নির্ভর করে একটি স্কিউনেস < 1 ডেটা রূপান্তর করতে ইচ্ছুক হয়ে যেতে পারে এবং > 1 এর স্কিউনেসটি ডেটা রেখে যাওয়ার সাথে যেতে পারে এবং একইভাবে কুর্তোসিসের জন্যও হতে পারে। ±1<1>1
নিক কক্স

6
যদি আমরা গুরুত্ব সহকারে নিটপিকিংয়ের শিল্পকে আলিঙ্গন করি তবে আমাদের অবশ্যই লক্ষ্য করা উচিত যে কোনও নেতিবাচক জলপ্রপাত নেই, এবং ফলসটি বিযুক্ত, সুতরাং বিতরণ ডি ফ্যাক্টোটি স্বাভাবিক হতে পারে না। এটি প্রথম স্থানে প্রশ্ন বাতিল করে দেয়। আরও গুরুতর নোটে, প্রশ্নটি স্পষ্টতই একটি মনগড়া উদাহরণ যা লক্ষ্য করে থাম্বের নির্দিষ্ট বিধিগুলি পরীক্ষা করা। বাস্তবে, আমাদের অধ্যয়নের উদ্দেশ্য অনুসারে, এটি একটি সাধারণ বিতরণ অনুমান করা যুক্তিসঙ্গত বা নাও হতে পারে। সত্যই আমরা কখনই জানতে পারি না, কারণ আমাদের কেবল একটি নমুনা রয়েছে।
আইওনিস

5
@ user2974951 আপনার প্রথম মন্তব্য মুছে ফেলার কথা বিবেচনা করা উচিত, যেহেতু আপনি এখন এটির সাথে একমত নন। এখনও পর্যন্ত এটি তিন পাঠককে বোকা বানিয়ে সিগন্যাল দেওয়ার জন্য তারা এতে সম্মত হয়েছে!
whuber

উত্তর:


25

প্রফেসরের সাথে আপনার আলোচনার সমস্যাটি হল একটি পরিভাষা, এটি একটি ভুল বোঝাবুঝি যা একটি সম্ভাব্য দরকারী ধারণা জানাতে চলেছে getting বিভিন্ন জায়গায়, আপনি উভয়ই ত্রুটি করেন।

সুতরাং সম্বোধন করার জন্য প্রথম জিনিস: বিতরণ কী তা সম্পর্কে সম্পূর্ণ পরিষ্কার হওয়া জরুরী ।

একটি সাধারণ বিতরণ একটি নির্দিষ্ট গাণিতিক অবজেক্ট, যা আপনি মূল্যবোধের অসীম জনসংখ্যার মডেল হিসাবে বিবেচনা করতে পারেন। (কোনও সীমাবদ্ধ জনগোষ্ঠীর আসলেই ধারাবাহিক বিতরণ থাকতে পারে না))

আলগাভাবে, এই বিতরণটি যা করে (একবার আপনি প্যারামিটারগুলি নির্দিষ্ট করে দিলে) তা সংজ্ঞায়িত করা হয় (একটি বীজগণিতিক অভিব্যক্তির মাধ্যমে) জনসংখ্যার মানগুলির অনুপাত যা আসল লাইনের কোনও নির্দিষ্ট ব্যবস্থের মধ্যে থাকে। কিছুটা কম looseিলে .ালা, এটি সম্ভাবনাটি সংজ্ঞায়িত করে যে সেই জনসংখ্যার একক মান যে কোনও নির্দিষ্ট বিরতিতে থাকবে।

একটি পর্যবেক্ষণ নমুনা সত্যিই একটি সাধারণ বিতরণ না; একটি নমুনা (সম্ভাব্য) একটি সাধারণ বিতরণ থেকে আঁকা হতে পারে, যদি একটি বিদ্যমান ছিল। আপনি যদি নমুনার ইমিরিকাল সিডিএফটি দেখেন তবে এটি পৃথক। যদি আপনি এটি বিন করেন (হিস্টগ্রামের মতো) নমুনায় একটি "ফ্রিকোয়েন্সি বিতরণ" থাকে তবে সেগুলি সাধারণ বিতরণ নয়। বিতরণ জনসংখ্যার এলোমেলো নমুনা সম্পর্কে কিছু জিনিস (সম্ভাব্য অর্থে) আমাদের বলতে পারে এবং একটি নমুনা আমাদের জনসংখ্যা সম্পর্কে কিছু জিনিসও বলতে পারে।

"সাধারণত বিতরণ করা নমুনা" * এর মতো একটি বাক্যাংশের যুক্তিসঙ্গত ব্যাখ্যা হ'ল "সাধারণত বিতরণ করা জনগোষ্ঠীর একটি এলোমেলো নমুনা"।

* (আমি সাধারণত এটি নিজেরাই এড়াতে চেষ্টা করি, যে কারণে এখানে আশাবাদী যথেষ্ট পরিস্কারভাবে ব্যাখ্যা করা হয়েছে; সাধারণত আমি নিজেকে দ্বিতীয় ধরণের মত প্রকাশের মধ্যে আবদ্ধ করে রাখি।)

সংজ্ঞায়িত শর্তাদি (এখনও যদি কিছুটা আলগাভাবে হয়), আসুন এখন প্রশ্নটি বিস্তারিতভাবে দেখি। আমি প্রশ্নের নির্দিষ্ট অংশে সম্বোধন করব।

সাধারণ বিতরণের একটির অবশ্যই গড় = মাঝারি = মোড থাকতে হবে

এটি অবশ্যই স্বাভাবিক সম্ভাব্যতা বিতরণের একটি শর্ত, যদিও একটি সাধারণ বিতরণ থেকে আঁকা কোনও নমুনার প্রয়োজন হয় না; নমুনাগুলি অসম্পৃক্ত হতে পারে, এর মাঝারি থেকে পৃথক হতে পারে ইত্যাদি। [তবে, নমুনাটি যদি সত্যিই একটি সাধারণ জনগোষ্ঠীর কাছ থেকে আসে তবে আমরা যুক্তিযুক্ত তাদের কাছ থেকে কতটা দূরে থাকতে পারি তা ধারণা পেতে পারি]]

সমস্ত ডেটা অবশ্যই বেল বক্ররেখার নীচে থাকা আবশ্যক

এই অর্থে "অন্তর্ভুক্ত" এর অর্থ কী তা আমি নিশ্চিত নই।

এবং পুরোপুরি গড় প্রায় প্রতিসাম্যপূর্ণ।

না; আপনি এখানে ডেটা সম্পর্কে কথা বলছেন , এবং একটি (স্পষ্টতই প্রতিসম) সাধারণ জনসংখ্যার একটি নমুনা নিজেই নিখুঁতভাবে প্রতিসম হয় না।

অতএব, প্রযুক্তিগতভাবে, বাস্তব গবেষণায় কার্যত কোনও সাধারণ বিতরণ নেই,

আমি আপনার উপসংহার সাথে একমত কিন্তু যুক্তি সঠিক নয়; এটি তথ্যের সঠিকভাবে প্রতিসাম্য (ইত্যাদি) নয় এর পরিণতি নয়; এটাই সত্য যে জনসংখ্যাগুলি নিজেরাই একেবারে স্বাভাবিক নয়

যদি স্কু / কুর্তোসিসটি 1.0 এর কম হয় তবে এটি একটি সাধারণ বিতরণ

তিনি যদি ঠিক সেভাবেই এটি বলেন তবে তিনি অবশ্যই ভুল।

একটি নমুনা স্নিগ্ধতা তার চেয়ে 0 এর কাছাকাছি হতে পারে (নিখুঁত পরিমাণের চেয়ে "কম" গ্রহণ করা প্রকৃত মান নয়), এবং নমুনা অতিরিক্ত কুর্তোসিসও তার চেয়ে 0 এর কাছাকাছি হতে পারে (তারা এমনকি, এমনকি সুযোগের দ্বারাও বা নির্মাণ, সম্ভাব্য প্রায় হুবহু শূন্য), এবং এখনও যে বিতরণ থেকে নমুনাটি আঁকানো হয়েছিল তা স্পষ্টভাবে অস্বাভাবিক হতে পারে।

আমরা আরও এগিয়ে যেতে পারি - এমনকি যদি আমরা জনসংখ্যার জঞ্জালতা এবং কুর্তোসিসটি সাধারণভাবে ঠিক জানতাম তবে এখনও এটি আমাদের জানায় না যে জনসংখ্যা স্বাভাবিক, এমনকি এমনকি সাধারণের কাছাকাছি কিছুও ছিল না।

52 টি নার্সিং হোমের র্যান্ডম স্যাম্পলিংয়ে ডেটাসেটটি মোট ঝরনা / বছরের সংখ্যা যা একটি বৃহত জনসংখ্যার এলোমেলো নমুনা।

গণনাগুলির জনসংখ্যা বিতরণ কখনই স্বাভাবিক হয় না । গণনাগুলি পৃথক এবং অ-নেতিবাচক, সাধারণ বিতরণ অবিচ্ছিন্ন এবং পুরো বাস্তব লাইনের ওপরে।

তবে আমরা এখানে সত্যিই ভুল বিষয়ে মনোনিবেশ করেছি। সম্ভাবনার মডেলগুলি কেবল এটিই, মডেলগুলি । আসুন আমরা আমাদের মডেলগুলিকে আসল জিনিসটির সাথে বিভ্রান্ত না করি ।

সমস্যাটি " ডেটাগুলি কি তারা সাধারণ থাকে?" (তারা হতে পারে না), এমনকি "এমন জনসংখ্যা যা থেকে ডেটাগুলি স্বাভাবিকভাবে আঁকানো হয়েছিল?" (এটি প্রায় কোনও ক্ষেত্রেই হবে না)।

আলোচনার জন্য আরও কার্যকর প্রশ্ন হ'ল "জনগণকে সাধারণভাবে বন্টন করা হিসাবে বিবেচনা করলে আমার অনুপাতটি কতটা খারাপ প্রভাবিত হবে?"

এটির উত্তম উত্তর দেওয়াও বেশ শক্ত প্রশ্ন এবং কয়েকটি সাধারণ ডায়াগনস্টিকগুলিতে নজর না দেওয়ার চেয়ে যথেষ্ট বেশি কাজের প্রয়োজন হতে পারে।

আপনি যে নমুনা পরিসংখ্যান দেখিয়েছেন তা স্বাভাবিকতার সাথে বিশেষভাবে বেমানান নয় (আপনি যদি সাধারণ জনসংখ্যার থেকে এই আকারের এলোমেলো নমুনা পেয়ে থাকেন তবে খুব কমই এটির "বা" খারাপ "এর মতো পরিসংখ্যান দেখতে পেতেন), তবে এর অর্থ এই নয় যে আসল জনসংখ্যা যা থেকে নমুনাটি আঁকা হয়েছিল তা কোনও নির্দিষ্ট উদ্দেশ্যে স্বয়ংক্রিয়ভাবে স্বাভাবিকের কাছে "যথেষ্ট পরিমাণে" পরিণত হয়। উদ্দেশ্যটি (আপনি কোন প্রশ্নের জবাব দিচ্ছেন) এবং এর জন্য নিযুক্ত পদ্ধতিগুলির দৃust়তা বিবেচনা করা গুরুত্বপূর্ণ হবে এবং তারপরেও আমরা এখনও নিশ্চিত হতে পারি না যে এটি "যথেষ্ট ভাল"; কখনও কখনও এটি অনুমান করা ভাল যে আমাদের কাছে প্রাইরি অনুমান করার উপযুক্ত কারণ নেই (যেমন, একইভাবে ডেটা সেটগুলির সাথে অভিজ্ঞতার ভিত্তিতে)।

এটি কোনও সাধারণ বিতরণ নয়

ডেটা - এমনকি একটি সাধারণ জনসংখ্যা থেকে আঁকা ডেটা - কখনও জনসংখ্যার বৈশিষ্ট্য হ'ল না; এই সংখ্যাগুলি থেকে একমাত্র আপনার কাছে এই সিদ্ধান্তে পৌঁছানোর ভাল ভিত্তি নেই যে এখানে জনসংখ্যা সাধারণ নয়।

অন্যদিকে, আমাদের কাছে এটিকে স্বাভাবিকের "যথেষ্ট কাছাকাছি" বলার কোনও যুক্তিসঙ্গত দৃ do় ভিত্তি নেই - আমরা এমনকি স্বাভাবিকতা ধরে নেওয়ার উদ্দেশ্যটিও বিবেচনা করি নি, তাই আমরা জানি না যে এটি কী বিতরণের বৈশিষ্ট্যগুলির প্রতি সংবেদনশীল হতে পারে।

উদাহরণস্বরূপ, যদি আমার কাছে পরিমাপিত একটি পরিমাপের জন্য দুটি নমুনা থাকত তবে আমি জানতাম যে ভারীভাবে বিচ্ছিন্ন হবে না (বেশিরভাগই কেবল কয়েকটি স্বতন্ত্র মান গ্রহণ করে না) এবং যুক্তিযুক্ত সংলগ্নের নিকটে, আমি দ্বি-নমুনা ব্যবহার করতে তুলনামূলকভাবে খুশি হতে পারি কিছু ছোট-না-ছোট নমুনা আকারে টি-পরীক্ষা; অনুমানগুলি থেকে হালকা বিচ্যুতি সামান্য শক্তিশালী (কিছুটা স্তর-দৃust়, এত শক্তিশালী নয়)। তবে স্প্রেডের সাম্যকে পরীক্ষা করার সময় আমি সাধারণভাবে স্বাভাবিকতা অনুমান করা সম্পর্কে যথেষ্ট সচেতন হতে পারি, উদাহরণস্বরূপ, কারণ যে অনুমানের অধীনে সেরা পরীক্ষাটি অনুমানের পক্ষে যথেষ্ট সংবেদনশীল।

যেহেতু এগুলি উভয়ই -1 এবং +1 এর সমালোচনামূলক মানগুলির মধ্যে রয়েছে তাই এই ডেটাটিকে সাধারণত বিতরণ করা হয় বলে মনে করা হয়। "

যদি এটি সত্যিকারের মাপদণ্ড হয় যার মাধ্যমে কেউ একটি সাধারণ বন্টনমূলক মডেল ব্যবহার করার সিদ্ধান্ত নেয়, তবে এটি কখনও কখনও আপনাকে বেশ দুর্বল বিশ্লেষণে নিয়ে যায়।

এই পরিসংখ্যানগুলির মানগুলি আমাদের সেই জনসংখ্যা সম্পর্কে কিছু সূত্র দেয় যা থেকে নমুনাটি আঁকা হয়েছিল, তবে এটি এমনটি নয় যে তাদের মানগুলি কোনওভাবেই কোনও বিশ্লেষণ চয়ন করার জন্য একটি 'নিরাপদ গাইড'।


এখন অন্তর্নিহিত সমস্যাটি যেমন আপনার প্রশ্নের মতো আরও একটি ভাল বর্ণযুক্ত সংস্করণ দিয়ে সমাধান করার জন্য:

কোনও মডেল বাছাই করতে কোনও নমুনা দেখার পুরো প্রক্রিয়াটি সমস্যায় ভরা - এটি করা আপনি যা দেখেছেন তার উপর নির্ভর করে বিশ্লেষণের পরবর্তী কোনও পছন্দগুলির বৈশিষ্ট্যগুলিকে পরিবর্তিত করে! উদাহরণস্বরূপ একটি অনুমানের পরীক্ষার জন্য, আপনার তাত্পর্য স্তর, পি-মান এবং শক্তি এগুলি যা আপনি বেছে নেবেন / গণনা করবেন তা নয় , কারণ সেই গণনাগুলি ডেটা ভিত্তিক না হয়ে বিশ্লেষণের উপর পূর্বাভাস দেওয়া হয়েছে।

উদাহরণস্বরূপ, গেলম্যান এবং লোকেন (২০১৪), " বিজ্ঞানের পরিসংখ্যান সংকট ," আমেরিকান সায়েন্টিস্ট , খণ্ড ১০২, সংখ্যা 4, পি ৪60০ (ডিওআই: 10.1511 / 2014.111.460) যা এই জাতীয় ডেটা নির্ভর নির্ভর বিশ্লেষণের সাথে বিষয়গুলি নিয়ে আলোচনা করে।


হাই পিটার, দুঃখিত আমি আপনার পোস্টটি সেখানে দেখিনি।
গ্লেন_বি -রিনস্টেট মনিকা


41

আপনি বিষয়টিটি মিস করছেন এবং সম্ভবত "কঠিন" হচ্ছেন যা শিল্পে প্রশংসিত নয়। তিনি আপনাকে একটি খেলনার উদাহরণ দেখিয়েছেন, কোনও ডেটা সেটের স্বাভাবিকতার মূল্যায়নে প্রশিক্ষণ দেওয়ার জন্য, যা ডেটা সেটটি কোনও সাধারণ বিতরণ থেকে আসে কিনা তা বলতে হয় । বিতরণ মুহুর্তের দিকে তাকানো স্বাভাবিকতা যাচাই করার একটি উপায়, যেমন জার্কো বেরা পরীক্ষা যেমন একটি মূল্যায়নের উপর ভিত্তি করে।

হ্যাঁ, সাধারণ বিতরণ নিখুঁতভাবে প্রতিসম হয়। তবে, আপনি যদি সত্যিকারের সাধারণ বিতরণ থেকে কোনও নমুনা আঁকেন, তবে সেই নমুনাটি সম্ভবত পুরোপুরি একসম্মত নয়। আপনি সম্পূর্ণ অনুপস্থিত এই পয়েন্ট। আপনি নিজে খুব সহজেই এটি পরীক্ষা করতে পারেন। গাউসীয় বিতরণ থেকে কেবল একটি নমুনা তৈরি করুন এবং এর মুহুর্তটি পরীক্ষা করুন। সত্য বিতরণ সত্ত্বেও এগুলি কখনই পুরোপুরি "স্বাভাবিক" হতে পারে না ।

এখানে একটি নির্বোধ পাইথনের উদাহরণ। আমি 100 এলোমেলো সংখ্যার 100 টি নমুনা তৈরি করছি, তারপরে তাদের মাধ্যম এবং মিডিয়ানগুলি প্রাপ্ত করছি। আমি প্রথম নমুনাটি মুদ্রণ করি তা দেখানোর জন্য যে গড় এবং মধ্যকটি আলাদা, তারপরে মাধ্যম এবং মধ্যমদের মধ্যে পার্থক্যের হিস্টোগ্রামটি দেখান। আপনি দেখতে পাচ্ছেন যে এটি বরং সংকীর্ণ, তবে পার্থক্যটি মূলত কখনই শূন্য নয়। নোট করুন, নম্বরগুলি সত্যিকার অর্থে একটি সাধারণ বিতরণ থেকে আসছে

কোড:

import numpy as np
import matplotlib.pyplot as plt

np.random.seed(1)
s = np.random.normal(0, 1, (100,100))
print('sample 0 mean:',np.mean(s[:,0]),'median:',np.median(s[:,0]))

plt.hist(np.mean(s,0)-np.median(s,0))
plt.show()
print('avg mean-median:',np.mean(np.mean(s,0)-np.median(s,0)))

আউটপুট: এখানে চিত্র বর্ণনা লিখুন

পুনশ্চ

এখন, আপনার প্রশ্ন থেকে উদাহরণটি স্বাভাবিক হিসাবে বিবেচনা করা উচিত বা না তা প্রসঙ্গে নির্ভর করে। আপনার শ্রেণিকক্ষে কী শেখানো হয়েছিল সে প্রসঙ্গে আপনি ভুল, কারণ আপনার প্রফেসর দেখতে চেয়েছিলেন যে তিনি আপনাকে যে থাম্ব টেস্ট দিয়েছেন তার নিয়ম জানেন কিনা, এটি হ'ল স্কু এবং অতিরিক্ত কুর্তোসিসটি -1 থেকে 1 এ হওয়া দরকার পরিসীমা।

আমি ব্যক্তিগতভাবে কখনও থাম্বের এই বিশেষ নিয়মটি ব্যবহার করি নি (আমি এটিকে পরীক্ষা বলতে পারি না), এমনকি এটিও জানত না যে এটি বিদ্যমান। স্পষ্টতই, কিছু ক্ষেত্রের কিছু লোক যদিও এটি ব্যবহার করে। আপনি যদি নিজের ডেটা সেট বর্ণনাকে জেবি পরীক্ষায় প্লাগ করতে থাকেন তবে এটি স্বাভাবিকতা প্রত্যাখাত হত । সুতরাং, ডেটা সেটটি অবশ্যই স্বাভাবিক নয় এমন পরামর্শ দেওয়ার জন্য আপনি ভুল নন, তবে আপনি এক অর্থে ভুল হয়ে গেছেন যে আপনি ক্লাসে যা শেখানো হয়েছে তার ভিত্তিতে আপনার কাছ থেকে প্রত্যাশিত নিয়মটি প্রয়োগ করতে ব্যর্থ হয়েছিলেন।

আমি যদি আপনি থাকতাম আমি বিনীতভাবে আপনার অধ্যাপকের কাছে গিয়ে নিজেকে ব্যাখ্যা করতাম, পাশাপাশি জেবি পরীক্ষার ফলাফলও দেখাতাম। আমি স্বীকার করতাম যে তার পরীক্ষার ভিত্তিতে আমার উত্তরটি অবশ্যই ভুল ছিল। আপনি যদি এখানে তর্ক করার মতো উপায় নিয়ে তার সাথে তর্ক করার চেষ্টা করেন তবে পরীক্ষায় পয়েন্টটি ফিরে পাওয়ার আপনার সম্ভাবনা খুব কম, কারণ আপনার যুক্তিটি মিডিয়ান এবং উপায় এবং নমুনাগুলি সম্পর্কে দুর্বল, এটি নমুনা বনাম জনসংখ্যার বোঝার অভাব দেখায়। আপনি যদি আপনার টিউনটি পরিবর্তন করেন তবে আপনার কেস হবে।


23
(+1) ঠিক বিন্দু the এলোমেলো পরিবর্তনশীল এবং সেই এলোমেলো পরিবর্তনশীল থেকে উপলব্ধির একটি নমুনা বিভ্রান্ত করা।
শি'আন

15
টি

এটা কি বলা উচিত যে যদি আপনার নমুনাগুলি নিখুঁতভাবে সাধারণভাবে বিতরণ করা হত তবে এটি নমুনাগুলি এলোমেলো নয় এমন প্রমাণের প্রমাণ?
জিমি জেমস

@ জিমি জেমস, 4 বছর আগে বিজ্ঞানের একটি গবেষণাপত্র ছিল যে দাবি করেছিল যে সমকামী ক্যানভাসারের সাথে 20 মিনিটের কথোপকথন সমকামী মানুষের প্রতি আপনার অনুভূতি বদলাতে পারে। দেখা যাচ্ছে যে লেখকরা তাদের সমীক্ষার ডেটা তৈরি করেছেন। তারা খুব অলস এবং নিখুঁতভাবে গাউসিয়ান আওয়াজ উত্পন্ন করেছিল এবং তারা কীভাবে ধরা পড়েছিল - ব্রুকম্যান এট আল
আকসাকালের

@ আকসাকাল আমি নিশ্চিত নই যে আমি যা জিজ্ঞাসা করছি ঠিক একই জিনিস এটিই। সেক্ষেত্রে আমি মনে করি সেই ক্ষেত্রে যুক্তিটি ছিল যে আসল ডেটা কখনই পুরোপুরি স্বাভাবিক হয় না। আমি আপনার বিবৃতি থেকে শুরু করছি "তবে, আপনি যদি সত্যিকারের সাধারণ বিতরণ থেকে কোনও নমুনা আঁকেন, তবে সেই নমুনাটি সম্ভবত পুরোপুরি প্রতিসাম্যযুক্ত হবে না।" আমি যদি নিখুঁত স্বাভাবিক বিতরণ থেকে এলোমেলোভাবে নমুনা নিই, তবে আমি আশা করব না যে প্রতিটি ক্রমাগত ডেটা পয়েন্ট ঠিক সেই জায়গায় পড়ে যাবে যেখানে এটি একটি নিখুঁত স্বাভাবিক বক্ররেখা পূরণ করা প্রয়োজন। এটি আমার কাছে অনেকটা একটি এলোমেলো নির্বাচন প্রক্রিয়ার মতো মনে হবে।
জিমি জেমস

6

শিক্ষক স্পষ্টত তার উপাদান থেকে দূরে, এবং সম্ভবত পরিসংখ্যান শেখানো উচিত নয়। একেবারে না শেখানোর চেয়ে ভুল কিছু শেখানো আমার কাছে খারাপ লাগে।

"ডেটা" এবং "ডেটা তৈরির প্রক্রিয়া যে ডেটা তৈরি করে" এর মধ্যে পার্থক্য আরও স্পষ্টভাবে তৈরি করা গেলে এই সমস্যাগুলি সহজেই সাফ হয়ে যায়। ডেটা প্রক্রিয়াটিকে লক্ষ্য করে যে ডেটা তৈরি করে। সাধারণ বিতরণ এই প্রক্রিয়াটির একটি মডেল।

তথ্যটি সাধারণত বিতরণ করা হয় কিনা সে বিষয়ে কথা বলার কোনও মানে হয় না। একটি কারণে ডেটা সর্বদা বিযুক্ত থাকে। অন্য কারণে, সাধারণ বিতরণ সম্ভাব্য পর্যবেক্ষণযোগ্য পরিমাণের একটি অসীম বর্ণনা করে, নির্দিষ্ট পর্যবেক্ষণের পরিমাণের একটি সীমাবদ্ধ সেট নয়।

তদ্ব্যতীত, প্রশ্নের উত্তর "হ'ল প্রক্রিয়া যা ডেটা একটি সাধারণভাবে বিতরণ প্রক্রিয়া তৈরি করে " ডেটা নির্বিশেষে সর্বদা "না," হয় is দুটি সহজ কারণ: (i) আমরা গ্রহণ করি এমন কোনও পরিমাপ অগত্যা পৃথক, কিছুটা গোল করে দেওয়া। (ii) নিখুঁত প্রতিসাম্য, যেমন একটি নিখুঁত বৃত্ত, পর্যবেক্ষণযোগ্য প্রকৃতির মধ্যে নেই। সর্বদা অপূর্ণতা রয়েছে।

সর্বোপরি, "এই ডেটা আপনাকে ডেটা তৈরির প্রক্রিয়াটির স্বাভাবিকতা সম্পর্কে কী বলে" এই প্রশ্নের উত্তর নিম্নরূপ দেওয়া যেতে পারে: "এই তথ্যগুলি আমরা কী দেখতে প্রত্যাশা করবো তার সাথে সামঞ্জস্যপূর্ণ, যদি ডেটা সত্যই কোনও তথ্য থেকে আসে? সাধারণত বিতরণ প্রক্রিয়া। " উত্তরটি সঠিকভাবে উপসংহারে আসে না যে বিতরণটি স্বাভাবিক।

সিমুলেশন ব্যবহার করে এই বিষয়গুলি খুব সহজেই বোঝা যায়। কেবলমাত্র একটি সাধারণ বিতরণ থেকে ডেটা অনুকরণ করুন এবং সেগুলি বিদ্যমান ডেটার সাথে তুলনা করুন। যদি ডেটা গণনা করা হয় (0,1,2,3, ...), তবে অবশ্যই স্বাভাবিক মডেলটি ভুল কারণ এটি 0,1,2,3, ... এর মতো সংখ্যা উত্পাদন করে না; পরিবর্তে, এটি দশমিকের সাথে সংখ্যা তৈরি করে যা চিরকাল চলে (বা কমপক্ষে কম্পিউটার যতটা অনুমতি দেবে)) স্বাভাবিকতা প্রশ্ন সম্পর্কে শেখার সময় এই জাতীয় সিমুলেশনটি আপনার প্রথম কাজ করা উচিত। তারপরে আপনি গ্রাফ এবং সংক্ষিপ্ত পরিসংখ্যান আরও সঠিকভাবে ব্যাখ্যা করতে পারেন।


10
আমি আপনার উত্তরটি হ্রাস করতে পারি নি তবে বিবেচনা করুন যে আপনি একজন শিক্ষার্থীর কথা থেকে গ্রেডের অধ্যাপক হিসাবে বিচার করছেন। একজন ছাত্র সঠিক এবং একজন শিক্ষক ভুল হওয়ার সম্ভাবনা কতটা? শিক্ষার্থী তার অধ্যাপক এবং কথোপকথনের প্রসঙ্গে ভুল উপস্থাপনা করছে এমনটি সম্ভবত বেশি নয় কি?
আকসকল

আমার অভিজ্ঞতা এবং শিক্ষার্থীদের শব্দের উপর ভিত্তি করে আমি বলব যে শিক্ষকের ভুল হওয়ার সম্ভাবনা বেশি। সামান্য আনুষ্ঠানিক প্রশিক্ষণ সহ এমন শিক্ষক রয়েছেন যা সর্বত্র বিশ্ববিদ্যালয়গুলিতে কোর্স, এমনকি গ্রেড কোর্স শেখায়। যদি স্বীকৃতিপ্রাপ্ত সংস্থাগুলি কেবল সত্য জানত!
পিটার ওয়েস্টফল

6
@ পসুম পাই, আমি অনুমান করতে পারি যে আপনার কাছ থেকে কী আশা করা যায়। এটি সম্ভবত পরিসংখ্যানের 101-ইশ কোর্স, সুতরাং আপনার স্কিউনেস এবং কুর্তোসিস দেখতে হবে। যদি তারা 0 এবং 3 এর কাছাকাছি না থাকে তবে আপনি বলবেন যে এটি সাধারণ নয়। এখানেই শেষ. আসলে জেবি পরীক্ষা আরও আনুষ্ঠানিক উপায়ে এটি করে। অনুশীলনের মূল বিষয়টি আপনার মনে রাখার জন্য যে গাউসিয়ান 0 এবং 3 কুর্তোসিসের স্কিউ পড়েছে You're আপনি এই নির্বোধ কিন্তু প্রয়োজনীয় অনুশীলনটিকে দার্শনিক আলোচনায় পরিণত করছেন।
আকসকাল

2
শিক্ষকের মন্তব্য "যেহেতু তারা উভয়ই -1 এবং +1 এর সমালোচনামূলক মানগুলির মধ্যে, তাই এই তথ্যটিকে সাধারণত বিতরণ করা হয়" এটি অবশ্যই দেখায় (i) বোঝার অভাব বা (ii) কোনটি / সে জানে তা শেখাতে আগ্রহী ভুল হবে. আমি মনে করি না যে শিক্ষকের প্রস্তুতি বা শিক্ষাগত পদ্ধতিগুলি প্রশ্নবিদ্ধ করার জন্য এটি দার্শনিক আলোচনা।
পিটার ওয়েস্টফল

3
"ধারাবাহিকতা" ভাষা ভাল। কিন্তু পসুম পাই হিসাবে উল্লেখ করা হয়েছে যে, শিক্ষকরা শিক্ষার্থীদের বলেন, "এই পরীক্ষা / ডায়াগনস্টিকের ভিত্তিতে ডেটা স্বাভাবিক থাকে", যা বেশ কয়েকটি বিবেচনায় ভুল। শিক্ষকদের (মনস্তাত্ত্বিক এবং অন্যথায়) ডেটা তৈরির প্রক্রিয়াটি ডেটা থেকে আলাদা করার প্রয়োজন, (ii) শিক্ষার্থীদের বলতে যে স্বাভাবিক এবং অন্যান্য মডেলগুলি ডেটা তৈরির প্রক্রিয়াটির মডেল, (iii) তাদের জানান যে সাধারণ বিতরণ সর্বদা থাকে একটি মডেল হিসাবে ভুল, নির্ণয় নির্বিশেষে, এবং (iv) তাদের বলুন যে অনুশীলনের মূল বিষয়টি হ'ল / না উত্তর নয়, সাধারণ-সাধারণের ডিগ্রী নির্ণয় করা। তারপরে কেন এটি গুরুত্বপূর্ণ তা ব্যাখ্যা করুন।
পিটার ওয়েস্টফল

4

আমি একজন প্রকৌশলী, তাই আমার পৃথিবীতে, প্রয়োগিত পরিসংখ্যানবিদ হ'ল যা আমি সর্বাধিক দেখি, এবং সর্বাধিক কংক্রিট মান পাই। আপনি যদি প্রয়োগে কাজ করতে যাচ্ছেন, তবে আপনাকে তত্ত্বের ওপরে দৃ practice়ভাবে অনুশীলনে জড়িত হতে হবে: এটি মার্জিত হোক বা না হোক, বিমানটি উড়তে হবে এবং ক্র্যাশ করতে হবে না।

আমি যখন এই প্রশ্নটি সম্পর্কে যাচ্ছি তখন এটি সম্পর্কে আমার মনে হয়, যেমন আমার বেশিরভাগ প্রযুক্তিবিদ এখানে করেছেন, "আওয়াজের উপস্থিতির সাথে এটি সত্যিকারের বিশ্বে কী দেখায়" তা নিয়ে ভাবনা।

আমি যে দ্বিতীয় জিনিসটি করি তা হ'ল প্রায়শই এমন একটি সিমুলেশন তৈরি করা যা আমাকে প্রশ্নের চারপাশে আমার হাত পেতে দেয়।

এখানে একটি খুব সংক্ষিপ্ত অনুসন্ধান:

#show how the mean and the median  differ with respect to sample size

#libraries
library(reshape2)
library(ggplot2)

#sample sizes
ssizes <- 10^(seq(from=1, to=3, by=0.25))
ssizes <- round(ssizes)

#loops per sample
n_loops <- 5000

#pre-declare, prep for loop
my_store <- matrix(0, 
                   ncol = 3, 
                   nrow = n_loops*length(ssizes))

count <- 1

for(i in 1:length(ssizes)){

  #how many samples
  n_samp <- ssizes[i]

  for(j in 1:n_loops){

    #draw samples
    y <- 0
    y <- rnorm(n = n_samp,mean = 0, sd = 1)

    #compute mean, median, mode
    my_store[count,1] <- n_samp
    my_store[count,2] <- median(y)
    my_store[count,3] <- mean(y)


    #update
    count = count + 1
  }
}


#make data into ggplot friendly form
df <- data.frame(my_store)
names(df) <- c("n_samp", "median","mean")

df <- melt(df, id.vars = 1, measure.vars = c("median","mean"))


#make ggplot
ggplot(df, aes(x=as.factor(n_samp), 
               y = value, 
               fill = variable)) + geom_boxplot() + 
  labs(title = "Contrast Median and Mean estimate variation vs. Sample Size",
       x = "Number of Samples",
       y = "Estimated value")

এটি এটিকে আউটপুট হিসাবে দেয়: এখানে চিত্র বর্ণনা লিখুন

দ্রষ্টব্য: এক্স-অক্ষ সম্পর্কে সতর্কতা অবলম্বন করুন, কারণ এটি লগ-স্কেলড, অভিন্ন-আকারযুক্ত নয়।

আমি জানি যে গড় এবং মিডিয়ান হুবহু এক। কোড এটি বলে। অভিজ্ঞতা অনুধাবন নমুনা আকারের জন্য অত্যন্ত সংবেদনশীল, এবং যদি সত্যই অসীম নমুনা না থাকে, তবে তারা কখনও তত্ত্বের সাথে পুরোপুরি মেলে না।

আপনি মধ্যমাতে অনিশ্চয়তা আনুমানিক গড় বা তার বিপরীতে velopাকা আছে তা সম্পর্কে ভাবতে পারেন। যদি গড়ের সর্বোত্তম অনুমানটি মধ্যমাটির পক্ষে অনুমানের 95% সিআই এর মধ্যে থাকে তবে ডেটা পার্থক্যটি বলতে পারে না। তথ্য বলছে তারা তাত্ত্বিকভাবে একই। আপনি যদি আরও ডেটা পান তবে দেখুন এটি কী বলে।


1
আকর্ষণীয় গ্রাফ। আমি ভাবতাম যে গড়টি আগে গড় গড়ের বাইরের লোকদের বিবেচনা করে মিডিয়েনের চেয়ে সাধারণত বড় হত ... অন্য কথায় লাল দণ্ডগুলি গড় এবং সবুজ রঙের মিডিয়ান হবে। আমি কী মিস করছি?
পসুম-পাই

1
@ পসুম-পাই মনে রাখবেন যে বিদেশী উভয় দিকই হতে পারে ... সাধারণ বিতরণে একটি বাম লেজ এবং ডান লেজ উভয়ই থাকে!
সিলভারফিশ

2
@ তবে এটি একটি বক্সপ্লটের একটি দুর্দান্ত মান বাস্তবায়ন।
গ্লেন_বি -রিনস্টেট মনিকা

1
@ গ্লেেন_বি আমি প্রচুর পাঠ্যপুস্তক দেখেছি যা বিদেশী ব্যক্তিদের জন্য বিন্দু ব্যবহার শেখায় না, তাই বুঝতে পারে যে কেউ তাদের ব্যবহৃত হচ্ছে না। তবে হ্যাডলির মতে , ১৯ 1970০ সালে টুকি তার "স্কিম্যাটিক প্লট" চালু করার সময়ও বিন্দুগুলি সেখানে ছিল।
সিলভারফিশ

1
হ্যাঁ, এতে অপ্রদর্শকবিহীন একটি সংস্করণ (কেবলমাত্র 5 সংখ্যার সংক্ষিপ্তসার ভিত্তিতে) মূলত মেরি স্পিয়ারের রেঞ্জ প্লট (1952) হবে। (এনবি সেই কাগজটি 1952 সালের পূর্বের কিছু গুরুত্বপূর্ণ
pতিহাসিক বক্সপ্লট

4

চিকিত্সা পরিসংখ্যানগুলিতে, আমরা কেবল কখনও বিতরণগুলির আকার এবং উপস্থিতি সম্পর্কে মন্তব্য করি। কোনও পৃথক সসীম নমুনা কখনই স্বাভাবিক হতে পারে তা অপ্রাসঙ্গিক এবং পেডেন্টিক। আমি আপনাকে এর জন্য ভুল চিহ্নিত করব।

যদি কোনও বিতরণ "বেশিরভাগ ক্ষেত্রে" স্বাভাবিক দেখায়, আমরা এটিকে সাধারণ বলা আরামদায়ক। আমি যখন কোনও অ-পরিসংখ্যান দর্শকের জন্য বিতরণগুলি বর্ণনা করি, তখন আমি প্রায় সাধারণ কিছু কল করতে খুব স্বাচ্ছন্দ্য বোধ করি এমনকি যখন আমি জানি যে সাধারণ বিতরণ অন্তর্নিহিত সম্ভাবনার মডেল নয়, তবে আমি বুঝতে পারি যে আমি এখানে আপনার শিক্ষকের সাথে থাকব ... তবে আমরা যাচাই করার জন্য কোনও হিস্টোগ্রাম বা ডেটাসেট নেই।

একটি টিপ হিসাবে, আমি নীচের নিরীক্ষণ খুব কাছাকাছি যেতে হবে:

  • কে বিদেশী, কত এবং তাদের মান কি?
  • ডেটা কি বিমোডাল?
  • উপাত্তগুলি কি একটি আঁকানো আকার নিয়েছে বলে মনে হচ্ছে যাতে কিছু রূপান্তর (লগের মতো) পর্যবেক্ষণের মধ্যে "দূরত্ব" আরও ভাল করে দেয়?
  • আসস বা ল্যাবগুলি নির্ভরযোগ্যভাবে মানগুলির একটি নির্দিষ্ট পরিসীমা সনাক্ত করতে ব্যর্থ হয় যাতে আপাতভাবে কাটা বা হিপিং হয়?

এটি এমন একটি গণিতের ক্ষেত্রে মনে হচ্ছে যে কোনও কিছুকে "সাধারণ বিতরণ" বলার মধ্যে কিছুটা কঠোর বক্তব্য রয়েছে যার মধ্যে কিছু কঠোর বক্তব্য রয়েছে, এবং এটি "প্রায় স্বাভাবিক" বলে। আমি কখনই বলিনি যে 1.932 2 হয় তবে আমি এটি প্রায় 2 বলে বলতে পারি
পসসুম পাই

1
"অপ্রাসঙ্গিক এবং পেডেন্টিক"? সিরিয়াসলি? আমি পসুম পাই এর সাথে একমত আমি এটাও কখনও বলব না যে 1.932 2.0 এর সমান। ডেটা "সাধারণ" বলে ডেটালটি উত্পাদনের প্রক্রিয়াটির একটি মডেল হিসাবে সাধারণ বিতরণের অর্থ থেকে শুরু করে সব কিছুকেই বিভ্রান্ত করে, আসল সত্যটি পর্যন্ত যে সাধারণ বিতরণগুলি কখনই আমাদের প্রক্রিয়াগুলিকে সুনির্দিষ্টভাবে মডেল করে না। প্রত্যেককে শেখানো উচিত যে যখন তারা সাধারণ বিতরণ শিখেন তাই তারা নির্বোধ বক্তব্য দেয় না।
পিটার ওয়েস্টফল

2
@ পিটারওয়েস্টফাল আমি মনে করি যে এখানে সমস্যার একটি অংশ হ'ল "ডেটা একটি সাধারণ বিতরণ থেকে আসে" প্রায় আক্ষরিক অর্থেই সত্য নয়, এমনকি যদি এটি সত্য হয় তবে এটি নির্ণয় করে প্রমাণ করাও অসম্ভব হবে। সুতরাং যেহেতু এই শব্দগুচ্ছটি কখনও আক্ষরিক অর্থেই সত্য হতে পারে, লোকেরা পরিবর্তে "ডেটা স্বাভাবিক হয়" ব্যবহার করার জন্য একটি সুবিধাজনক সংক্ষিপ্ত হাত হিসাবে "ব্যবহারিক উদ্দেশ্যগুলির জন্য ডেটাটিকে স্বাভাবিকতার কাছে যথেষ্ট মনে হয়" বা "সাধারণ বিতরণটি ভাল- আমাদের ডিজিপির জন্য যথেষ্ট মডেল "।
সিলভারফিশ

তাই সঠিকটি শেখানো যখন এত সহজ তখন ভুলটি কেন শেখাবেন?
পিটার ওয়েস্টফল

3
@ পিটারডাব্লু ভাষাগত বক্তব্যটি কেবলমাত্র শিক্ষার বিষয়ে নয়, এই শব্দগুচ্ছটি দৈনন্দিন জীবনে যেভাবে ব্যবহৃত হয় (এবং তা বোঝাতে চেয়েছিল) তার সম্পর্কে: "ডেটা স্বাভাবিক" এর অর্থ প্রায় কখনও ব্যবহৃত হয় না "আমি নিশ্চিত জানি যে যে জনসংখ্যার থেকে ডেটা নমুনা করা হয়েছিল তা স্বাভাবিক ", কারণ এটির পক্ষে এটি কখনও সম্ভবই হতে পারে। এটি খুব ভাল লাগবে যদি লোকেরা "ডেটা স্বাভাবিক বলে মনে হয় " বা "ডেটা স্বাভাবিক দেখায় " (যেমন স্বাভাবিকের কাছে যথেষ্ট বলে মনে হয় যে আমরা এর স্বাভাবিকতা থেকে বিচ্যুত হওয়ার বিষয়ে চিন্তা করি না) তবে বিশেষত একটি প্রয়োগকৃত সেটিংয়ে লোকেরা প্রায়শই বলবে যে জিনিস।
সিলভারফিশ

2

আমি মনে করি আপনি এবং আপনার অধ্যাপক বিভিন্ন প্রসঙ্গে কথা বলছেন। গড় = মধ্যমা = মোডের সমতা হ'ল তাত্ত্বিক বিতরণের বৈশিষ্ট্য এবং এটি কেবলমাত্র বৈশিষ্ট্য নয়। আপনি বলতে পারবেন না যে সম্পত্তি হোল্ডের উপরে যদি কোনও বিতরণের জন্য থাকে তবে বিতরণটি স্বাভাবিক। টি-বিতরণও প্রতিসম হয় তবে এটি স্বাভাবিক নয়। সুতরাং, আপনি সাধারণ বিতরণের তাত্ত্বিক বৈশিষ্ট্যগুলির বিষয়ে কথা বলছেন যা সাধারণ বিতরণের জন্য সর্বদা সত্য থাকে।

আপনি অধ্যাপক নমুনা ডেটা বিতরণের কথা বলছেন। তিনি ঠিক বলেছেন, আপনি বাস্তবে কখনও ডেটা পাবেন না, যেখানে আপনি অর্থ = মধ্যমা = মোড পাবেন। এই কেবল কারণে ত্রুটি স্যাম্পলিং । একইভাবে, এটি খুব কমই অসম্ভাব্য, আপনি নমুনা ডেটা এবং শূন্য অতিরিক্ত কুর্তোসিসের জন্য স্কিউনেস এর শূন্যগুণ পাবেন। আপনার অধ্যাপক নমুনা পরিসংখ্যান থেকে বিতরণ সম্পর্কে ধারণা পেতে আপনাকে কেবল সাধারণ নিয়ম দিচ্ছেন। যা সাধারণভাবে সত্য নয় (আরও তথ্য না পেয়ে)।


3
অধ্যাপককে ফেমি বলা হয়।
নিক কক্স

কেন আপনি গড় = মিডিয়ান = মোড পান না কারণ বেশিরভাগ বিতরণ সত্যিই স্কিউড হয়! (কঠোরভাবে বলতে
নিক কক্স

1
আমি দ্বিমত করি / গড় / মিডিয়ান / মোড = নমুনা ত্রুটির সমতার অভাব। ধরুন আপনি পতনের হারের জন্য 52 টি নার্সিং হোম এলোমেলোভাবে নমুনাযুক্ত করেছেন। 27, 34 এবং 52 টি বাড়ি দীর্ঘস্থায়ীভাবে স্বল্প-কর্মী এবং সর্বদা গড় ফলসের সংখ্যার উপরে থাকে। এই বাড়িগুলি পুশের দিকে ধাক্কা দেয় এবং একটি নমুনা ত্রুটির কারণে নয়।
পসসুম-পাই

1
@ পসুম পাই এখানে ডেটা কী তা এখানে গৌণ তবে আপনি বিভিন্ন জায়গায় বিভিন্ন সংকেত দিচ্ছেন। এখানে আপনি বেশ কয়েকটি নার্সিং হোমের কথা বলছেন - তবে আপনার প্রশ্নে আপনি "নার্সিংহোমে" বলেছেন। এমনকি ঘটনামূলক বিশদ সম্পর্কে অস্পষ্ট হওয়া কোনও উপকারে আসে না।
নিক কক্স

@ নিক কক্স দুঃখিত, আমি এটি পরিষ্কার করে দিয়েছি। 52 নার্সিং হোমের নমুনায় পতন / বছর সংখ্যা
পসসুম-পাই

1

ব্যবহারিক উদ্দেশ্যে, অন্তর্নিহিত প্রক্রিয়াগুলি যেমন এগুলি সাধারণত কোনও বিতরণ না করেই সাধারণ বিতরণে সূক্ষ্মভাবে প্রায় হয়।

তবে, আপনি যদি পেডেন্টিক হতে চান তবে এই ক্ষেত্রে অন্তর্নিহিত প্রক্রিয়াটি সাধারণত বিতরণ করা যায় না, কারণ এটি নেতিবাচক মানগুলি তৈরি করতে পারে না (ফলসের সংখ্যা নেতিবাচক হতে পারে না)। আমি অবাক হব না যদি এটি আসলে শূন্যের কাছাকাছি সময়ে কমপক্ষে একটি দ্বি-মডেল বিতরণ ছিল।


এটি 4 ফলস এবং 13 ফলসে মোড সহ বিমোডাল। এখানে শূন্যের কোনও খবরের খবর নেই।
পসুম পাই-
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.