নমুনার আকার বৃদ্ধির সাথে কোন সেটিংসে আত্মবিশ্বাসের ব্যবধানগুলি আরও ভাল হবে না?


11

একটি ব্লগ পোস্টে , আমি দাবিটি পেয়েছি

"আমি বিশ্বাস করি যে ডাব্লুজি কোচরান প্রথম পয়েন্ট আউট (প্রায় ১৯′০ এর দশকে) যে একটি পর্যবেক্ষণমূলক সেটিংয়ে আত্মবিশ্বাসের ব্যবধানের সাথে ছোট ছোট নমুনার আকারের ফলে শূন্য কভারেজের কাছাকাছি পর্যাপ্ত পরিমাণে যথেষ্ট পরিমাণে নমুনা সরবরাহ করা ভাল কভারেজের ফলস্বরূপ!"

এখন আমি ধরে নিয়েছি যে সিআই প্রস্থের নমুনার আকার বাড়ার সাথে 0 এর কাছে পৌঁছানো উচিত, তবে কভারেজটি একই সাথে আরও খারাপ হতে পারে তা আমার পক্ষে বিশ্বাসযোগ্য নয়। এই দাবি কি সত্য এবং কোন পরিস্থিতিতে? নাকি আমি এটি ভুলভাবে লিখছি?

আমি 10000 থেকে 1000000 (এক-নমুনা টি-টেস্ট, 95% সিআই), প্রতিটি নমুনা আকারে 1000 রান সহ নমুনা আকারের সাথে এলোমেলোভাবে বিতরণ করা ডেটা ব্যবহার করে একটি সিমুলেশন চালিয়েছি এবং উচ্চতর নমুনার আকারের জন্য কভারেজ কোনও খারাপ হয়নি did (পরিবর্তে, আমি প্রত্যাশিত কাছাকাছি-ধ্রুবক ~ 5% ত্রুটি হারটি পেয়েছি)।


2
রেকর্ডের জন্য, এখানে উল্লিখিত বিখ্যাত পরিসংখ্যানবিদ ছিলেন উইলিয়াম জি। কোচরান (কোচরান নয়)।
নিক কক্স

2
কারণ এটি উত্তরের একটির মধ্যে কিছুটা বিভ্রান্তির সৃষ্টি করেছে, দয়া করে নোট করুন যে "সিআই প্রস্থ 1 এর নিকটবর্তী হওয়া উচিত" এই উক্তিটি অর্থহীন (1 কি? পরিমাপের এককগুলি কী?) বা কেবল সাধারণ ভুল।
whuber

উত্তর:


17

"একটি পর্যবেক্ষণ সেটিংয়ে" যোগ্যতাটি নোট করুন।

আপনি যে প্রসঙ্গটি থেকে উদ্ধৃতিটি নিয়েছেন (এটি যে মন্তব্যগুলির সাবট্র্যাডে রয়েছে) তা পরীক্ষা করে দেখে মনে হচ্ছে উদ্দেশ্যটি অনুকরণের পরিবর্তে "বাস্তব জগতে" রয়েছে এবং সম্ভবত এটি কোনও নিয়ন্ত্রিত পরীক্ষায় অন্তর্ভুক্ত নেই .. এবং সেক্ষেত্রে সম্ভাব্য অভিপ্রায় হ'ল এই ধারণাটির একটি পরিণতি যা অন্তর্ভুক্ত করা হয় এমন অনুমানগুলি আসলে যথেষ্ট ধারণ করে না। পক্ষপাতিত্বকে প্রভাবিত করতে পারে এমন অনেকগুলি জিনিস রয়েছে - যা ছোট নমুনাগুলির পরিবর্তনশীলতার সাথে তুলনা করে খুব কম প্রভাব ফেলে - তবে যা সাধারণত ত্রুটিগুলি করে নমুনার আকার বাড়ায় আকারে হ্রাস পায় না।

যেহেতু আমাদের গণনাগুলি পক্ষপাত সংযোজন করে না, অন্তরগুলি সঙ্কুচিত হওয়ায় ( ) যে কোনও অপরিবর্তনীয় পক্ষপাত, এমনকি যদি এটি খুব ছোট ছোট তাঁতী হয় তবে আমাদের অন্তরগুলি সত্যিকারের মান অন্তর্ভুক্ত করার সম্ভাবনা কম রাখে।1/n

নমুনার আকার বাড়ার সাথে সাথে সিআই কভারেজ সম্ভাব্যতা সঙ্কুচিত হওয়ার বিষয়ে আমি কী বোঝাতে চাইছি তা বোঝাতে - এখানে একটি চিত্র রয়েছে b

পক্ষপাত উপস্থিত থাকায় নমুনার আকার বাড়ার সাথে সাথে সিআই কভারেজের সম্ভাবনা সঙ্কুচিত হয়

অবশ্যই কোনও নির্দিষ্ট নমুনায়, বিরতি এলোমেলো হবে - এটি প্রশস্ত বা সংকীর্ণ হবে এবং ডায়াগ্রামের তুলনায় বাম বা ডানদিকে সরানো হবে, যাতে কোনও নমুনার আকারে এটি 0 থেকে 1 এর মধ্যে কিছু কভারেজ সম্ভাবনা থাকে তবে কোনও পরিমাণ পক্ষপাত এটি বাড়ার সাথে সাথে এটি শূন্যের দিকে সঙ্কুচিত করবে । সিমুলেটেড ডেটা ব্যবহার করে প্রতিটি নমুনা আকারে 100 টি আত্মবিশ্বাসের ব্যবধানের একটি উদাহরণ এখানে রয়েছে (স্বচ্ছতার সাথে চক্রান্ত করা হয়েছে, সুতরাং রঙ আরও বেশি শক্ত যেখানে আরও অন্তরগুলি এটি কভার করে):n

প্রতিটি এন এ 10 টি নমুনা সিআই সহ উপরে অনুরূপ প্লট


0

মিষ্টি বিড়ম্বনা। এই অনুচ্ছেদের আগে, একই ব্যক্তি বলেছিলেন যে "এত বিস্তৃত বিভ্রান্তি নেই"। "একটি পর্যবেক্ষণ বিন্যাসে আত্মবিশ্বাসের ব্যবধান": এর অর্থ কী?

আমার কাছে মনে হয় এটি আবার অনুমান এবং অনুমান পরীক্ষার মধ্যে একটি বিভ্রান্তি ।

এখন আমি জানি যে সিআই প্রস্থের বর্ধিত নমুনার আকারের সাথে 1 এর কাছে যাওয়া উচিত।

না, এটি প্রসঙ্গে নির্ভর করে। নীতিগতভাবে, প্রস্থটি রূপান্তর করা উচিত । বিপুল সংখ্যক মন্টি কার্লো সিমুলেশনগুলির জন্য কভারেজটি নামমাত্রের কাছাকাছি হওয়া উচিত। কভারেজটি নমুনা আকারের উপর নির্ভর করে না, যদি না সিআই নির্মিত হয়েছিল এমন কিছু অনুমান ত্রুটিযুক্ত না হয় (যা সম্ভবত ওপি বোঝাতে চেয়েছিল। "সমস্ত মডেলগুলি ভুল", হ্যাঁ।)0

রেফারেন্সটি একটি ব্যক্তিগত ব্লগের একটি পোস্টে একটি মন্তব্য । আমি এই ধরণের রেফারেন্সের বৈধতা সম্পর্কে খুব বেশি চিন্তা করব না। ল্যারি ওয়াসারম্যানের মালিকানাধীন ব্লগটি অন্যদিকে খুব ভালভাবে লেখা হয়েছে। এটি আমাকে এক্সকেসিডি কমিকের স্মরণ করিয়ে দিয়েছে:

http://xkcd.com/386/

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.