আমিও বুটস্ট্র্যাপিং এবং বয়েসের উপপাদ্য উভয়ের দ্বারা প্রলুব্ধ হয়েছি, তবে আমি বায়েশিয়ার দৃষ্টিকোণ থেকে না তাকানো পর্যন্ত বুটস্ট্র্যাপিংয়ের ন্যায্যতার বিষয়ে খুব একটা ধারণা করতে পারি না। তারপরে - যেমন আমি নীচে ব্যাখ্যা করছি - বুটস্ট্র্যাপ বিতরণটি একটি বয়েসিয়ান উত্তরোত্তর বিতরণ হিসাবে দেখা যেতে পারে, যা বুটস্ট্র্যাপিংয়ের পিছনে (ক?) যুক্তিটি সুস্পষ্ট করে তোলে এবং অনুমানগুলি স্পষ্ট করার সুবিধাও ছিল। Https://arxiv.org/abs/1803.06214 (পৃষ্ঠা 22-26) এ নীচে যুক্তি এবং অনুমানগুলি সম্পর্কে আরও বিশদ রয়েছে ।
উদাহরণ হিসাবে, যা http://woodm.myweb.port.ac.uk/SL/resample.xlsx এ স্প্রেডশিটে সেট আপ করা হয়েছে (স্ক্রিনের নীচে বুটস্ট্র্যাপ ট্যাবে ক্লিক করুন), ধরুন আমরা পেয়েছি 60০ টির সাথে 9 টি পরিমাপের একটি নমুনা I আমি যখন এই নমুনাটি প্রতিস্থাপনের সাথে 1000 টি রেসপন্স তৈরি করতে স্প্রেডশিটটি ব্যবহার করেছি এবং এর মাধ্যমটি নিকটতম এমনকি সমান সংখ্যায় পেয়েছি, তখন এর মধ্যে 82 টির 54 টি ছিল boot বুটস্ট্র্যাপিংয়ের ধারণাটি হ'ল আমরা "নমুনা" জনগণের হিসাবে নমুনাটি 9 এর নমুনার মাধ্যমগুলি কতটা পরিবর্তনশীল হতে পারে তা দেখতে ব্যবহার করুন, সুতরাং এটি পরামর্শ দেয় যে কোনও নমুনার সম্ভাবনা জনসংখ্যার নীচে 6 হওয়ার মানে (এই ক্ষেত্রে এর উপর ভিত্তি করে ভান করা জনসংখ্যা 60 এর গড় সহ নমুনা) 8.2%। এবং আমরা রিস্যাম্পলিং হিস্টোগ্রামের অন্যান্য বারগুলি সম্পর্কে একইরকম সিদ্ধান্তে আসতে পারি।
এখন আসুন কল্পনা করুন যে সত্যটি সত্যিকারের জনসংখ্যার গড় গড় 66 is জন। যদি এটি হয় তবে আমাদের নমুনার সম্ভাবনাটি অনুমান করার অর্থ being০ (অর্থাত্ ডেটা) হওয়ার কথাটি ৮.২% (মনে রাখার উপরের অনুচ্ছেদে উপসংহারটি ব্যবহার করে) যে 66০ জন অনুমানিত জনসংখ্যার গড় 60 66 এর নিচে।। এর হিসাবে এটি লিখুন
পি (ডেটা প্রদত্ত গড় = 66) = 8.2%
এবং এই সম্ভাবনাটি পুনরায় মডেলিং বিতরণে একটি এক্স মানের 54 এর সাথে মিলে যায়। একই ধরণের আর্গুমেন্ট 0, 2, 4 ... 100 থেকে প্রতিটি সম্ভাব্য জনসংখ্যার ক্ষেত্রে প্রযোজ্য each
এবার বেয়েসের উপপাদ্য প্রয়োগ করা যাক। প্রশ্নের পরিমাপটি কেবল 0 এবং 100 এর মধ্যে মান গ্রহণ করতে পারে, সুতরাং জনসংখ্যার সম্ভাবনাগুলি 0, 2, 4, 6, .... 100 এর নিকটতম এমনকি সমান সংখ্যায় গোল করে। যদি আমরা ধরে নিই যে পূর্বের বিতরণটি সমতল, তবে এর প্রত্যেকটির পূর্ববর্তী সম্ভাব্যতা 2% (থেকে 1 ডিপি) হয়, এবং বেয়েসের উপপাদ্য আমাদের বলে যে
পি (পপমিয়ান = 66 প্রদত্ত ডেটা) = 8.2% * 2% / পি (ডেটা)
কোথায়
পি (ডেটা) = পি (পপমিয়ান = 0 প্রদত্ত ডেটা) * 2% + পি (পপমিয়ান = 2 প্রদত্ত ডেটা) * 2% + ... + পি (পপমিয়ান = 100 প্রদত্ত ডেটা) * 2%
আমরা এখন ২% কে বাতিল করতে পারি এবং মনে রাখতে পারি যে সম্ভাবনার যোগফলগুলি অবশ্যই 1 হওয়া উচিত কারণ সম্ভাবনাগুলি কেবল পুনরায় মডেলিং বিতরণ থেকে। যা আমাদের এই সিদ্ধান্তে পৌঁছে দেয়
পি (PopMean = 66) = 8.2%
মনে রাখবেন যে 8.2% হ'ল 54 টি (distribution 66 এর পরিবর্তে) পুনরায় মডেলিং বিতরণ থেকে সম্ভাবনা, উত্তরোত্তর বিতরণ কেবলমাত্র নমুনাটির মানে (60০) প্রতিফলিত পুনরায় মডেলিং বিতরণ। তদ্ব্যতীত, যদি পুনরায় মডেলিং বিতরণ এই অর্থে যে অসম্পূর্ণতাগুলি এলোমেলোভাবে হয় - যেমন এটি এবং অন্যান্য অনেক ক্ষেত্রে রয়েছে, আমরা পুনরায় নমুনা বিতরণকে উত্তরীয় সম্ভাবনার বন্টনের অনুরূপ হিসাবে নিতে পারি।
এই যুক্তিটি বিভিন্ন অনুমান করে, মূলটি হ'ল পূর্ব বিতরণটি অভিন্ন। এগুলি উপরোক্ত উদ্ধৃত নিবন্ধে আরও বিশদে বর্ণিত।