আমি এই প্রশ্নের মতো ব্যাখ্যা করি : ধরুন নমুনাটি উদ্দেশ্যমূলকভাবে সম্পন্ন করা হয়েছিল যেন সাদা কাগজের টিকিট একটি জারে রাখা হয়েছিল, প্রতিটি ব্যক্তির নামের সাথে লেবেলযুক্ত এবং জারটির বিষয়বস্তুগুলি ভালভাবে নাড়াচাড়া করার পরে এলোমেলোভাবে নেওয়া হয়েছিল। আগে, টিকিট লাল রঙের ছিল। নির্বাচিত টিকিটের ঠিক দুটি টিকিট লাল হওয়ার কী সুযোগ রয়েছে? সর্বাধিক দুটি টিকিট লাল হওয়ার সুযোগ কী ?232 1236323212
একটি সঠিক সূত্র প্রাপ্ত করা যেতে পারে, তবে আমাদের এত তাত্ত্বিক কাজ করার দরকার নেই। পরিবর্তে, জার থেকে টিকিট টানা হওয়ায় আমরা কেবল সম্ভাবনাগুলি ট্র্যাক করি। এগুলির মধ্যে প্রত্যাহার করা হয়েছে, ঠিক সেই মুহুর্তে যে লাল টিকিট দেখা গেছে তা লেখা হোক । শুরু করতে, দয়া করে নোট করুন যদি (শুরু করার আগে আপনার কোনও লাল টিকিট পাওয়া যায় না) এবং (এটি নিশ্চিত যে আপনার কোনও লাল টিকিট নেই প্রারম্ভে). এখন, সাম্প্রতিকতম ড্রতে, হয় টিকিটটি লাল ছিল বা এটি ছিল না। প্রথম ক্ষেত্রে, আমরা এর আগে ঠিক দেখার সুযোগ পেয়েছিলামi পি ( i , এম ) পি ( i , 0 ) = 0 আই > 0 পি ( 0 , 0 ) = 1 পি ( i - 1 , মি - 1 ) i - 1 363 - মি + 1 আই ( 12 - আমি + 1 ) / ( 363 - মি + 1 )মিআমিপি ( আমি , মি )p ( i , 0 ) = 0i > 0পি ( 0 , 0 ) = 1পি ( আমি - 1 , মি - 1 )i - 1লাল টিকিট আমরা তখন অবশিষ্ট থেকে একটি লাল এক টান তারপর ঘটেছে টিকিট, উপার্জন এটা ঠিক টিকেট লাল এতদূর। যেহেতু আমরা ধরে নিচ্ছি যে সমস্ত টিকিটের প্রতিটি পর্যায়ে সমান সম্ভাবনা রয়েছে, তাই আমাদের এই ফ্যাশনে লাল অঙ্কনের সুযোগটি ছিল । অন্যান্য ক্ষেত্রে আমরা সুযোগ ছিল ঠিক পাওয়ার পূর্ববর্তী টিকিট লাল স্বপক্ষে, এবং সুযোগ না পরবর্তী ড্র ছিল নমুনা অন্য লাল টিকেট যোগ363 - মি + 1আমি( 12 - আমি + 1 ) / ( 363 - মি + 1 )পি ( i , মি - 1 )আমিমি - 1( 363 - মি + 1 - 12 + i ) / ( 363 - মি + 1 )। যেহেতু, সম্ভাবনার প্রাথমিক অক্ষগুলি ব্যবহার করে (বুদ্ধিমানভাবে, দুটি পারস্পরিক একচেটিয়া ক্ষেত্রে যুক্ত হওয়ার সম্ভাবনা এবং শর্তযুক্ত সম্ভাবনা বহুগুণ),
পি ( আই , এম ) = পি ( আই - ১ , এম - ১ ) ( ১২ - আমি + ১ ) + পি ( আই , এম - ১ ) ( ৩3৩ - মি + ১ - ১২ + আই )363 - মি + 1।
আমরা এবং জন্য এর মানগুলির একটি ত্রিভুজাকার অ্যারে রেখে পুনরাবৃত্তভাবে এই গণনার পুনরাবৃত্তি । অল্প গণনার পরে আমরা প্রশ্নের দুটি সংস্করণের উত্তর দিয়ে এবং । এগুলি হ'ল সংখ্যাসমূহ: আপনি এটিকে কীভাবে দেখেন না কেন এগুলি বেশ বিরল ঘটনা (এক হাজারের চেয়ে বিরল)।0 ≤ আমি ≤ 12 0 ≤ এম ≤ 232 পি ( 2 , 232 ) ≈ 0.000849884 পি ( 0 , 232 ) + পি ( 1 , 232 ) + পি ( 2 , 232 ) ≈ 0.000934314পি ( আমি , মি )0≤i≤120≤m≤232p(2,232)≈0.000849884p(0,232)+p(1,232)+p(2,232)≈0.000934314
ডাবল-চেক হিসাবে, আমি কম্পিউটার সহ এই অনুশীলনটি 1,000,000 বার করেছিলাম। এই পরীক্ষাগুলির মধ্যে 932 = 0.000932 এ, 2 বা তারও কম লাল টিকিট পরিলক্ষিত হয়েছিল। এটি গণনার ফলাফলের খুব কাছাকাছি, কারণ 934.3 এর প্রত্যাশিত মানের নমুনা ওঠানামা প্রায় 30 (উপরে বা নীচে)। এখানে সিমুলেশনটি কীভাবে করা হয় তা এখানে:
> population <- c(rep(1,12), rep(0, 363-12)) # 1 is a "red" indicator
> results <- replicate(10^6,
sum(sample(population, 232))) # Count the reds in 10^6 trials
> sum(results <= 2) # How many trials had 2 or fewer reds?
[1] 948
এবার, কারণ পরীক্ষাগুলি এলোমেলো, ফলাফল কিছুটা পরিবর্তিত হয়েছিল: মিলিয়ন ট্রায়ালের 948 টিতে দুটি বা কম লাল টিকিট দেখা গেছে। এটি এখনও তাত্ত্বিক ফলাফলের সাথে সামঞ্জস্যপূর্ণ))
উপসংহারটি হল যে 232 টিকিটের মধ্যে দু'একটি বা তারও কম লাল হবে highly আপনার যদি সত্যই 363 জনের 232 জন নমুনা থাকে তবে এই ফলাফলটি দৃ a় ইঙ্গিত দেয় যে টিকিট-ইন-এ-জার মডেলটি কীভাবে নমুনাটি প্রাপ্ত হয়েছিল তার সঠিক বিবরণ নয় । বিকল্প ব্যাখ্যায় অন্তর্ভুক্ত রয়েছে: (ক) লাল টিকিটগুলি জার থেকে নেওয়া তাদের পক্ষে আরও কঠিন করা হয়েছিল (তাদের বিরুদ্ধে "পক্ষপাত") পাশাপাশি (খ) নমুনাটি পর্যবেক্ষণের পরে টিকিটগুলি রঙিন করা হয়েছিল ( পোস্ট-হক তথ্য স্নুপিং, যা করে কোনও পক্ষপাতিত্ব নির্দেশ না )।
পদক্ষেপে ব্যাখ্যা (খ) এর উদাহরণ হ'ল কুখ্যাত খুনের বিচারের জন্য একটি জুরি পুল। মনে করুন এটিতে ৩3৩ জন অন্তর্ভুক্ত রয়েছে। এই পুলের বাইরে আদালত তাদের 232 জনের সাক্ষাত্কার নিয়েছিল। একটি উচ্চাভিলাষী সংবাদপত্রের প্রতিবেদক পুলের প্রত্যেকের জীবনকে সাবধানতার সাথে পর্যালোচনা করেছেন এবং লক্ষ্য করেছেন যে ৩3৩ জনর মধ্যে ১২ জন সোনার ফিশ ফ্যানসিয়ার ছিলেন, তবে তাদের মধ্যে মাত্র দু'জনের সাক্ষাত্কার নেওয়া হয়েছিল। আদালত কি সোনার ফিশের অনুরাগীদের বিরুদ্ধে পক্ষপাতদুষ্ট? সম্ভবত না.