ওয়াই লোকের তালিকা থেকে এক্স লোকের এলোমেলোভাবে নির্বাচনের জন্য মি লোকের একটি তালিকা থেকে এন লোকদের সম্ভাবনা কত?


10

আমি যদি প্রতিস্থাপন ছাড়াই 363 জনের একটি পুল থেকে 232 জনকে বেছে নিচ্ছি তবে সেই নির্বাচনের 12 নির্দিষ্ট লোকের তালিকার 2 জনের সম্ভাবনা কী?

এটি একটি আল্ট্রা রেসের জন্য এলোমেলো ড্র যেখানে ২৩২ স্পটের জন্য ৩ ent৩ জন প্রবেশিকা ছিল। 12 জনের একটি নির্দিষ্ট গ্রুপের বিরুদ্ধে নির্বাচন পক্ষপাতদুষ্ট ছিল কিনা তা নিয়ে একটি তর্ক রয়েছে।

এটি গণনা করার ক্ষেত্রে আমার প্রাথমিক প্রচেষ্টাটি ছিল 232 টি বেছে বেছে 363 সম্ভাব্য নির্বাচন। বারোজনের তালিকা থেকে যে কোনও একটি ব্যক্তির সংমিশ্রণের সংখ্যা 1 বেছে নেওয়া 12 + 2 চয়ন 12 + ... + 11 চয়ন 12 + 12 চয়ন 12 এইভাবে 1 বেছে 12 + 2 চয়ন 12 .... / 232 বেছে 363 .এটি খুব কম সংখ্যক হিসাবে শেষ হয় যা পরিষ্কারভাবে খুব কম।

আমি কীভাবে এটি গণনা করব?


1
দুটি প্রযুক্তিগত বিষয়। প্রথমত, ফলাফলটি জানা হিসাবে আপনি এখন সম্ভাবনার চেয়ে বরং সম্ভাবনার সাথে কাজ করছেন। দ্বিতীয়ত, আপনার ফলস্বরূপ যে তাত্ত্বিক সম্ভাবনা রয়েছে তা বিবেচনাধীন নয়। আমি মনে করি নির্বাচনের জন্য ব্যবহৃত পদ্ধতির কাছে যাওয়া আরও ভাল হবে: নির্বাচনগুলি কীভাবে বাছাই করা হয়েছিল? আপনাকে পদ্ধতির যথার্থতা প্রমাণ করতে হবে, ফলাফলের নির্ভুলতা নয়।
মিশেল 21

1
নির্বাচনের সম্ভাবনাগুলি অনুমান করার উদ্দেশ্যে একে মিশেল নামে একটি সম্ভাবনা হিসাবে দেখবে। এখানে বিষয়টি দেখা যায় না।
whuber

হাইপারজেমেট্রিক আরভি-র সাধারণ গণনাটি ব্যবহার করার ক্ষেত্রে আপনাকে সতর্কতা অবলম্বন করা উচিত, যেহেতু যারা অভিযোগ করছেন তাদের 12 জন এলোমেলোভাবে নির্বাচন করা হয়নি। তারা অভিযোগ করা হচ্ছে না কারণ তারা নির্বাচিত হয়নি।
গাই

উত্তর:


10

আমি এই প্রশ্নের মতো ব্যাখ্যা করি : ধরুন নমুনাটি উদ্দেশ্যমূলকভাবে সম্পন্ন করা হয়েছিল যেন সাদা কাগজের টিকিট একটি জারে রাখা হয়েছিল, প্রতিটি ব্যক্তির নামের সাথে লেবেলযুক্ত এবং জারটির বিষয়বস্তুগুলি ভালভাবে নাড়াচাড়া করার পরে এলোমেলোভাবে নেওয়া হয়েছিল। আগে, টিকিট লাল রঙের ছিল। নির্বাচিত টিকিটের ঠিক দুটি টিকিট লাল হওয়ার কী সুযোগ রয়েছে? সর্বাধিক দুটি টিকিট লাল হওয়ার সুযোগ কী ?232 1236323212

একটি সঠিক সূত্র প্রাপ্ত করা যেতে পারে, তবে আমাদের এত তাত্ত্বিক কাজ করার দরকার নেই। পরিবর্তে, জার থেকে টিকিট টানা হওয়ায় আমরা কেবল সম্ভাবনাগুলি ট্র্যাক করি। এগুলির মধ্যে প্রত্যাহার করা হয়েছে, ঠিক সেই মুহুর্তে যে লাল টিকিট দেখা গেছে তা লেখা হোক । শুরু করতে, দয়া করে নোট করুন যদি (শুরু করার আগে আপনার কোনও লাল টিকিট পাওয়া যায় না) এবং (এটি নিশ্চিত যে আপনার কোনও লাল টিকিট নেই প্রারম্ভে). এখন, সাম্প্রতিকতম ড্রতে, হয় টিকিটটি লাল ছিল বা এটি ছিল না। প্রথম ক্ষেত্রে, আমরা এর আগে ঠিক দেখার সুযোগ পেয়েছিলামi পি ( i , এম ) পি ( i , 0 ) = 0 আই > 0 পি ( 0 , 0 ) = 1 পি ( i - 1 , মি - 1 ) i - 1 363 - মি + 1 আই ( 12 - আমি + 1 ) / ( 363 - মি + 1 )mip(i,m)p(i,0)=0i>0p(0,0)=1p(i1,m1)i1লাল টিকিট আমরা তখন অবশিষ্ট থেকে একটি লাল এক টান তারপর ঘটেছে টিকিট, উপার্জন এটা ঠিক টিকেট লাল এতদূর। যেহেতু আমরা ধরে নিচ্ছি যে সমস্ত টিকিটের প্রতিটি পর্যায়ে সমান সম্ভাবনা রয়েছে, তাই আমাদের এই ফ্যাশনে লাল অঙ্কনের সুযোগটি ছিল । অন্যান্য ক্ষেত্রে আমরা সুযোগ ছিল ঠিক পাওয়ার পূর্ববর্তী টিকিট লাল স্বপক্ষে, এবং সুযোগ না পরবর্তী ড্র ছিল নমুনা অন্য লাল টিকেট যোগ363m+1i(12i+1)/(363m+1)p(i,m1)im1(363m+112+i)/(363m+1)। যেহেতু, সম্ভাবনার প্রাথমিক অক্ষগুলি ব্যবহার করে (বুদ্ধিমানভাবে, দুটি পারস্পরিক একচেটিয়া ক্ষেত্রে যুক্ত হওয়ার সম্ভাবনা এবং শর্তযুক্ত সম্ভাবনা বহুগুণ),

p(i,m)=p(i1,m1)(12i+1)+p(i,m1)(363m+112+i)363m+1.

আমরা এবং জন্য এর মানগুলির একটি ত্রিভুজাকার অ্যারে রেখে পুনরাবৃত্তভাবে এই গণনার পুনরাবৃত্তি । অল্প গণনার পরে আমরা প্রশ্নের দুটি সংস্করণের উত্তর দিয়ে এবং । এগুলি হ'ল সংখ্যাসমূহ: আপনি এটিকে কীভাবে দেখেন না কেন এগুলি বেশ বিরল ঘটনা (এক হাজারের চেয়ে বিরল)।0 আমি 12 0 এম 232 পি ( 2 , 232 ) 0.000849884 পি ( 0 , 232 ) + পি ( 1 , 232 ) + পি ( 2 , 232 ) 0.000934314p(i,m)0i120m232p(2,232)0.000849884p(0,232)+p(1,232)+p(2,232)0.000934314

ডাবল-চেক হিসাবে, আমি কম্পিউটার সহ এই অনুশীলনটি 1,000,000 বার করেছিলাম। এই পরীক্ষাগুলির মধ্যে 932 = 0.000932 এ, 2 বা তারও কম লাল টিকিট পরিলক্ষিত হয়েছিল। এটি গণনার ফলাফলের খুব কাছাকাছি, কারণ 934.3 এর প্রত্যাশিত মানের নমুনা ওঠানামা প্রায় 30 (উপরে বা নীচে)। এখানে সিমুলেশনটি কীভাবে করা হয় তা এখানে:

> population <- c(rep(1,12), rep(0, 363-12)) # 1 is a "red" indicator
> results <- replicate(10^6, 
             sum(sample(population, 232)))   # Count the reds in 10^6 trials
> sum(results <= 2)                          # How many trials had 2 or fewer reds?
[1] 948

এবার, কারণ পরীক্ষাগুলি এলোমেলো, ফলাফল কিছুটা পরিবর্তিত হয়েছিল: মিলিয়ন ট্রায়ালের 948 টিতে দুটি বা কম লাল টিকিট দেখা গেছে। এটি এখনও তাত্ত্বিক ফলাফলের সাথে সামঞ্জস্যপূর্ণ))

উপসংহারটি হল যে 232 টিকিটের মধ্যে দু'একটি বা তারও কম লাল হবে highly আপনার যদি সত্যই 363 জনের 232 জন নমুনা থাকে তবে এই ফলাফলটি দৃ a় ইঙ্গিত দেয় যে টিকিট-ইন-এ-জার মডেলটি কীভাবে নমুনাটি প্রাপ্ত হয়েছিল তার সঠিক বিবরণ নয়বিকল্প ব্যাখ্যায় অন্তর্ভুক্ত রয়েছে: (ক) লাল টিকিটগুলি জার থেকে নেওয়া তাদের পক্ষে আরও কঠিন করা হয়েছিল (তাদের বিরুদ্ধে "পক্ষপাত") পাশাপাশি (খ) নমুনাটি পর্যবেক্ষণের পরে টিকিটগুলি রঙিন করা হয়েছিল ( পোস্ট-হক তথ্য স্নুপিং, যা করে কোনও পক্ষপাতিত্ব নির্দেশ না )।

পদক্ষেপে ব্যাখ্যা (খ) এর উদাহরণ হ'ল কুখ্যাত খুনের বিচারের জন্য একটি জুরি পুল। মনে করুন এটিতে ৩3৩ জন অন্তর্ভুক্ত রয়েছে। এই পুলের বাইরে আদালত তাদের 232 জনের সাক্ষাত্কার নিয়েছিল। একটি উচ্চাভিলাষী সংবাদপত্রের প্রতিবেদক পুলের প্রত্যেকের জীবনকে সাবধানতার সাথে পর্যালোচনা করেছেন এবং লক্ষ্য করেছেন যে ৩3৩ জনর মধ্যে ১২ জন সোনার ফিশ ফ্যানসিয়ার ছিলেন, তবে তাদের মধ্যে মাত্র দু'জনের সাক্ষাত্কার নেওয়া হয়েছিল। আদালত কি সোনার ফিশের অনুরাগীদের বিরুদ্ধে পক্ষপাতদুষ্ট? সম্ভবত না.


এনবি সিমুলেশনটিতে, এটি কোনও গুরুত্বপূর্ণ নয় যে এটি প্রথম প্রথম 12 "টিকিট" চিহ্নিত রয়েছে, কারণ সমস্ত নমুনা প্রতিস্থাপন (মাধ্যমে sample) ছাড়াই এলোমেলোভাবে সঞ্চালিত হয় । ফলস্বরূপ, প্রতিটি পুনরাবৃত্তিতে sampleটিকিটগুলি যখন একবার বলা হয় তখন তার মধ্যে এটির 232 প্রত্যাহার করার আগে পুরোপুরি টিকিটগুলি মিশ্রিত করে।
whuber

2
ধার্মিকতা - এটি আসলে আমার প্রত্যাশিত ফলাফল ছিল না। আপনার পুরো কাজ এবং ভাল ব্যাখ্যার জন্য আপনাকে ধন্যবাদ। (কৌতূহলীভাবে, আমি আকল্যান্ড ইউনিভার্সিটিতে যেখানে প্রথমে আর-এর প্রথম বিকাশ হয়েছিল সেখানে কিছু পরিসংখ্যান প্রশিক্ষণ দিয়েছিলাম)
সার্জে

10

@ হুবার একটি বিস্তৃত ব্যাখ্যা দিয়েছিল, আমি কেবল এটিই উল্লেখ করতে চাই যে এই দৃশ্যের সাথে মিল রেখে একটি স্ট্যাটিস্টিকাল বিতরণ রয়েছে: হাইপারজমেট্রিক বিতরণ। সুতরাং আপনি সরাসরি এ জাতীয় কোনও সম্ভাবনা অর্জন করতে পারেন, বলুন, আর:

নির্বাচিত 12 টির মধ্যে ঠিক 2 এর সম্ভাবনা:

   > dhyper(2, 12, 363-12, 232)
   [1] 0.0008498838

নির্বাচিত 12 টির মধ্যে 2 বা তারও কম সম্ভাব্যতা:

   > phyper(2, 12, 363-12, 232)
   [1] 0.000934314

+1 ধন্যবাদ আমার এই সংযোগটি উল্লেখ করা উচিত ছিল। হাইপারজমেট্রিক বিতরণ ক্লাসিকভাবে নমুনা-পুনরায় মডেলিং পরীক্ষায় প্রদর্শিত হয় in 12 নির্দিষ্ট ব্যক্তি (আমার "লাল টিকিট") এমন মাছের মতো যা ধরা পড়েছে, চিহ্নিত হয়েছে এবং তাকে পুলের মধ্যে ফেলে দেওয়া হয়েছে; ২৩২ এর নমুনাটি মাছের সেটের মতো যা পরে ধরা পড়ে। হাইপারজমেট্রিক বিতরণ পুনর্গ্রহণকৃত মাছের ফ্রিকোয়েন্সি বর্ণনা করে।
whuber

0

প্রতিক্রিয়াগুলি সাধারণ হাইপারজিওমেট্রিক বিতরণের সাথে গণনার চেয়ে অনেক বেশি, কারণ গ্রুপটি এলোমেলোভাবে বাছাই করা হয় না ( "12 টি মাছ আঁকার আগে লাল রঙ করা হয়" )।

প্রশ্নের বর্ণনা থেকে, আমরা ড্রতে জালিয়াতির জন্য পরীক্ষা করছি। 12 জনের একটি নির্দিষ্ট গ্রুপ অভিযোগ করেছে যে তাদের মধ্যে কেবল 2 জনকে বেছে নেওয়া হয়েছে, যখন প্রত্যাশিত সংখ্যা 232/363 ~ 2/3 = 8 ছিল।

আমাদের যা সত্যই গণনা করা দরকার তা হ'ল প্রতিক্রিয়াগুলি কী যে " 12 মাপের কোনও গ্রুপের মধ্যে কেবল 2 জন সদস্য নির্বাচিত হবে না"। কমপক্ষে একটি গোষ্ঠীতে 2 বা তারও কম সংখ্যক (যে কারণে ড্রয়ের ন্যায্যতার বিরুদ্ধে অভিযোগ করবে) তার প্রতিক্রিয়া অনেক বেশি।

আমি যখন এই সিমুলেশনটি চালনা করি এবং 30 (= 360/12) টির মধ্যে কোনওটিই 2 বা তার চেয়ে কম নির্বাচন না করে কতটি পরীক্ষার পরীক্ষা করে দেখি, আমি প্রায় 2.3% বার পাই । 1:42 কম তবে অসম্ভব।

আপনার এখনও ড্রয়ের পদ্ধতিটি পরীক্ষা করা উচিত কারণ এটি কোনও নির্দিষ্ট গোষ্ঠীর বিরুদ্ধে পক্ষপাতদুষ্ট হতে পারে। তারা সম্ভবত একত্রিত হয়ে কম সম্ভাবনার (প্রথম বা শেষ সংখ্যা, উদাহরণস্বরূপ), বা ড্রয়ের পদ্ধতির উপর নির্ভরশীল ভেরিয়েবলের সাথে অনেকগুলি অঙ্কন করেছিল। তবে যদি আপনি পদ্ধতিটিতে কোনও ত্রুটি না খুঁজে পান তবে আপনি 1:42 মতভেদে ফিরে আসতে পারেন যে এটি গ্রুপের জন্য কেবল খারাপ ভাগ্য।


একটি ভাল কথা, তবে (ক) অবশ্যই 12 এর প্রতিটি সম্ভাব্য গোষ্ঠীর পদার্থের সাথে যথেষ্ট মিল নেই এবং (খ) পদার্থের সাথে পর্যাপ্ত মিল রয়েছে এমন সমস্ত গ্রুপের সঠিক 12 সদস্য নেই।
zbcyclist

@ জাইসাইক্লিস্ট, আমি দাবি করি না যে গণনাটি সঠিক। আমি একটি যুক্তিসঙ্গত সন্দেহ দিতে চেয়েছিলাম (যেহেতু আমরা জালিয়াতি সনাক্তকরণের সাথে আইনের রাজ্যে আছি), যে ড্রটি দোষী নয়।
গাই
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.