জন্মদিনের প্রশ্নের আসল উত্তর কী?


13

"একই জন্মদিনে কমপক্ষে 50% লোকের দু'জনকে খুঁজে পাওয়ার সম্ভাবনা তৈরি করার জন্য একটি শ্রেণীর কত বড় হতে হবে?"

ফেসবুকে আমার ৩ friends০ জন বন্ধু রয়েছে এবং প্রত্যাশামতো তাদের জন্মদিনের বিতরণ মোটেও একরকম নয়। আমার একদিনের সাথে একই জন্মদিনের 9 জন বন্ধু রয়েছে। (বড় ছুটির দিন এবং ভ্যালেন্টাইনস দিবস 9 মাস পরে বড় মনে হয়, হ্যাঁ ..) সুতরাং, জন্মদিনের জন্য কিছু দিন বেশি হওয়ার সম্ভাবনা থাকে, আমি ধরে নিচ্ছি যে 23 এর সংখ্যাটি একটি উচ্চমানের is

এই সমস্যার আরও ভাল অনুমান করা হয়েছে?


3
৩ persons০ জন ব্যক্তির একটি নমুনা বছরের ৩ 360৫ দিনের বেশি জন্মদিন বিতরণের জন্য একটি বড় নমুনা তৈরি করে না ... আপনি অবশ্যই এত ছোট নমুনার তুলনায় অভিন্নতার জন্য যাচাই করতে পারবেন না।
শি'য়ান

কোনও ব্যক্তির জন্মদিন থাকে, দ্বিতীয় ব্যক্তি একই জন্মদিনটি ভাগ করে না এমন কোন অসুবিধাগুলি রয়েছে? 364/365, কোনও তৃতীয় ব্যক্তি জন্মদিনে ভাগ না করে এমন কী প্রতিক্রিয়া রয়েছে? (364/365) * (363/365)। আপনার সম্ভাবনা না পাওয়া পর্যন্ত এটিকে প্রসারিত করুন < 50%। এটা তোলে মতভেদ মানে হবে কেউ একই জন্মদিন, যা গড় যে অন্তত দুই একটি জন্মদিন ভাগ করার জন্য মতভেদ হবে আবর্তিত হবে আছে > 50%
zzzzBov

8
আমরা কি ধরে নেব আপনার এলোমেলো বন্ধু আছে?
জেমস

1
1365

উত্তর:


18

ভাগ্যক্রমে কেউ সম্পর্কিত প্রশ্নের কিছুটা আলোচনার সাথে জন্মদিনের কিছু তথ্য পোস্ট করেছেন (এটি হল বিতরণ ইউনিফর্ম)। আমরা আপনার ব্যবহারের উত্তরটি আপাতদৃষ্টিতে 23 - তাত্ত্বিক উত্তরের মতো তা দেখানোর জন্য এটি এবং পুনরায় মডেলিং ব্যবহার করতে পারি ।

> x <- read.table("bdata.txt", header=T)
> birthday <- data.frame(date=as.factor(x$date), count=x$count)
> summary(birthday) 
      date         count     
 101    :  1   Min.   : 325  
 102    :  1   1st Qu.:1266  
 103    :  1   Median :1310  
 104    :  1   Mean   :1314  
 105    :  1   3rd Qu.:1362  
 106    :  1   Max.   :1559  
 (Other):360                 
> results <- rep(0,50)
> reps <-2000 # big number needed as there is some instability otherwise
> for (i in 1:50)
+ {
+ count <- 0
+ for (j in 1:reps)
+ {
+ samp <- sample(birthday$date, i, replace=T, prob=birthday$count)
+ count <- count + 1*(max(table(samp))>1)
+ }
+ results[i] <- count/reps
+ }
> results
 [1] 0.0000 0.0045 0.0095 0.0220 0.0210 0.0395 0.0570 0.0835 0.0890 0.1165
[11] 0.1480 0.1770 0.1955 0.2265 0.2490 0.2735 0.3105 0.3350 0.3910 0.4165
[21] 0.4690 0.4560 0.5210 0.5310 0.5745 0.5975 0.6240 0.6430 0.6950 0.7015
[31] 0.7285 0.7510 0.7690 0.8025 0.8225 0.8280 0.8525 0.8645 0.8685 0.8830
[41] 0.8965 0.9020 0.9240 0.9435 0.9350 0.9465 0.9545 0.9655 0.9600 0.9665

8
প্রকৃতপক্ষে, কেউ শুর সংক্ষিপ্ততার মাধ্যমে দেখিয়ে দিতে পারে যে জন্মদিনের কোনও অযৌক্তিক বিতরণের জন্য, ম্যাচের সম্ভাবনা কমপক্ষে ইউনিফর্মের ক্ষেত্রে যতটা দুর্দান্ত। এটি জে মাইকেল স্টিলের ১৩. Ex অনুশীলন , দ্য কাচি-শোয়ার্জ মাস্টার ক্লাস: আর্ট অফ ম্যাথমেটিকাল ইনকোয়ালিটিসের একটি ভূমিকা , কেমব্রিজ ইউনিভার্সিটি প্রেস, ২০০৪, পৃষ্ঠা। 206
কার্ডিনাল

2
@ শিয়ান: আসলেই। এখন, আমি যদি কেবল এমন কাউকেই জানতাম যিনি উচ্চমানের, উচ্চ-পাঠকসংখ্যার পরিসংখ্যান ম্যাগাজিনের জন্য পর্যালোচনা করেছেন, তবে আমি পরামর্শ দিচ্ছি যে তারা এটি পরিসংখ্যানবিদদের আরও উচ্চতর দৃশ্যমান করার জন্য এটি পর্যালোচনা করবে ... তবে কোথায় এমন ব্যক্তির সন্ধান করা যায় ...
কার্ডিনাল

3
(যারা আমার অবিলম্বে পূর্ববর্তী মন্তব্য সম্পর্কে হতাশ হতে পারে, এটি আসলে @ সিয়ান নবনিযুক্ত যে রেফারেন্স জন্য বই সমালোচক সম্ভাবনা ।)
অঙ্কবাচক

2
@ সিয়ান, এই চেক আউট এবং দেখুন আপনি কি মনে করেন: table(replicate(10^5, max(tabulate(sample(1:365,360,rep=TRUE)))))
whuber

3
এটি সম্ভবত স্পষ্ট নয়, আর কোগনোসেন্টি ব্যতীত, @ জিয়ান এবং আমার নিজের দ্বারা পূর্ববর্তী মন্তব্যে কোডটি ওপির পরিস্থিতি অনুকরণ করে। এটি চালিয়ে যায় যে অভিন্ন বিতরণ করা জনগোষ্ঠীর মধ্যে এলোমেলোভাবে নির্বাচিত 360 টির মধ্যে 9 বা ততোধিক লোক জন্মদিন ভাগ করে নেওয়ার সুযোগটি 100,000 এর মধ্যে প্রায় 40 জন is ভাগ করা জন্মদিনের সর্বাধিক সংখ্যার জন্য সর্বাধিক সম্ভাব্য মান হ'ল 5
শুশ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.