পাইথন 2 এর জন্য নিম্নলিখিত পাইথন-স্ক্রিপ্টটি দেখুন।
উত্তর ডেভিড সি এর উত্তর দ্বারা অনুপ্রাণিত হয়।
আমার চূড়ান্ত উত্তরটি হ'ল, এক শ্রেণিতে কমপক্ষে পাঁচটি জ্যাকবকে খুঁজে পাওয়ার সম্ভাবনা, https://www.ssa.gov/oact/babynames/limits.html "জাতীয় ডেটা থেকে প্রাপ্ত তথ্য অনুসারে জ্যাকব সর্বাধিক সম্ভাব্য নাম "2006 থেকে।
সাফল্যের সম্ভাবনা হওয়ায় জ্যাকব-সম্ভাবনার দ্বিপদী বিতরণ অনুযায়ী সম্ভাবনা গণনা করা হয়।
import pandas as pd
from scipy.stats import binom
data = pd.read_csv(r"yob2006.txt", header=None, names=["Name", "Sex", "Count"])
# count of children in the dataset:
sumCount = data.Count.sum()
# do calculation for every name:
for i, row in data.iterrows():
# relative counts of each name being interpreted as probabily of occurrence
data.loc[i, "probability"] = data.loc[i, "Count"]/float(sumCount)
# Probabilites being five or more children with that name in a class of size n=25,50 or 100
data.loc[i, "atleast5_class25"] = 1 - binom.cdf(4,25,data.loc[i, "probability"])
data.loc[i, "atleast5_class50"] = 1 - binom.cdf(4,50,data.loc[i, "probability"])
data.loc[i, "atleast5_class100"] = 1 - binom.cdf(4,100,data.loc[i, "probability"])
maxP25 = data["atleast5_class25"].max()
maxP50 = data["atleast5_class50"].max()
maxP100 = data["atleast5_class100"].max()
print ("""Max. probability for at least five kids with same name out of 25: {:.2} for name {}"""
.format(maxP25, data.loc[data.atleast5_class25==maxP25,"Name"].values[0]))
print
print ("""Max. probability for at least five kids with same name out of 50: {:.2} for name {}, of course."""
.format(maxP50, data.loc[data.atleast5_class50==maxP50,"Name"].values[0]))
print
print ("""Max. probability for at least five kids with same name out of 100: {:.2} for name {}, of course."""
.format(maxP100, data.loc[data.atleast5_class100==maxP100,"Name"].values[0]))
সর্বোচ্চ। কমপক্ষে পাঁচটি বাচ্চার সম্ভাবনা হ'ল 25: 4.7e-07 এর মধ্যে জ্যাকব নামটির জন্য একই নাম রয়েছে
সর্বোচ্চ। কমপক্ষে ৫০ টির মধ্যে কমপক্ষে পাঁচটি বাচ্চার সম্ভাবনা: জ্যাকব নামটির জন্য অবশ্যই: 1.6e-05 অবশ্যই।
সর্বোচ্চ। কমপক্ষে ১০০ জনের মধ্যে একই নামের কমপক্ষে পাঁচটি বাচ্চার সম্ভাবনা: অবশ্যই জ্যাকব নামটির জন্য, অবশ্যই।
ডেভিড সি এর হিসাবে 10 একই ফলাফলের একটি ফ্যাক্টর দ্বারা। ধন্যবাদ। (আমার উত্তরটি সমস্ত নামের সমষ্টি করে না, এটি আলোচনা করা উচিত)