আমরা বায়েশিয়ান পরিসংখ্যান পরীক্ষার তদন্ত করছি, এবং একটি বিজোড় (আমার কাছে ন্যূনতম) কাছে আসি।
নিম্নলিখিত ক্ষেত্রে বিবেচনা করুন: কোন জনসংখ্যার A বা B উচ্চতর রূপান্তর হার রয়েছে তা পরিমাপ করতে আমরা আগ্রহী। স্যানিটি পরীক্ষা করার জন্য, আমরা সেট করেছি , যা উভয় গ্রুপে রূপান্তর হওয়ার সম্ভাবনা সমান। আমরা একটি দ্বিপদ মডেল, যেমন ব্যবহার কৃত্রিম ডেটা উৎপন্ন
তারপরে আমরা একটি বয়েসীয় বিটা-দ্বিপদী মডেল ব্যবহার করে অনুমান করার চেষ্টা করি যাতে আমরা প্রতিটি রূপান্তর হারের জন্য পোস্টারিয়র পাই, যেমন
আমাদের পরীক্ষার পরিসংখ্যানগুলি এস = পি ( পি এ > পি বি ) গণনা করে গণনা করা হয় মন্টি কার্লো হয়ে।
আমাকে কী আশ্চর্য করে তা হ'ল যদি তবে । আমার ধারণা ছিল যে এটি প্রায় 0.5 এর কেন্দ্রিক হবে এবং এমনকি নমুনার আকার, হিসাবে বৃদ্ধি পায় 0.5 তে রূপান্তরিত ।
আমার প্রশ্ন হচ্ছে, কেন যখন ?
এখানে কিছু পাইথন কোড প্রদর্শন করতে হবে:
%pylab
from scipy.stats import beta
import numpy as np
import pylab as P
a = b = 0.5
N = 10000
samples = [] #collects the values of S
for i in range(5000):
assert a==b
A = np.random.binomial(N, a); B = np.random.binomial(N, b)
S = (beta.rvs(A+1, N-A+1, size=15000) > beta.rvs(B+1, N-B+1, size=15000)).mean()
samples.append(S)
P.hist(samples)
P.show()
R