ঠিক আছে, এটি চেষ্টা করুন। আমি দুটি উত্তর দেব - বায়েশিয়ান একটি, যা আমার মতে সাধারণ এবং প্রাকৃতিক, এবং সম্ভাব্য ঘন ঘন ঘন ঘন একটি।
বায়েশিয়ান সমাধান
আমরা ধরে নিই উপর একটি বিটা পূর্বে , আমি, ই।, পৃ ~ বি ই টি একটি ( α , β ) , কারণ বিটা-বাইনমিয়াল মডেল অনুবন্ধী, যার মানে অবর বন্টন সাথে একটি বিটা বিতরণ হয় পরামিতি α = α + + ট , β = β + + N - ট , (আমি ব্যবহার করছি ট সফলতাগুলি সংখ্যা বোঝাতে এন বিচারের পরিবর্তে Y )। সুতরাং, অনুমান ব্যাপকভাবে সরল করা হয়। এখন, যদি এর সম্ভাব্য মানগুলি সম্পর্কে আপনার কিছু পূর্ব জ্ঞান থাকেপিp ∼ B e t a ( α , β))α^= Α + + ট , β^= β+ এন - কেটএনY , আপনি এটি ব্যবহার করতে পারে মান সেট করতে α এবং β , অর্থাত্, আগে নিজে থেকেই আপনার বিটা সংজ্ঞায়িত করতে, অন্যথায় আপনি পূর্বে, সঙ্গে একটি অভিন্ন অনুমান করা হতে পারে (noninformative) α = β = 1 , বা অন্যান্য noninformative গতকাল দেশের সর্বোচ্চ তাপমাত্রা (উদাহরণস্বরূপ দেখুনএখানে)। যাই হোক না কেন, আপনার উত্তরসূরি হয়পিαβα = β= 1
পিr ( p | n , k ) = বি ই টি এ ( α + কে , β) β+ এন - কে )
বায়েশিয়ান অনুমান অনুসারে, সমস্ত কিছু গুরুত্বপূর্ণ বিষয়গুলি উত্তরোত্তর সম্ভাবনা, যার অর্থ একবার আপনি যখন তা জানেন, আপনি আপনার মডেলটিতে অন্য সমস্ত পরিমাণের জন্য অনুসন্ধান তৈরি করতে পারেন। আপনি পর্যবেক্ষণযোগ্য উপর অনুমান করতে চান : বিশেষত, নতুন ফলাফলগুলির একটি ভেক্টরের উপর y = y 1 , … , y মি , যেখানে এম অগত্যা n এর সমান নয় । বিশেষ করে, প্রত্যেকের জন্য ঞ = 0 , ... , মি , আমরা ঠিক থাকার সম্ভাবনা গনা করতে চান ঞ পরবর্তী সফলতাগুলি মি বিচারের দেওয়া, যে আমরা পেয়েছিলাম টYy = y1, … , Yমিমিএনj = 0 , … , মিঞমিkপূর্ববর্তী পরীক্ষায় সাফল্য ; পূর্ববর্তী ভবিষ্যদ্বাণীপূর্ণ গণ ফাংশন:n
Pr(j|m,y)=Pr(j|m,n,k)=∫10Pr(j,p|m,n,k)dp=∫10Pr(j|p,m,n,k)Pr(p|n,k)dp
তবে, জন্য আমাদের দ্বিপদী মডেলটির অর্থ এই যে, শর্তসাপেক্ষে পি এর একটি নির্দিষ্ট মান রয়েছে, এম ট্রায়ালগুলিতে জে সাফল্য অর্জনের সম্ভাবনা অতীত ফলাফলের উপর নির্ভর করে না: এটি কেবল সহজYpjm
f(j|m,p)=(jm)pj(1−p)j
এভাবে অভিব্যক্তি হয়ে যায়
Pr(j|m,n,k)=∫10(jm)pj(1−p)jPr(p|n,k)dp=∫10(jm)pj(1−p)jBeta(α+k,β+n−k)dp
এই ইন্টিগ্রালের ফলাফলটি বিটা-বোনমিয়াল ডিস্ট্রিবিউশন নামে পরিচিত একটি সুপরিচিত বিতরণ: প্যাসেজগুলি এড়িয়ে যাওয়া, আমরা ভয়াবহ প্রকাশ পেয়েছি
Pr(j|m,n,k)=m!j!(m−j)!Γ(α+β+n)Γ(α+k)Γ(β+n−k)Γ(α+k+j)Γ(β+n+m−k−j)Γ(α+β+n+m)
চতুর্ভুজ ক্ষতির প্রদত্ত জন্য আমাদের পয়েন্ট আনুমানিকটি অবশ্যই এই বিতরণের অর্থ, অর্থাৎ,j
μ=m(α+k)(α+β+n)
এখন, একটি পূর্বাভাস অন্তর সন্ধান করুন। যেহেতু এটি একটি বিযুক্ত বন্টন, আমরা জন্য একটি বদ্ধ ফর্ম অভিব্যক্তি নেই , এই ধরনের যে পি দ ( ঞ 1 ≤ ঞ ≤ ঞ 2 ) = 0.95 । কারণটি হ'ল আপনি কোয়ান্টাইলকে কীভাবে সংজ্ঞায়িত করেন তার উপর নির্ভর করে, আলাদা বিতরণের জন্য কোয়ান্টাইল ফাংশন হয় কোনও ফাংশন নয় বা বিচ্ছিন্ন ফাংশন। তবে এটি কোনও বড় সমস্যা নয়: ছোট মিটারের জন্য , আপনি কেবল এম সম্ভাব্যতাগুলি লিখতে পারেন P r ( j = 0)[j1,j2]Pr(j1≤j≤j2)=0.95mm এবং এখান থেকে খুঁজে ঞ 1 , ঞ 2 যেমন যেPr(j=0|m,n,k),Pr(j≤1|m,n,k),…,Pr(j≤m−1|m,n,k)j1,j2
Pr(j1≤j≤j2)=Pr(j≤j2|m,n,k)−Pr(j<j1|m,n,k)≥0.95
অবশ্যই আপনি একাধিক দম্পতি খুঁজে পাবেন, তাই আপনি আদর্শভাবে সবচেয়ে ছোট জন্য সন্ধান করবেন যে উপরেরটি সন্তুষ্ট। মনে রাখবেন যে[j1,j2]
Pr(j=0|m,n,k)=p0,Pr(j≤1|m,n,k)=p1,…,Pr(j≤m−1|m,n,k)=pm−1
বিটা-বাইনোমিয়াল ডিস্ট্রিবিউশনের সিএমএফ (সংশ্লেষক গণ ফাংশন) এর মানগুলি এবং যেমন একটি বদ্ধ ফর্ম এক্সপ্রেশন রয়েছে , তবে এটি সাধারণীকরণের হাইপারজেমেট্রিক ফাংশনের ক্ষেত্রে এবং এটি বেশ জটিল। আমি কেবল আর প্যাকেজটি ইনস্টল করব extraDistr
এবং pbbinom
বিটা-বোনমিয়াল বিতরণের সিএমএফ গণনা করার জন্য কল করব to বিশেষত, যদি আপনি সমস্ত সম্ভাব্যতা একসাথে গতিতে চান তবে কেবল লিখুন:p0,…,pm−1
library(extraDistr)
jvec <- seq(0, m-1, by = 1)
probs <- pbbinom(jvec, m, alpha = alpha + k, beta = beta + n - k)
কোথায় alpha
এবং beta
আপনার বিটা পূর্বের পরামিতিগুলির মানগুলি হয়, অর্থাত্, এবং β (এইভাবে 1 যদি আপনি p এর আগে ইউনিফর্ম ব্যবহার করছেন )। অবশ্যই বিটা-বাইনোমিয়াল বিতরণের জন্য আর যদি কোয়ান্টাইল ফাংশন সরবরাহ করে তবে এটি সব থেকে সহজ হবে, তবে দুর্ভাগ্যক্রমে এটি হয় না।αβp
বায়েশিয়ান সমাধান সহ ব্যবহারিক উদাহরণ
আসুন , কে = 70 (এইভাবে আমরা প্রাথমিকভাবে 100 পরীক্ষায় 70 সাফল্য পর্যবেক্ষণ করেছি)। আমরা একটি বিন্দু অনুমান এবং চান একটি 95% -prediction ব্যবধান সফলতা সংখ্যার জন্য ঞ পাশের মি = 20 বিচারের। তারপরn=100k=70jm=20
n <- 100
k <- 70
m <- 20
alpha <- 1
beta <- 1
যেখানে আমি আগে ইউনিফর্ম গ্রহণ করেছি : আপনার নির্দিষ্ট প্রয়োগের পূর্বের জ্ঞানের উপর নির্ভর করে এটি ভাল প্রাক হতে পারে বা নাও হতে পারে। এইভাবেp
bayesian_point_estimate <- m * (alpha + k)/(alpha + beta + n) #13.92157
স্পষ্টতই জন্য একটি অ-পূর্ণসংখ্যার অনুমানটি কোনও অর্থবোধ করে না, তাই আমরা কেবল নিকটতম পূর্ণসংখ্যা (14) করতে পারি। তারপরে, পূর্বাভাস ব্যবধানের জন্য:j
jvec <- seq(0, m-1, by = 1)
library(extraDistr)
probabilities <- pbbinom(jvec, m, alpha = alpha + k, beta = beta + n - k)
সম্ভাবনাগুলি হ'ল
> probabilities
[1] 1.335244e-09 3.925617e-08 5.686014e-07 5.398876e-06
[5] 3.772061e-05 2.063557e-04 9.183707e-04 3.410423e-03
[9] 1.075618e-02 2.917888e-02 6.872028e-02 1.415124e-01
[13] 2.563000e-01 4.105894e-01 5.857286e-01 7.511380e-01
[17] 8.781487e-01 9.546188e-01 9.886056e-01 9.985556e-01
একটি সমান-লেজ সম্ভাব্যতা INTERVAL জন্য, আমরা ক্ষুদ্রতম চান যেমন যে পি দ ( ঞ ≤ ঞ 2 | মি , এন , ট ) ≥ 0,975 এবং বৃহত্তম ঞ 1 যেমন যে পি দ ( ঞ < ঞ 1 | মি , এন , ট ) = পি দ ( ঞ ≤ ঞ 1 - 1 | মি , এন , টj2Pr(j≤j2|m,n,k)≥0.975j1 । এইভাবে, আমাদের হবেPr(j<j1|m,n,k)=Pr(j≤j1−1|m,n,k)≤0.025
Pr(j1≤j≤j2|m,n,k)=Pr(j≤j2|m,n,k)−Pr(j<j1|m,n,k)≥0.975−0.025=0.95
সুতরাং, উপরের সম্ভাব্যতাগুলি দেখে আমরা দেখতে পাই যে এবং জে 1 = 9 । এই বায়েশিয়ান পূর্বাভাস ব্যবধানের সম্ভাবনা 0.9778494, যা 0.95 এর চেয়ে বড়। আমরা খাটো অন্তর যেমন যে খুঁজে পাইনি পি দ ( ঞ 1 ≤ ঞ ≤ ঞ 2 | মি , এন , ট ) ≥ 0.95 , কিন্তু যে ক্ষেত্রে লেজ সম্ভাব্যতা জন্য দুটি অসাম্য অন্তত এক সন্তুষ্ট হবো না।j2=18j1=9Pr(j1≤j≤j2|m,n,k)≥0.95
ঘন ঘন সমাধান
Y∼Binom(m,p)X∼Binom(n,p)1−2α−YXI=[L(X;n,m,α),U(X;n,m,α)]
PrX,Y(Y∈I)=PrX,Y(L(X;n,m,α)≤Y≤U(X;n,m,α)]≥1−2α
≥1−2αXX+Y=k+j=ssnn+m
Pr(X=k|X+Y=s,n,n+m)=(nk)(ms−k)(m+ns)
XX+Y=s
Pr(X≤k|s,n,n+m)=H(k;s,n,n+m)=∑ki=0(ni)(ms−i)(m+ns)
pk1−αL
Pr(X≥k|k+L,n,n+m)=1−H(k−1;k+L,n,n+m)>α
1−α
Pr(X≤k|k+U,n,n+m)=H(k;k+U,n,n+m)>α
[L,U]Y1−2αpnm1−2α
ফ্রিকোয়েন্সিস্ট সমাধান সহ ব্যবহারিক উদাহরণ
αβ
n <- 100
k <- 70
m <- 20
p^=knm
frequentist_point_estimate <- m * k/n #14
UPr(X≤k|k+U,n,n+m)=H(k;k+U,n,n+m)>αU[0,m]
jvec <- seq(0, m, by = 1)
probabilities <- phyper(k,n,m,k+jvec)
U
jvec[which.min(probabilities > 0.025) - 1] # 18
LPr(X≥k|k+L,n,n+m)=1−H(k−1;k+L,n,n+m)>α
probabilities <- 1-phyper(k-1,n,m,k+jvec)
jvec[which.max(probabilities > 0.025) - 1] # 8
[L,U]=[8,18]