সম্ভবত অসম্পূর্ণ ফলাফলের সাথে পরীক্ষার আরেকটি উদাহরণ হ'ল অনুপাতের জন্য দ্বিপদী পরীক্ষা যখন নমুনার আকার নয়, অনুপাতের মাত্রা পাওয়া যায়। এটি পুরোপুরি অবাস্তব নয় - আমরা প্রায়শই ফর্মটির খারাপ চিত্রিত দাবীগুলি দেখতে পাই বা শুনে থাকি "that৩% লোকেরা তাতে সম্মত হন ..." এবং অন্যদিকে, যেখানে ডিনোমিনেটর পাওয়া যায় না।
ধরুন উদাহরণস্বরূপ আমরা কেবল নমুনা অনুপাত জানি কাছাকাছি সমগ্র শতাংশে সঠিক বৃত্তাকার , এবং আমরা পরীক্ষা করতে ইচ্ছুক বিরুদ্ধে এইচ 1 : π ≠ 0.5 এ α = 0.05 স্তর।এইচ0: π= 0.5এইচ1: π≠ 0.5। = 0.05
যদি আমাদের পর্যবেক্ষিত অনুপাত ছিল তারপর পর্যবেক্ষিত অনুপাত জন্য নমুনা আকার কমপক্ষে 19 হয়েছে, যেহেতু 1পি = 5 % হ'ল সর্বনিম্ন ডিনোমিনেটরের সাথে ভগ্নাংশ যা5% হয়ে যাবে। আমরা জানি না যে পর্যবেক্ষণ করা সাফল্যের সংখ্যাটি আসলে ১৯ টির মধ্যে ১ জন, ২০ জনের মধ্যে ১ জন, ২১ জনের মধ্যে ১ টি, ২২ টির মধ্যে ১ টি, ৩ of টির মধ্যে ২ টি, ৫ 55 টির মধ্যে ৩, ৫ টির মধ্যে ৫ ১০০০ এর মধ্যে ১০০ বা ৫০ ... তবে এগুলির মধ্যে যে কোনও একটি, ফলাফলটিα=0.05স্তরেউল্লেখযোগ্য হবে।1195 %। = 0.05
অন্যদিকে, যদি আমরা জানি যে নমুনা অনুপাতটি তবে আমরা জানি না যে পর্যবেক্ষণ করা সাফল্যের সংখ্যা 100 এর মধ্যে 49 ছিল (যা এই স্তরে তাৎপর্যপূর্ণ হবে না) বা 10,000 এর মধ্যে 4900 (যা কেবলমাত্র তাত্পর্য অর্জন করে)। সুতরাং এক্ষেত্রে ফলাফলগুলি বেআইনী।পি = 49 %
পি = 50 %এইচ0
পি = 0 %পি = 50 %পি = 5 %পি = 0 %পি = 100 %পি = 16 %জনসংযোগ ( এক্স≤ 3 ) ≈ 0.00221 < 0.025পি = 17 %জনসংযোগ ( এক্স≤ 1 ) ≈ 0.109 > 0.025পি = 16 %পি = 18 %জনসংযোগ ( এক্স≤ 2 ) ≈ 0.0327 > 0.025পি = 19 %জনসংযোগ ( এক্স≤ 3 ) ≈ 0.0106 < 0.025
পি = 24 %পি = 13 %। = 0.05: রেখার নীচের পয়েন্টগুলি দ্ব্যর্থহীনভাবে তাৎপর্যপূর্ণ তবে এটির উপরে এটিগুলি অনির্বাচিত। পি-মানগুলির প্যাটার্নটি এমন যে ফলাফলগুলি নির্বিঘ্নে তাৎপর্যপূর্ণ হওয়ার জন্য পর্যবেক্ষণ করা শতাংশের উপর একক নিম্ন এবং উচ্চতর সীমা থাকবে না।
আর কোড
# need rounding function that rounds 5 up
round2 = function(x, n) {
posneg = sign(x)
z = abs(x)*10^n
z = z + 0.5
z = trunc(z)
z = z/10^n
z*posneg
}
# make a results data frame for various trials and successes
results <- data.frame(successes = rep(0:100, 100),
trials = rep(1:100, each=101))
results <- subset(results, successes <= trials)
results$percentage <- round2(100*results$successes/results$trials, 0)
results$pvalue <- mapply(function(x,y) {
binom.test(x, y, p=0.5, alternative="two.sided")$p.value}, results$successes, results$trials)
# make a data frame for rounded percentages and identify which are unambiguously sig at alpha=0.05
leastsig <- sapply(0:100, function(n){
max(subset(results, percentage==n, select=pvalue))})
percentages <- data.frame(percentage=0:100, leastsig)
percentages$significant <- percentages$leastsig
subset(percentages, significant==TRUE)
# some interesting cases
subset(results, percentage==13) # inconclusive at alpha=0.05
subset(results, percentage==24) # unambiguously sig at alpha=0.05
# plot graph of greatest p-values, results below red line are unambiguously significant at alpha=0.05
plot(percentages$percentage, percentages$leastsig, panel.first = abline(v=seq(0,100,by=5), col='grey'),
pch=19, col="blue", xlab="Rounded percentage", ylab="Least significant two-sided p-value", xaxt="n")
axis(1, at = seq(0, 100, by = 10))
abline(h=0.05, col="red")
( এই স্ট্যাকওভারফ্লো প্রশ্নটি থেকে গোলাকার কোডটি ছিটকে গেছে ))