যে জিনিসগুলি হওয়ার সম্ভাবনা 0 রয়েছে তার সম্পর্কে একটি দমনীয় দার্শনিক আলোচনা করা কঠিন। সুতরাং আমি আপনাকে কিছু উদাহরণ দেখাব যা আপনার প্রশ্নের সাথে সম্পর্কিত।
যদি একই বিতরণ থেকে আপনার দুটি প্রচুর স্বতন্ত্র নমুনা থাকে, তবে উভয় নমুনার কিছুটা 2-নমুনা টি স্ট্যাটিস্টিকটি কাছে থাকবে তবে ঠিক 0 নয়, পি-মানটি হিসাবে বিতরণ করা হবে
এবং 95% আত্মবিশ্বাসের বিরতি খুব সংক্ষিপ্ত এবং খুব কাছাকাছি কেন্দ্রিক হবেUnif(0,1),0.
এই জাতীয় একটি ডেটাসেট এবং টি পরীক্ষার উদাহরণ:
set.seed(902)
x1 = rnorm(10^5, 100, 15)
x2 = rnorm(10^5, 100, 15)
t.test(x1, x2, var.eq=T)
Two Sample t-test
data: x1 and x2
t = -0.41372, df = 2e+05, p-value = 0.6791
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.1591659 0.1036827
sample estimates:
mean of x mean of y
99.96403 99.99177
এই জাতীয় 10,000 পরিস্থিতি থেকে এখানে সংক্ষিপ্ত ফলাফল পাওয়া যায়। প্রথমত, পি-মানগুলির বিতরণ।
set.seed(2019)
pv = replicate(10^4,
t.test(rnorm(10^5,100,15),rnorm(10^5,100,15),var.eq=T)$p.val)
mean(pv)
[1] 0.5007066 # aprx 1/2
hist(pv, prob=T, col="skyblue2", main="Simulated P-values")
curve(dunif(x), add=T, col="red", lwd=2, n=10001)
পরীক্ষার পরিসংখ্যান পরবর্তী:
set.seed(2019) # same seed as above, so same 10^4 datasets
st = replicate(10^4,
t.test(rnorm(10^5,100,15),rnorm(10^5,100,15),var.eq=T)$stat)
mean(st)
[1] 0.002810332 # aprx 0
hist(st, prob=T, col="skyblue2", main="Simulated P-values")
curve(dt(x, df=2e+05), add=T, col="red", lwd=2, n=10001)
এবং তাই সিআই প্রস্থ জন্য।
set.seed(2019)
w.ci = replicate(10^4,
diff(t.test(rnorm(10^5,100,15),
rnorm(10^5,100,15),var.eq=T)$conf.int))
mean(w.ci)
[1] 0.2629603
ধারাবাহিক ডেটা, যেখানে অনুমানগুলি পূরণ করা হয় তার সাথে নির্ভুল পরীক্ষা করে unityক্যের পি-মান পাওয়া প্রায় অসম্ভব। এতোটুকু, যে একজন বিজ্ঞ পরিসংখ্যানবিদ 1 এর পি-মান দেখে কী ভুল হতে পারে তা ভেবে দেখবেন।
উদাহরণস্বরূপ, আপনি সফ্টওয়্যারটি দুটি অভিন্ন বৃহত নমুনা দিতে পারেন। প্রোগ্রামিংটি এমনভাবে চালিত হবে যেন এগুলি দুটি স্বতন্ত্র নমুনা এবং অদ্ভুত ফলাফল দেয়। তবে তারপরেও সিআই 0 প্রস্থের হবে না।
set.seed(902)
x1 = rnorm(10^5, 100, 15)
x2 = x1
t.test(x1, x2, var.eq=T)
Two Sample t-test
data: x1 and x2
t = 0, df = 2e+05, p-value = 1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.1316593 0.1316593
sample estimates:
mean of x mean of y
99.96403 99.96403