হ্যাঁ, আপনি পারেন আনুমানিক দ্বারা পি ( ˉ এক্স * এন ≤ এক্স ) কিন্তু এটা অনুকূল নয়। এটি পারসেন্টাইল বুটস্ট্র্যাপের একটি রূপ। যাইহোক, আপনি যদি জনসংখ্যার বিষয়ে ধারণা তৈরি করতে চাইছেন তবে পার্সেন্টাইল বুটস্ট্র্যাপটি ভাল পারফর্ম করে না যদি আপনার আকারের বড় আকার না থাকে। (নমুনার আকারের আকার যখন ছোট হয় সহ এটি অন্যান্য অনেকগুলি ইনফরমেশন সমস্যার সাথে ভাল সম্পাদন করে)) আমি উইলকক্সের সামাজিক ও আচরণগত বিজ্ঞান , সিআরসি প্রেস, ২০১২ এর আধুনিক পরিসংখ্যান থেকে এই উপসংহারটি নিয়েছি A একটি তাত্ত্বিক প্রমাণ আমার বাইরেও আমি ভীত afraid ।P(X¯n≤x)P(X¯∗n≤x)
কেন্দ্রিক পদ্ধতির একটি বৈকল্পিক পরবর্তী পদক্ষেপে চলে যায় এবং পুনরায় নমুনা মানক বিচ্যুতি এবং নমুনা আকারের সাথে আপনার কেন্দ্রিক বুটস্ট্র্যাপ পরিসংখ্যানকে স্কেল করে, পরিসংখ্যান হিসাবে একইভাবে গণনা করে। এই টি এর পরিসংখ্যান বিতরণ থেকে কোয়ান্টাইলগুলি একটি আত্মবিশ্বাসের ব্যবধান তৈরি করতে বা হাইপোথিসিস পরীক্ষা সম্পাদন করতে ব্যবহার করা যেতে পারে। এটি বুটস্ট্র্যাপ-টি পদ্ধতি এবং গড় সম্পর্কে ধারণা তৈরি করার সময় এটি উচ্চতর ফলাফল দেয়।
s∗
T∗=X¯∗n−X¯s∗/n√
T∗μ
X¯−T∗0.975sn√,X¯−T∗0.025sn√
নীচের সিমুলেশন ফলাফলগুলি বিবেচনা করুন, এটি দেখিয়েছেন যে একটি খারাপভাবে স্কিউড মিশ্র বিতরণের মাধ্যমে এই পদ্ধতিটির আস্থাভাজনের ব্যবধানগুলি পার্সেন্টাইল বুটস্ট্র্যাপ পদ্ধতি বা কোনও বুটস্ট্র্যাপিং ছাড়াই পরিসংখ্যানের একটি aতিহ্যগত বিপরীতার চেয়ে বেশি ঘন ঘন প্রকৃত মান ধারণ করে।
compare.boots <- function(samp, reps = 599){
# "samp" is the actual original observed sample
# "s" is a re-sample for bootstrap purposes
n <- length(samp)
boot.t <- numeric(reps)
boot.p <- numeric(reps)
for(i in 1:reps){
s <- sample(samp, replace=TRUE)
boot.t[i] <- (mean(s)-mean(samp)) / (sd(s)/sqrt(n))
boot.p[i] <- mean(s)
}
conf.t <- mean(samp)-quantile(boot.t, probs=c(0.975,0.025))*sd(samp)/sqrt(n)
conf.p <- quantile(boot.p, probs=c(0.025, 0.975))
return(rbind(conf.t, conf.p, "Trad T test"=t.test(samp)$conf.int))
}
# Tests below will be for case where sample size is 15
n <- 15
# Create a population that is normally distributed
set.seed(123)
pop <- rnorm(1000,10,1)
my.sample <- sample(pop,n)
# All three methods have similar results when normally distributed
compare.boots(my.sample)
এটি নিম্নলিখিতটি দেয় (কনফিটটি বুটস্ট্র্যাপ টি পদ্ধতি; কনফ। পি পারসেন্টাইল বুটস্ট্র্যাপ পদ্ধতি)।
97.5% 2.5%
conf.t 9.648824 10.98006
conf.p 9.808311 10.95964
Trad T test 9.681865 11.01644
স্কিউড বিতরণ থেকে একক উদাহরণ সহ:
# create a population that is a mixture of two normal and one gamma distribution
set.seed(123)
pop <- c(rnorm(1000,10,2),rgamma(3000,3,1)*4, rnorm(200,45,7))
my.sample <- sample(pop,n)
mean(pop)
compare.boots(my.sample)
এটি নিম্নলিখিত দেয়। মনে রাখবেন যে "কনফিট.টি" - বুটস্ট্র্যাপ টি সংস্করণ - অন্যান্য দুটির চেয়ে বৃহত্তর আত্মবিশ্বাসের ব্যবধান দেয়। মূলত, জনসংখ্যার অস্বাভাবিক বিতরণে সাড়া দেওয়া ভাল।
> mean(pop)
[1] 13.02341
> compare.boots(my.sample)
97.5% 2.5%
conf.t 10.432285 29.54331
conf.p 9.813542 19.67761
Trad T test 8.312949 20.24093
পরিশেষে এখানে এক হাজার সিমুলেশন রয়েছে যা কোন সংস্করণটি বেশিরভাগ ক্ষেত্রে সঠিক এমন আত্মবিশ্বাসের অন্তর দেয়:
# simulation study
set.seed(123)
sims <- 1000
results <- matrix(FALSE, sims,3)
colnames(results) <- c("Bootstrap T", "Bootstrap percentile", "Trad T test")
for(i in 1:sims){
pop <- c(rnorm(1000,10,2),rgamma(3000,3,1)*4, rnorm(200,45,7))
my.sample <- sample(pop,n)
mu <- mean(pop)
x <- compare.boots(my.sample)
for(j in 1:3){
results[i,j] <- x[j,1] < mu & x[j,2] > mu
}
}
apply(results,2,sum)
এটি নীচের ফলাফলগুলি দেয় - সংখ্যাগুলি 1000 এর মধ্যে এমন সময় হয় যে আত্মবিশ্বাসের ব্যবধানে একটি সিমুলেটেড জনসংখ্যার প্রকৃত মান থাকে। লক্ষ্য করুন যে প্রতিটি সংস্করণের সত্যিকারের সাফল্যের হার 95% এর চেয়ে কম।
Bootstrap T Bootstrap percentile Trad T test
901 854 890