বুটস্ট্র্যাপ সিআই এবং পি-মানগুলি গণনা করার বিভিন্ন উপায় রয়েছে। মূল সমস্যাটি হ'ল বুটস্ট্র্যাপের পক্ষে নাল অনুমানের অধীনে ডেটা উত্পন্ন করা অসম্ভব। পারমিটেশন পরীক্ষা এটির একটি বাস্তব পুনরায় মডেলিং ভিত্তিক বিকল্প। সঠিক বুটস্ট্র্যাপ ব্যবহার করার জন্য আপনাকে পরীক্ষার পরিসংখ্যানগুলির নমুনা বিতরণ সম্পর্কে কিছু ধারণা তৈরি করতে হবে।
পরীক্ষার অদম্যতার অভাব সম্পর্কে একটি মন্তব্য: 95% সিআই খুঁজে পাওয়া সম্ভব নয় নালটি এখনও এপি> 0.05 বা বিপরীতে অন্তর্ভুক্ত নয়। ভাল চুক্তি আছে করার জন্য, নাল অধীনে বুটস্ট্র্যাপ নমুনার হিসাব আবশ্যক যেমন আফিম হতে বদলে । এর অর্থ হ'ল বুটস্ট্র্যাপের নমুনায় ঘনত্বটি যদি ডানদিকে স্কু করা হয় তবে ঘনত্বটি নালার দিকে বামে রাখতে হবে। অ-বিশ্লেষণাত্মক (যেমন: পুনরায় মডেলিং) সমাধানগুলি যেমন সিআইয়ের জন্য পরীক্ষাগুলি উল্টানো সম্ভব নয়।β∗0=β^−β^∗β∗0=β^∗−β^
সাধারণ বুটস্ট্র্যাপ
একটি পদ্ধতির একটি সাধারণ বুটস্ট্র্যাপ যেখানে আপনি বুটস্ট্র্যাপ বিতরণের গড় এবং মানক বিচ্যুতি গ্রহণ করেন, বুলিটি নীচের নীচে নমুনা বিতরণ গণনা করুন বন্টন স্থানান্তর করে এবং মূল বুটস্ট্র্যাপ নমুনায় অনুমানের বিন্দুতে নাল বন্টন থেকে সাধারণ পার্সেন্টাইলগুলি ব্যবহার করে । বুটস্ট্র্যাপ বিতরণ যখন স্বাভাবিক হয় তখন এটি একটি যুক্তিসঙ্গত পদ্ধতি, ভিজ্যুয়াল পরিদর্শন সাধারণত এখানে যথেষ্ট। এই পদ্ধতির ব্যবহারের ফলাফলগুলি সাধারণত মজবুত, বা স্যান্ডউইচ ভিত্তিক ত্রুটি অনুমানের খুব কাছাকাছি থাকে যা ভিন্ন ভিন্নতা এবং / অথবা সীমাবদ্ধ নমুনা বৈকল্পিক অনুমানের বিরুদ্ধে শক্ত। একটি সাধারণ পরীক্ষার পরিসংখ্যানের অনুমান হ'ল আমি পরবর্তী বুটস্ট্র্যাপ পরীক্ষায় অনুমানের আরও শক্তিশালী অবস্থা যা আলোচনা করব।
পারসেন্টাইল বুটস্ট্র্যাপ
আর একটি পদ্ধতি হ'ল পারসেন্টাইল বুটস্ট্র্যাপ যা আমি মনে করি আমাদের অধিকাংশই বিবেচনা করে যখন আমরা বুটস্ট্র্যাপের কথা বলি। এখানে, প্যারামিটারের বুটস্ট্র্যাপড বিতরণ বিকল্প অনুমানের অধীনে নমুনার একটি অভিজ্ঞতা অভিজ্ঞতা বিতরণ করে। এই বিতরণ সম্ভবত অস্বাভাবিক হতে পারে। এমিরিকাল কোয়ান্টাইলগুলি গ্রহণ করে একটি 95% সিআই সহজেই গণনা করা হয়। তবে একটি গুরুত্বপূর্ণ অনুমান হ'ল এই জাতীয় বিতরণটি মূলত । এর অর্থ হ'ল যদি অন্তর্নিহিত প্যারামিটারটি পরিবর্তন হয় তবে বিতরণের আকারটি কেবল ধ্রুবক দ্বারা স্থানান্তরিত হয় এবং স্কেল অগত্যা পরিবর্তন হয় না। এটি একটি দৃ ass় ধারণা! যদি এটি ধারণ করে, আপনি "নাল অনুমানের অধীনে পরিসংখ্যান বিতরণ" (ডিএসএনএইচ বাF∗0) অনুমানগুলি থেকে বুটস্ট্র্যাপ বিতরণকে বিয়োগ করে, তারপরে ব্যবহার করে ডিএসএনএইচ-র শতাংশটি আপনার অনুমানের তুলনায় "আরও চরম"2×min(F∗0(β^),1−F∗0(β^))
স্টুটেজড বুটস্ট্র্যাপ
ভ্যালুগুলি গণনা করার সবচেয়ে সহজ বুটস্ট্র্যাপ সমাধান হ'ল স্টুডেন্টাইজড বুটস্ট্র্যাপ ব্যবহার করা। প্রতিটি বুটস্ট্র্যাপ পুনরাবৃত্তির সাহায্যে পরিসংখ্যান এবং তার স্ট্যান্ডার্ড ত্রুটি গণনা করুন এবং শিক্ষার্থীদের পরিসংখ্যান ফিরিয়ে দিন। এটি অনুমানের জন্য একটি বুটস্ট্র্যাপড ছাত্র বিতরণ দেয় যা সিআইএস এবং পি-মানগুলি খুব সহজেই গণনা করতে ব্যবহার করা যেতে পারে। এটি পক্ষপাত সংশোধন-ত্বরিত বুটস্ট্র্যাপের পিছনে অন্তর্নিহিতিকেও অন্তর্নিহিত করে। টি-ডিস্ট্রিবিউশনটি শূন্যের অধীনে আরও সহজেই স্থানান্তরিত হয় কারণ বহির্মুখী ফলাফলগুলি তাদের উচ্চতর বৈকল্পিকতার দ্বারা নিম্নচাপিত হয়।p
প্রোগ্রামিং উদাহরণ
উদাহরণ হিসাবে, আমি city
বুটস্ট্র্যাপ প্যাকেজে ডেটা ব্যবহার করব । বুটস্ট্র্যাপের আত্মবিশ্বাসের অন্তরগুলি এই কোড দিয়ে গণনা করা হয়:
ratio <- function(d, w) sum(d$x * w)/sum(d$u * w)
city.boot <- boot(city, ratio, R = 999, stype = "w", sim = "ordinary")
boot.ci(city.boot, conf = c(0.90, 0.95),
type = c("norm", "basic", "perc", "bca"))
এবং এই আউটপুট উত্পাদন:
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 999 bootstrap replicates
CALL :
boot.ci(boot.out = city.boot, conf = c(0.9, 0.95), type = c("norm",
"basic", "perc", "bca"))
Intervals :
Level Normal Basic
90% ( 1.111, 1.837 ) ( 1.030, 1.750 )
95% ( 1.042, 1.906 ) ( 0.895, 1.790 )
Level Percentile BCa
90% ( 1.291, 2.011 ) ( 1.292, 2.023 )
95% ( 1.251, 2.146 ) ( 1.255, 2.155 )
Calculations and Intervals on Original Scale
সাধারণ বুটস্ট্র্যাপের 95% সিআই গণনা করে প্রাপ্ত হয়:
with(city.boot, 2*t0 - mean(t) + qnorm(c(0.025, 0.975)) %o% sqrt(var(t)[1,1]))
পি-মানটি এইভাবে পাওয়া যায়:
> with(city.boot, pnorm(abs((2*t0 - mean(t) - 1) / sqrt(var(t)[1,1])), lower.tail=F)*2)
[1] 0.0315
যা সম্মত হয় যে 95% সাধারণ সিআই 1 এর নাল অনুপাতের মান অন্তর্ভুক্ত করে না।
পারসেন্টাইল সিআই প্রাপ্ত হয় (সম্পর্কের পদ্ধতির কারণে কিছু পার্থক্য সহ):
quantile(city.boot$t, c(0.025, 0.975))
এবং পারসেন্টাইল বুটস্ট্র্যাপের জন্য পি-মানটি হ'ল:
cvs <- quantile(city.boot$t0 - city.boot$t + 1, c(0.025, 0.975))
mean(city.boot$t > cvs[1] & city.boot$t < cvs[2])
0.035 এর এপি দেয় যা মান থেকে 1 বাদ দেওয়ার ক্ষেত্রে আত্মবিশ্বাসের ব্যবধানের সাথেও সম্মত হয়। আমরা সাধারণভাবে এটি পর্যবেক্ষণ করতে পারি না, যদিও পারসেন্টাইল সিআইয়ের প্রস্থটি সাধারণ সিআইয়ের প্রায় প্রায় বিস্তৃত এবং পারসেন্টাইল সিআই নল থেকে আরও বেশি যে পারসেন্টাইল সিআইকে নিম্ন পি-মান প্রদান করা উচিত। এটি হ'ল পারসেন্টাইল পদ্ধতির সিআইয়ের অন্তর্গত নমুনা বিতরণের আকারটি স্বাভাবিক নয়।