প্রথমত, আমি পরীক্ষাটি করব যে হাতটি কার্যের জন্য উপযুক্ত সূচক কিনা। যদি আপনি স্কিউ বিতরণের "একটি সাধারণ / বা কেন্দ্রীয় মান" সন্ধান করেন তবে গড়টি আপনাকে বরং একটি অ-প্রতিনিধি মানের দিকে নির্দেশ করতে পারে। লগ-সাধারণ বিতরণ বিবেচনা করুন:
x <- rlnorm(1000)
plot(density(x), xlim=c(0, 10))
abline(v=mean(x), col="red")
abline(v=mean(x, tr=.20), col="darkgreen")
abline(v=median(x), col="blue")
গড় (লাল রেখা) তথ্য প্রচুর পরিমাণ থেকে অনেক দূরে। 20% ট্রিমড গড় (সবুজ) এবং মিডিয়ান (নীল) "টিপিকাল" মানের কাছাকাছি।
ফলাফলগুলি আপনার "অ-সাধারণ" বিতরণের ধরণের উপর নির্ভর করে (আপনার আসল ডেটার একটি হিস্টোগ্রাম সহায়ক হবে)। যদি এটি স্কিউড না হয় তবে ভারী লেজ থাকে তবে আপনার সিআই খুব প্রশস্ত হবে।
যাইহোক, আমি মনে করি যে বুটস্ট্র্যাপিং প্রকৃতপক্ষে একটি ভাল পন্থা, কারণ এটি আপনাকে অসম্পূর্ণ সিআইও দিতে পারে। R
প্যাকেজ simpleboot
একটি ভালো শুরু:
library(simpleboot)
# 20% trimmed mean bootstrap
b1 <- one.boot(x, mean, R=2000, tr=.2)
boot.ci(b1, type=c("perc", "bca"))
... আপনাকে নিম্নলিখিত ফলাফল দেয়:
# The bootstrap trimmed mean:
> b1$t0
[1] 1.144648
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 2000 bootstrap replicates
Intervals :
Level Percentile BCa
95% ( 1.062, 1.228 ) ( 1.065, 1.229 )
Calculations and Intervals on Original Scale