সাধারণভাবে বিতরণ করা নমুনায় আমি কীভাবে কোনও গড়ার আত্মবিশ্বাসের ব্যবধান গণনা করতে পারি?


19

সাধারণভাবে বিতরণ করা নমুনায় আমি কীভাবে কোনও গড়ার আত্মবিশ্বাসের ব্যবধান গণনা করতে পারি?

আমি বুঝতে পারি বুটস্ট্র্যাপ পদ্ধতিগুলি এখানে সাধারণত ব্যবহৃত হয় তবে আমি অন্য বিকল্পের জন্য উন্মুক্ত। আমি যখন কোনও প্যারামিমেট্রিক বিকল্পের সন্ধান করছি, কেউ যদি আমাকে বোঝাতে পারেন যে একটি প্যারামেট্রিক সমাধান বৈধ যা ঠিক আছে। নমুনার আকার> 400।

আর-তে যদি কেউ নমুনা দিতে পারে তবে এটির প্রশংসা হবে।


3
কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি সূচিত করে যে নমুনাটির সীমাবদ্ধ বন্টন মূল ডেটা বিতরণ (কিছু শর্তাধীন) নির্বিশেষে স্বাভাবিক। অনেক ক্ষেত্রে একটি নমুনার আকার যথেষ্ট বড় যাতে স্বাভাবিক আনুমানিকতা বেশ নির্ভুল তবে নির্ভুলতা পিতামাতাদের বন্টনের উপর নির্ভর করে - এটি যদি আপনাকে, উদাহরণস্বরূপ, মূল উপাত্তের একটি হিস্টগ্রাম পোস্ট করে তবে তা সহায়তা করতে পারে। এন>400
ম্যাক্রো

উত্তর:


18

প্রথমত, আমি পরীক্ষাটি করব যে হাতটি কার্যের জন্য উপযুক্ত সূচক কিনা। যদি আপনি স্কিউ বিতরণের "একটি সাধারণ / বা কেন্দ্রীয় মান" সন্ধান করেন তবে গড়টি আপনাকে বরং একটি অ-প্রতিনিধি মানের দিকে নির্দেশ করতে পারে। লগ-সাধারণ বিতরণ বিবেচনা করুন:

x <- rlnorm(1000)
plot(density(x), xlim=c(0, 10))
abline(v=mean(x), col="red")
abline(v=mean(x, tr=.20), col="darkgreen")
abline(v=median(x), col="blue")

লগ-স্বাভাবিক বিতরণের জন্য গড় (লাল), 20% ছাঁটাই গড় (সবুজ) এবং মিডিয়ান (নীল)

গড় (লাল রেখা) তথ্য প্রচুর পরিমাণ থেকে অনেক দূরে। 20% ট্রিমড গড় (সবুজ) এবং মিডিয়ান (নীল) "টিপিকাল" মানের কাছাকাছি।

ফলাফলগুলি আপনার "অ-সাধারণ" বিতরণের ধরণের উপর নির্ভর করে (আপনার আসল ডেটার একটি হিস্টোগ্রাম সহায়ক হবে)। যদি এটি স্কিউড না হয় তবে ভারী লেজ থাকে তবে আপনার সিআই খুব প্রশস্ত হবে।

যাইহোক, আমি মনে করি যে বুটস্ট্র্যাপিং প্রকৃতপক্ষে একটি ভাল পন্থা, কারণ এটি আপনাকে অসম্পূর্ণ সিআইও দিতে পারে। Rপ্যাকেজ simplebootএকটি ভালো শুরু:

library(simpleboot)
# 20% trimmed mean bootstrap
b1 <- one.boot(x, mean, R=2000, tr=.2)
boot.ci(b1, type=c("perc", "bca"))

... আপনাকে নিম্নলিখিত ফলাফল দেয়:

# The bootstrap trimmed mean:
> b1$t0
[1] 1.144648

BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 2000 bootstrap replicates
Intervals : 
Level     Percentile            BCa          
95%   ( 1.062,  1.228 )   ( 1.065,  1.229 )  
Calculations and Intervals on Original Scale

বিস্তারিত উত্তরের জন্য অনেক ধন্যবাদ। পারসেন্টাইল এবং অ্যাডজাস্টেড পারসেন্টাইল (বিসিএ) পরিসংখ্যানের মধ্যে (সর্বনিম্ন) পার্থক্যের বিষয়ে আপনি মন্তব্য করতে আগ্রহী?
fmark

"বুটস্ট্র্যাপ বায়াস-সংশোধন ত্বরান্বিত (বিসিএ) ব্যবধানটি পার্সেন্টাইল পদ্ধতির একটি পরিবর্তন যা পার্সেন্টাইলগুলিকে পক্ষপাত এবং সঙ্কোচনের জন্য সংশোধন করতে সামঞ্জস্য করে" (হস্টারস্টারবার্গ, টি।, মোনাঘান, এস, মুর, ডি, ক্লিপসন, এ।) & এপস্টাইন, আর। (2005)। বুটস্ট্র্যাপ পদ্ধতি এবং ক্রমশক্তি পরীক্ষা। পরিসংখ্যান অনুশীলনের ভূমিকা, 14.1–14.70।) সফ্টওয়্যার যখনই এটির অনুমতি দেয়, বিসিএ সংশোধিত সিআই ব্যবহার করুন (দ্রষ্টব্য: এটির প্রয়োজন> 1000 টি প্রতিকার)
ফেলিক্স এস

সিমপুট প্যাকেজের ডকুমেন্টেশন থেকে মনে হয় ছাঁটাই করার পক্ষে যুক্তি আর সমর্থিত নয়। :(
এটি

8

κ^/(6গুলি2এন)κ^হে(এন-1/2)হে(এন-1)এন1/2>20এন>400 তত্ত্ব ) সিমুলেশন প্রমাণ সম্পর্কে যা আমি স্মরণ করতে পারি তার জন্য, বুটস্ট্র্যাপ সিআইগুলি বিশ্লেষকের উপর ভিত্তি করে সিআই এর চেয়ে কিছুটা মোটা যদিও প্রকাশ।

(মেপুঃ(1)+ +2)*মেপুঃ(1)-1kappa = (exp(1)+2)*sqrt( exp(1) - 1) = 6.184877s = sqrt( (exp(1)-1)*exp(1) ) = 2.1611972*s*qnorm(0.975)/sqrt(n) = 0.2678999kappa*s/(6*n) = 0.00222779kappa


2

গণনা করে একটি লগ-সাধারণ বিতরণ চেষ্টা করুন:

  1. তথ্য লোগারিদম;
  2. এর গড় এবং আদর্শ বিচ্যুতি (1)
  3. আত্মবিশ্বাস বিরতি (2)
  4. (3) এর ক্ষতিকারক

আপনি প্রত্যাশিত মান (যা কাঁচা ডেটার অর্থ নয়) এর আশেপাশে একটি অসামান্য আত্মবিশ্বাসের অন্তর শেষ করবেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.