ভারী গড় অনুমানের মধ্যে স্ট্যান্ডার্ড ত্রুটি গণনা


16

ধরুন যে w1,w2,,wn এবং প্রতিটি টানা হয় IID কিছু ডিস্ট্রিবিউশন, সঙ্গে থেকে স্বাধীন । কঠোরভাবে ইতিবাচক। আপনি সমস্ত w_i পালন করেন , তবে x_i নয় ; বরং আপনি \ যোগ_ i x_i ডাব্লু_আই পালন করেন । আমি এই তথ্য থেকে \ অপেরাটর্নাম {ই} \ বাম [x \ ডান] অনুমান করতে আগ্রহী । স্পষ্টতই অনুমানকারী \ বার {x} = \ frac {\ Sum_i ডাব্লু_আই x_i} {\ যোগ_ i ডাব্লু_আই} নিরপেক্ষ, এবং হাতের তথ্য দিয়ে গণনা করা যায়।x1,x2,...,xnx আমি W আমি W আমি এক্স আমি Σ আমি এক্স আমি W আমি[ X ] ˉ এক্স = Σ আমি W আমি এক্স আমিwixiwiwixiixiwiE[x]

x¯=iwixiiwi

আমি কীভাবে এই অনুমানকারীর স্ট্যান্ডার্ড ত্রুটি গণনা করতে পারি? সাব-কেসের ক্ষেত্রে যেখানে xi কেবল 0 এবং 1 এর মান গ্রহণ করে, আমি নির্লজ্জভাবে চেষ্টা করেছি

sex¯(1x¯)iwi2iwi,
মূলত তারতম্য উপেক্ষা wi কিন্তু দেখা গেছে যে এই দুর্বল সঞ্চালিত নমুনা জন্য 250. প্রায় চেয়ে ছোট আকার (এই সম্ভবত ভ্যারিয়েন্স উপর নির্ভর করে wi ।) মনে হচ্ছে যে আমি হয়তো যথেষ্ট তথ্য নেই একটি 'আরও ভাল' মান ত্রুটি গণনা।

উত্তর:


17

আমি সম্প্রতি একই ইস্যুতে দৌড়েছি। নিম্নলিখিতটি আমি যা পেয়েছি তা হল:

সমান ওজনযুক্ত একটি সাধারণ এলোমেলো নমুনার বিপরীতে, ভারিত গড়ের স্ট্যান্ডার্ড ত্রুটির কোনও বহুল স্বীকৃত সংজ্ঞা নেই । এই দিনগুলিতে কোনও বুটস্ট্র্যাপ করা এবং গড়ের অভিজ্ঞতা অভিজ্ঞতা অর্জন করা সোজা-এগিয়ে হবে এবং সেই প্রাক্কলন ত্রুটির উপর নির্ভর করে।

যদি কেউ এই অনুমানটি করার জন্য কোনও সূত্র ব্যবহার করতে চান?

ডোনাল্ড এফ গ্যাটজ এবং লুথার স্মিথের মূল উল্লেখটি এই কাগজটি যেখানে বুটস্ট্র্যাপের ফলাফলের সাথে 3 সূত্র ভিত্তিক অনুমানকারীকে তুলনা করা হয়। বুটস্ট্র্যাপের ফলাফলের সর্বোত্তম অনুমানটি কোচরান (1977) থেকে এসেছে:

(SEMw)2=n(n1)(Pi)2[(PiXiP¯X¯w)22X¯w(PiP¯)(PiXiP¯X¯w)+X¯w2(PiP¯)2]

নীচে এই আর তালিকাভুক্ত থ্রেড থেকে আসা সম্পর্কিত আর কোডটি দেওয়া হল ।

weighted.var.se <- function(x, w, na.rm=FALSE)
#  Computes the variance of a weighted mean following Cochran 1977 definition
{
  if (na.rm) { w <- w[i <- !is.na(x)]; x <- x[i] }
  n = length(w)
  xWbar = weighted.mean(x,w,na.rm=na.rm)
  wbar = mean(w)
  out = n/((n-1)*sum(w)^2)*(sum((w*x-wbar*xWbar)^2)-2*xWbar*sum((w-wbar)*(w*x-wbar*xWbar))+xWbar^2*sum((w-wbar)^2))
  return(out)
}

আশাকরি এটা সাহায্য করবে!


এটি বেশ দুর্দান্ত, তবে আমার সমস্যার জন্য আমি পর্যবেক্ষণও করি না , বরং আমি যোগফল পর্যবেক্ষণ । আমার প্রশ্নটি খুব অদ্ভুত কারণ এটিতে কিছু তথ্য অসম্পূর্ণতা জড়িত (একটি তৃতীয় পক্ষ যোগফলের প্রতিবেদন করছে, এবং সম্ভবত কিছু তথ্য গোপন করার চেষ্টা করছে)। PiXiiPiXi
shabbychef

আপনি ঠিক বলেছেন, দুঃখিত আপনি যে প্রশ্ন উত্থাপন করেছেন তা আমি পুরোপুরি বুঝতে পারি নি। মনে করুন আমরা আপনার সমস্যাটিকে এমন এক সহজ মামলায় সিদ্ধ করে যেখানে সমস্ত আরভি। তারপরে আপনি মূলত আরভিগুলির একটি এলোমেলো উপসেটের যোগফলটি পর্যবেক্ষণ করছেন । আমার ধারণা এখানে অনুমান করার মতো অনেক তথ্য নেই। তাহলে আপনি নিজের মূল সমস্যার জন্য কী করতে পেরেছেন? win
মিং কে

@ মিং-চিহকাও এই কোচরান সূত্রটি আকর্ষণীয় তবে তথ্যটি স্বাভাবিক না হলে আপনি যদি আত্মবিশ্বাসের ব্যবধানটি বন্ধ করেন তবে কোনও ধারাবাহিক ব্যাখ্যার সঠিক নেই? আপনি কীভাবে নন-ওজনযুক্ত গড় গড় আত্মবিশ্বাসের বিরতি পরিচালনা করবেন? ওজনযুক্ত কোয়ান্টাইল?
ব্যবহারকারী 3022875

আমি মনে করি ফাংশনটিতে একটি ত্রুটি আছে। আপনি যদি বিকল্প w=rep(1, length(x)), তাহলে weighted.var.se(rnorm(50), rep(1, 50))প্রায় 0.014। আমি মনে করি সূত্রটি একটি sum(w^2)সংখ্যায় অনুপস্থিত , যেহেতু P=1, তারতম্য 1/(n*(n-1)) * sum((x-xbar)^2)। আমি একটি উদ্ধৃত নিবন্ধটি পে-ওালের পিছনে থাকায় এটি চেক করতে পারি না তবে আমি মনে করি যে এটি সংশোধন করে। অদ্ভুতভাবে যথেষ্ট, উইকিপিডিয়া (বিভিন্ন) সমাধান সমস্ত ওজন সমান হলে অধ: পতিত হয়: en.wikedia.org/wiki/…
সর্বাধিক ক্যান্ডোসিয়া

এগুলি সাধারণভাবে আরও ভালভাবে কাজ করতে পারে: বিশ্লেষণাত্মক
গোষ্ঠী / ডাউনলোড / WEIGHTED_MEAN.pdf

5

wi

wi2Var(X)(wi)2=Var(X)wi2(wi)2.
wi
Var(X)E(wi2(wi)2)
XiVar(X)

xixx¯(1x¯)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.