হারমোনিক মানে স্ট্যান্ডার্ড বিচ্যুতি গণনা করা যেতে পারে? আমি বুঝতে পারি যে পাটিগণিত গড়ের জন্য স্ট্যান্ডার্ড বিচ্যুতি গণনা করা যেতে পারে, তবে যদি আপনার সুরেলা মানে হয় তবে আপনি কীভাবে মানক বিচ্যুতি বা সিভি গণনা করবেন?
হারমোনিক মানে স্ট্যান্ডার্ড বিচ্যুতি গণনা করা যেতে পারে? আমি বুঝতে পারি যে পাটিগণিত গড়ের জন্য স্ট্যান্ডার্ড বিচ্যুতি গণনা করা যেতে পারে, তবে যদি আপনার সুরেলা মানে হয় তবে আপনি কীভাবে মানক বিচ্যুতি বা সিভি গণনা করবেন?
উত্তর:
এলোমেলো ভেরিয়েবল এর সুরেলা মানে হিসাবে সংজ্ঞায়িত করা হয়েছে
মুহুর্তের ভগ্নাংশ গ্রহণ করা একটি অগোছালো ব্যবসা, সুতরাং পরিবর্তে আমি দিয়ে কাজ করতে পছন্দ করব । এখন
উসিন কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যটি আমরা তাৎক্ষণিকভাবে এটি পেয়েছি
অবশ্যই যদি এবং , IID হয় আমরা ভেরিয়েবল গাণিতিক গড় সঙ্গে সহজ কাজ থেকে ।
এখন ফাংশন for এর জন্য ডেল্টা পদ্ধতিটি ব্যবহার করে আমরা এটি পেয়েছি
এই ফলাফলটি অ্যাসিম্পোটিক, তবে সাধারণ অ্যাপ্লিকেশনগুলির জন্য এটি যথেষ্ট ice
@ ভুবার যথাযথভাবে উল্লেখ করার সাথে সাথে আপডেট করুন , সাধারণ অ্যাপ্লিকেশনগুলি একটি ভুল ব্যবহারকারী। কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য কেবলমাত্র উপস্থিত থাকলে এটি বেশ সীমাবদ্ধ অনুমান।
আপডেট 2 আপনার যদি কোনও নমুনা থাকে তবে মানক বিচ্যুতি গণনা করতে, সূত্রটিতে কেবল নমুনা মুহুর্তগুলি প্লাগ করুন। সুতরাং নমুনা , সুরেলা গড়ের অনুমান
নমুনা মুহুর্তগুলি এবং :
এখানে পারস্পরিক প্রতিবাদ বোঝায়।
অবশেষে স্ট্যান্ডার্ড ডেভিয়েশন জন্য আনুমানিক সূত্র হয়
আমি বিরতিতে ভেরিয়েবলগুলির জন্য কিছুটা মন্টে-কার্লো সিমুলেশন যা অন্তরালে সমানভাবে বিতরণ করা হয়েছিল । কোডটি এখানে:
hm <- function(x)1/mean(1/x)
sdhm <- function(x)sqrt((mean(1/x))^(-4)*var(1/x)/length(x))
n<-1000
nn <- c(10,30,50,100,500,1000,5000,10000)
N<-1000
mc<-foreach(n=nn,.combine=rbind) %do% {
rr <- matrix(runif(n*N,min=2,max=3),nrow=N)
c(n,mean(apply(rr,1,sdhm)),sd(apply(rr,1,sdhm)),sd(apply(rr,1,hm)))
}
colnames(mc) <- c("n","DeltaSD","sdDeltaSD","trueSD")
> mc
n DeltaSD sdDeltaSD trueSD
result.1 10 0.089879211 1.528423e-02 0.091677622
result.2 30 0.052870477 4.629262e-03 0.051738941
result.3 50 0.040915607 2.705137e-03 0.040257673
result.4 100 0.029017031 1.407511e-03 0.028284458
result.5 500 0.012959582 2.750145e-04 0.013200580
result.6 1000 0.009139193 1.357630e-04 0.009115592
result.7 5000 0.004094048 2.685633e-05 0.004070593
result.8 10000 0.002894254 1.339128e-05 0.002964259
আমি আকারের N
নমুনার নমুনা সিমুলেটেড n
। প্রতিটি n
আকারের নমুনার জন্য আমি স্ট্যান্ডার্ড অনুমানের ফাংশন (ফাংশন sdhm
) গণনা করি । তারপরে আমি এই অনুমানের গড় এবং মানক বিচ্যুতিটি প্রতিটি নমুনার জন্য অনুমান করা হারমোনিক গড়ের নমুনার মানক বিচ্যুতির সাথে তুলনা করি, সম্ভবত এটি হারমোনিক গড়ের সত্যিকারের প্রমিত বিচ্যুতি হওয়া উচিত।
আপনি দেখতে পাচ্ছেন যে পরিমিত নমুনার আকারগুলির জন্য ফলাফলগুলি বেশ ভাল। অবশ্যই ইউনিফর্ম বিতরণ একটি খুব ভাল আচরণ করা হয়, তাই ফলাফল ভাল হয় তা অবাক হওয়ার কিছু নেই। অন্য বিতরণগুলির আচরণ তদন্ত করার জন্য আমি অন্য কারও জন্য ছেড়ে যাব, কোডটি মানিয়ে নেওয়া খুব সহজ।
দ্রষ্টব্য: এই উত্তরের পূর্ববর্তী সংস্করণে ব-দ্বীপ পদ্ধতির ফলাফলের ক্ষেত্রে একটি ত্রুটি ছিল, ভুল বৈকল্পিক।
আমার একটি সম্পর্কিত প্রশ্নের উত্তর যে পয়েন্ট আউট ইতিবাচক তথ্য একটি সেট সমন্বয়পূর্ণ গড় একটি ভরযুক্ত হয় লিস্ট স্কোয়ার (WLS) হিসাব (ওজন সঙ্গে )। আপনি ডাব্লুএলএস পদ্ধতি ব্যবহার করে এর স্ট্যান্ডার্ড ত্রুটিটি গণনা করতে পারেন। সরলতা, সাধারণতা এবং ব্যাখ্যাযোগ্যতা সহ এর কিছু সুবিধা রয়েছে পাশাপাশি কোনও স্ট্যাটিস্টিকাল সফ্টওয়্যার দ্বারা স্বয়ংক্রিয়ভাবে উত্পাদিত হতে পারে যা তার প্রতিরোধের গণনার ক্ষেত্রে ওজনকে সহায়তা করে। 1 / x i
প্রধান অসুবিধা হ'ল গণনাটি অত্যন্ত স্কিউড অন্তর্নিহিত বিতরণগুলির জন্য ভাল আত্মবিশ্বাসের ব্যবধান তৈরি করে না। এটি কোনও সাধারণ-উদ্দেশ্য পদ্ধতিতে সমস্যা হওয়ার সম্ভাবনা রয়েছে: সুরেলা মাধ্যমটি ডেটাসেটে এমনকি একটি একক ক্ষুদ্র মানের উপস্থিতির জন্য সংবেদনশীল।
উদাহরণস্বরূপ, এখানে গামা (৫) বিতরণ (যা বিনীতভাবে আঁকানো হয়েছে) থেকে আকারের আকারের স্বতন্ত্রভাবে উত্পাদিত নমুনার অভিজ্ঞতামূলক বিতরণগুলি দেওয়া হয়েছে । নীল রেখাগুলি প্রকৃত সুরেলা গড় দেখায় (সমান ) যখন লাল ড্যাশযুক্ত রেখাগুলি ওজনযুক্ত সর্বনিম্ন স্কোয়ারের অনুমান দেখায়। নীল রেখার চারপাশে উল্লম্ব ধূসর ব্যান্ডগুলি সুরেলা গড়ের জন্য আনুমানিক দ্বিমুখী 95% আস্থা অন্তর। এই ক্ষেত্রে, সমস্ত নমুনায় সিআই সত্য সুরেলা গড়কে কভার করে। এই সিমুলেশনটির পুনরাবৃত্তিগুলি (এলোমেলো বীজ সহ) নির্দেশ করে যে কভারেজটি এই ছোট ডেটাসেটের জন্যও 95% হারের কাছাকাছি রয়েছে।এন = 12 4 20
R
সিমুলেশন এবং পরিসংখ্যানগুলির জন্য কোড এখানে ।
k <- 5 # Gamma parameter
n <- 12 # Sample size
hm <- k-1 # True harmonic mean
set.seed(17)
t.crit <- -qt(0.05/2, n-1)
par(mfrow=c(4, 5))
for(i in 1:20) {
#
# Generate a random sample.
#
x <- rgamma(n, k)
#
# Estimate the harmonic mean.
#
fit <- lm(x ~ 1, weights=1/x)
beta <- coef(summary(fit))[1, ]
message("Harmonic mean estimate is ", signif(beta["Estimate"], 3),
" +/- ", signif(beta["Std. Error"], 3))
#
# Plot the results.
#
covers <- abs(beta["Estimate"] - hm) <= t.crit*beta["Std. Error"]
plot(ecdf(x), main="Empirical CDF", sub=ifelse(covers, "", "***"))
rect(beta["Estimate"] - t.crit*beta["Std. Error"], 0,
beta["Estimate"] + t.crit*beta["Std. Error"], 1.25,
border=NA, col=gray(0.5, alpha=0.10))
abline(v = hm, col="Blue", lwd=2)
abline(v = beta["Estimate"], col="Red", lty=3, lwd=2)
}
এক্সফেনশনাল r.v এর জন্য এখানে একটি উদাহরণ।
এই আরভিটির ভেরিয়েন্স (এবং স্ট্যান্ডার্ড বিচ্যুতি) সুপরিচিত, দেখুন এখানে উদাহরণস্বরূপ ।