এটি একটি উদ্বেগজনক ধারণা, কারণ স্ট্যান্ডার্ড বিচ্যুতিটির প্রাক্কলনকারী সাধারণত মূল-গড়-বর্গের পদ্ধতির তুলনায় বহিরাগতদের কাছে কম সংবেদনশীল বলে মনে হয়। তবে আমি সন্দেহ করি যে এই অনুমানটি প্রকাশিত হয়েছে। তিনটি কারণ রয়েছে: এটি গণনামূলকভাবে অদক্ষ, এটি পক্ষপাতদুষ্ট এবং এমনকি যখন পক্ষপাত সংশোধন করা হয়, তখন এটি পরিসংখ্যানগতভাবে অক্ষম (তবে কেবলমাত্র সামান্য)। এগুলি একটি প্রাথমিক প্রাথমিক বিশ্লেষণের সাথে দেখা যায়, তাই আসুন প্রথমে এটি করা যাক এবং তারপরে সিদ্ধান্তগুলি আঁকুন।
বিশ্লেষণ
μσ( এক্সআমি, এক্সঞ)
μ^( এক্সআমি, এক্সঞ) = এক্সআমি+ এক্সঞ2
এবং
σ^( এক্সআমি, এক্সঞ) = | এক্সআমি- এক্সঞ|2।
সুতরাং প্রশ্নে বর্ণিত পদ্ধতিটি হ'ল
μ^( এক্স1, এক্স2, … , এক্সএন) = 2এন ( এন - 1 )Σi > জেএক্সআমি+ এক্সঞ2= 1এনΣi = 1এনএক্সআমি,
যা গড়ের স্বাভাবিক অনুমানকারী এবং
σ^( এক্স1, এক্স2, … , এক্সএন) = 2এন ( এন - 1 )Σi > জে| এক্সআমি- এক্সঞ|2= 1এন ( এন - 1 )Σi , j| এক্সআমি- এক্সঞ| ।
ই= ই ( | এক্স)আমি- এক্সঞ| )আমিঞ
E ( σ^( এক্স1, এক্স2, … , এক্সএন) ) = 1এন ( এন - 1 )Σi , jE ( | x x)আমি- এক্সঞ| )=ই।
এক্সআমিএক্সঞ2 σ22-√σχ ( 1 )2 / π---√
ই= 2π--√σ।
2 / π--√12 1.128
σ^
উপসংহার
σ^এন = 20 , 000
Σi , j| এক্সআমি- এক্সঞ|ও ( এন)2)ও ( এন )এন10 , 000R
। (অন্যান্য প্ল্যাটফর্মে র্যামের প্রয়োজনীয়তা খুব কম হবে, সম্ভবত গণনার সময় সামান্য ব্যয়ে))
এটি পরিসংখ্যানগতভাবে অদক্ষ। এটিকে সর্বোত্তম প্রদর্শনের জন্য, আসুন নিরপেক্ষ সংস্করণটি বিবেচনা করুন এবং একে সর্বনিম্ন স্কোয়ার বা সর্বাধিক সম্ভাবনা অনুমানকারকের নিরপেক্ষ সংস্করণটির সাথে তুলনা করুন
σ^OLS=(1n−1∑i=1n(xi−μ^)2)−−−−−−−−−−−−−−−−−−⎷(n−1)Γ((n−1)/2)2Γ(n/2).
R
n=3n=300σ^OLSσ
পরে
σ^
কোড
sigma <- function(x) sum(abs(outer(x, x, '-'))) / (2*choose(length(x), 2))
#
# sigma is biased.
#
y <- rnorm(1e3) # Don't exceed 2E4 or so!
mu.hat <- mean(y)
sigma.hat <- sigma(y)
hist(y, freq=FALSE,
main="Biased (dotted red) and Unbiased (solid blue) Versions of the Estimator",
xlab=paste("Sample size of", length(y)))
curve(dnorm(x, mu.hat, sigma.hat), col="Red", lwd=2, lty=3, add=TRUE)
curve(dnorm(x, mu.hat, sqrt(pi/4)*sigma.hat), col="Blue", lwd=2, add=TRUE)
#
# The variance of sigma is too large.
#
N <- 1e4
n <- 10
y <- matrix(rnorm(n*N), nrow=n)
sigma.hat <- apply(y, 2, sigma) * sqrt(pi/4)
sigma.ols <- apply(y, 2, sd) / (sqrt(2/(n-1)) * exp(lgamma(n/2)-lgamma((n-1)/2)))
message("Mean of unbiased estimator is ", format(mean(sigma.hat), digits=4))
message("Mean of unbiased OLS estimator is ", format(mean(sigma.ols), digits=4))
message("Variance of unbiased estimator is ", format(var(sigma.hat), digits=4))
message("Variance of unbiased OLS estimator is ", format(var(sigma.ols), digits=4))
message("Efficiency is ", format(var(sigma.ols) / var(sigma.hat), digits=4))
x <- c(rnorm(30), rnorm(30, 10))