কোনও মধ্য-নিরপেক্ষ অনুমানকটি কি সর্বনিম্ন বিচ্যুততার অর্থ হ্রাস করে?


14

এই ফলো-আপ কিন্তু একটি ভিন্ন প্রশ্ন হল আমার আগের এক

আমি উইকিপিডিয়ায় পড়েছি যে " একজন মিডিয়াসহ নিরপেক্ষ অনুমানক ল্যাপ্লেসের দ্বারা পর্যবেক্ষণ অনুসারে নিখুঁত-বিচ্যুতি লোকসানের কার্যকারিতা সম্পর্কিত ঝুঁকি হ্রাস করে ।" তবে, আমার মন্টি কার্লো সিমুলেশন ফলাফলগুলি এই যুক্তি সমর্থন করে না।

আমি লগ-সাধারণ জনসংখ্যা, থেকে একটি নমুনা ধরে নিই , এক্স এনএলএন ( μ , σ 2 )এক্স1,এক্স2,,এক্সএন~LN(μ,σ2) , যেখানে, এবং লগ-মধ্য এবং লগ-এসডি,σ β = Exp ( μ ) = 50μσβ=মেপুঃ(μ)=50

জ্যামিতিক-গড় অনুমানকারী জনসংখ্যার মধ্যম জন্য একটি মধ্য-নিরপেক্ষ অনুমানক ,মেপুঃ(μ)

β^জিএম=মেপুঃ(μ^)=মেপুঃ(Σলগ(এক্সআমি)এন)~LN(μ,σ2/এন) যেখানে, এবং লগ-গড় এবং লগ ইন করুন-SD হয় \ টুপি \ মিউ এবং \ টুপি \ সিগমা জন্য MLEs হয় \ মিউ এবং \ সিগমাσ μ σ μ σμσμ^σ^μσ

একটি সংশোধিত জ্যামিতিক-গড় অনুমানক জনসংখ্যার মধ্যমাধ্যমের জন্য গড়-নিরপেক্ষ অনুমানক।

β^CG=exp(μ^σ^2/2N)

আমি এলএন (\ লগ (50), \ বর্গক্ষেত্র {\ লগ (1 + 2 ^ 2) repeatedly) থেকে বার বার 5 টি আকারের নমুনা উত্পন্ন করি (log(50),log(1+22))। প্রতিলিপি সংখ্যা 10,000 আমি পেয়েছি গড় পরম বিচ্যুতিগুলি জ্যামিতিক-গড় অনুমানের জন্য 25.14 এবং সংশোধিত জ্যামিতিক-গড়ের জন্য 22.92 are কেন?

বিটিডাব্লু, জ্যামিতিক গড়ের জন্য আনুমানিক মধ্যম পরম বিচ্যুতিগুলি 18.18 এবং সংশোধিত জ্যামিতিক-গড় অনুমানের জন্য 18.58।

আমি যে আর স্ক্রিপ্টটি ব্যবহার করেছি তা এখানে রয়েছে:

#```{r stackexchange}
#' Calculate the geomean to estimate the lognormal median.
#'
#' This function Calculate the geomean to estimate the lognormal
#' median.
#'
#' @param x a vector.
require(plyr)
GM <- function(x){
    exp(mean(log(x)))
}
#' Calculate the bias corrected geomean to estimate the lognormal
#' median.
#'
#' This function Calculate the bias corrected geomean using the
#' variance of the log of the samples, i.e., $\hat\sigma^2=1/(n-1)
# \Sigma_i(\Log(X_i)-\hat\mu)^2$
#'
#' @param x a vector.
BCGM <- function(x){
y <- log(x)
exp(mean(y)-var(y)/(2*length(y)))
}
#' Calculate the bias corrected geomean to estimate the lognormal
#' median.
#'
#' This function Calculate the bias corrected geomean using
#' $\hat\sigma^2=1/(n)\Sigma_i(\Log(X_i)-\hat\mu)^2$
#'
#' @param x a vector.
CG <- function(x){
y <- log(x)
exp(mean(y)-var(y)/(2*length(y))*(length(y)-1)/length(y))
}

############################

simln <- function(n,mu,sigma,CI=FALSE)
{
    X <- rlnorm(n,mu,sigma)
    Y <- 1/X
    gm <- GM(X)
    cg <- CG(X)
    ##gmk <- log(2)/GM(log(2)*Y) #the same as GM(X)
    ##cgk <- log(2)/CG(log(2)*Y)
    cgk <- 1/CG(Y)
    sm <- median(X)
    if(CI==TRUE) ci <- calCI(X)
    ##bcgm <- BCGM(X)
    ##return(c(gm,cg,bcgm))
    if(CI==FALSE) return(c(GM=gm,CG=cg,CGK=cgk,SM=sm)) else return(c(GM=gm,CG=cg,CGK=cgk,CI=ci[3],SM=sm))
}
cv <-2
mcN <-10000
res <- sapply(1:mcN,function(i){simln(n=5,mu=log(50),sigma=sqrt(log(1+cv^2)), CI=FALSE)})
sumres.mad <- apply(res,1,function(x) mean(abs(x-50)))
sumres.medad <- apply(res,1,function(x) median(abs(x-50)))
sumres.mse <- apply(res,1,function(x) mean((x-50)^2))
#```

#```{r eval=FALSE}
#> sumres.mad
      GM       CG      CGK       SM 
#25.14202 22.91564 29.65724 31.49275 
#> sumres.mse
      GM       CG      CGK       SM 
#1368.209 1031.478 2051.540 2407.218 
#```

1
১) "10,000" আপনার প্রশ্নের পক্ষে খুব ছোট - "250,000" (বা আরও) চেষ্টা করুন। ২) যদি আপনি একটি মন্টি কার্লো সিমুলেশন চালান এবং অদ্ভুত বলে মনে হয় এমন কোনও ফলাফল পান তবে এর সাথে বীজ পরিবর্তন করার চেষ্টা করুন set.seed। ৩) উইকিপিডিয়াকে সর্বদা বিশ্বাস করবেন না - আপনার উদ্ধৃত পাঠ্যটি ("মিডিয়ান" নিবন্ধ থেকে) এই অন্যান্য উইকিপিডিয়া নিবন্ধ থেকে কীভাবে আলাদা হয় তা নোট করুন) ) আপনার আর কোডটি মোটামুটি গণ্ডগোল - কিছুটির জন্য গুগলের আর স্টাইল গাইডটি পরীক্ষা করে দেখুন ভাল শৈলী নির্দেশিকা।
স্টিভ এস

উত্তর:


4

যদি আমরা কোনও মানদণ্ডের দ্বারা একটি অনুমানকারী চয়ন করি যে এটি সত্য মান থেকে প্রত্যাশিত পরম ত্রুটিটি হ্রাস করে αα+ +α

= <|α+ +-α|> =-α+ +(α+ +-α)(α)α+ +α+ +(α-α+ +)(α)α

আমরা প্রয়োজন

α+ +=-α+ +(α)α-α+ +(α)α=0

যা সমান । সুতরাং 1774-এ নিম্নলিখিত ল্যাপ্লেস হিসাবে মিডিয়ান হিসাবে দেখানো হয়েছে।P(α>α+)=1/2α+

আর এর সাথে যদি আপনার সমস্যা হয় তবে দয়া করে স্ট্যাক ওভারফ্লো সম্পর্কে অন্য কোনও প্রশ্নে এটি জিজ্ঞাসা করুন


তাত্ত্বিকভাবে, আমি এটি সঠিক বলে মনে করি। যাইহোক, আমি আর সিমুলেশন ফলাফলগুলি দ্বারা বিভ্রান্ত হয়েছি যা প্রত্যাশা অনুযায়ী এই বিবৃতি ব্যাক আপ করে না।
ঝেংলেই

2
আমি একজন ডেটা সায়েন্টিস্ট / পদার্থবিজ্ঞানী তাই আর এর কোনও লাইন কখনও দেখিনি। আমি যেমন প্রশ্নে পরামর্শ দিয়েছিলাম, এটি যদি কোনও কোড সমস্যা হয় তবে আপনার স্ট্যাক ওভারফ্লোতে এটি জিজ্ঞাসা করা উচিত এবং আপনি আরও বেশি মনোযোগ পাবেন। তবে উপরের উত্তরটি সঠিক যদি না আপনি এটি কোনও মধ্য-নিরপেক্ষ অনুমানকারীকে কীভাবে জেনারেলাইজ করেন তা বিস্তারিতভাবে বলতে চাই না। আরও তথ্যের জন্য দেখুন ইটি জেনেস বইয়ের সম্ভাব্যতা তত্ত্বের আইএসবিএন 978-0-521-59271-0 এর পৃষ্ঠা 172 দেখুন।
কিথ

আপনার উত্তরের জন্য আপনাকে অনেক ধন্যবাদ। এটি কোনও কোডিংয়ের সমস্যা নয়। আমি কেবল এটি দেখানোর জন্য সিমুলেশনগুলি করতে চাই যে কোনও মধ্য-নিরপেক্ষ অনুমানক প্রত্যাশিত পরম বিচ্যুতি হ্রাস করবে। আমি উত্তরটি গ্রহণ করিনি কারণ আমি সিমুলেশন পদক্ষেপটি সম্পর্কে মূলত বিভ্রান্ত। আমি এটি আর তে প্রয়োগ করেছি তবে মতলব বা পাইথন বা অন্য কোনও ভাষায় সিমুলেশনগুলি করা যেতে পারে।
ঝেংলেই

2
আমি সন্দেহ করি যে সমস্যাটি হ'ল আপনি এমন একটি অনুমানের সাথে কাজ করছেন যা এন -> হিসাবে কাজ করে তবে আপনার 10,000 এবং 5 টি হ'ল উভয়ই অল্প সংখ্যক। সম্ভবত আপনি তিনটি প্রশ্ন জিজ্ঞাসা করা ভাল। কেন এটি তত্ত্বের ক্ষেত্রে সত্য, কখন এন বাস্তবিকভাবে যথেষ্ট বড় এবং যদি আপনার আর কোডে কোনও সমস্যা থাকে। আমি প্রথমটি উত্তর দিয়েছি, দ্বিতীয়টি মূলত গণনাযোগ্য তবে এই নির্দিষ্ট ক্ষেত্রে থাম্বের একটি ভাল নিয়ম থাকতে পারে এবং তৃতীয়টি স্ট্যাক ওভারফ্লোতে অন্তর্ভুক্ত।
কিথ

@ কিথ আমার দুর্বল গণিতের জন্য দুঃখিত, তবে আপনি কীভাবে প্রত্যাশাটি অর্জন করেছেন সে সম্পর্কে আরও বিশদ প্রদর্শন করতে পারেন?
আদম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.