লিনিয়ার মডেলগুলির জন্য ব্লু (ওএলএস সমাধান) ব্যতীত অন্য পক্ষপাতহীন অনুমানকারী


15

রৈখিক মডেলের জন্য ওএলএস দ্রবণটি পরামিতিগুলির জন্য সর্বোত্তম রৈখিক নিরপেক্ষ अनुमानক সরবরাহ করে।

অবশ্যই আমরা নিম্ন বৈকল্পিকের জন্য পক্ষপাতের সাথে ব্যবসা করতে পারি, যেমন রিজ রিগ্রেশন। তবে আমার প্রশ্নটি কোনও পক্ষপাতিত্ব না হওয়া সম্পর্কিত regarding কিছু অন্যান্য অনুমানক রয়েছে যা কিছুটা সাধারণভাবে ব্যবহৃত হয়, যা নিরপেক্ষ তবে ওএলএস অনুমান পরামিতিগুলির চেয়ে উচ্চতর বৈকল্পিক সহ?

যদি আমার কাছে একটি বিশাল ডেটা সেট থাকে আমি অবশ্যই এটির উপ-নমুনা করতে পারি এবং কম ডেটা সহ পরামিতিগুলি অনুমান করতে পারি এবং বৈচিত্রটি বাড়িয়ে তুলি। আমি ধরে নিই এটি অনুমানমূলকভাবে কার্যকর হতে পারে।

এটি একটি অলঙ্কৃত প্রশ্নটির বেশি, কারণ যখন আমি ব্লু অনুমানকারী সম্পর্কে পড়েছি, তখন এর চেয়ে খারাপ বিকল্প সরবরাহ করা হয় না। আমি অনুমান করি যে খারাপ বিকল্প সরবরাহ করা মানুষকে ব্লু অনুমানকারীগুলির ক্ষমতা আরও ভালভাবে বুঝতে সহায়তা করতে পারে।


সর্বাধিক সম্ভাবনা অনুমানকারী সম্পর্কে কী? উদাহরণস্বরূপ আপনি যদি ভাবেন যে আপনার ডেটা তুলনামূলকভাবে কম ডিগ্রি সহ স্বাধীনতা প্যারামিটার ( টি ( 3 ) বা টি ( 4 ) আর্থিক রিটার্নের বৈশিষ্ট্যযুক্ত ) এর সাথে বিতরণ থেকে নমুনা তৈরি করা হয় তবে সর্বাধিক সম্ভাবনা অনুমানকারী ওএলএসের সাথে মিলবে না তবে আমার ধারণা এটি এখনও পক্ষপাতহীন হবে। tt(3)t(4)
রিচার্ড হার্ডি


1
রিচার্ড হার্দি, আপনি প্রত্যাশিত ফলাফল নিয়ে আমিও এমএলই চেষ্টা করেছিলাম।
ক্রিস্টোফ হ্যাঙ্ক

উত্তর:


19

একটি উদাহরণ যা মাথায় আসে তা হ'ল কিছু জিএলএস অনুমানকারী যা পর্যবেক্ষণকে আলাদাভাবে ওজন দেয় যদিও গাউস-মার্কভ অনুমানগুলি পূরণ করা হলে এটি প্রয়োজন হয় না (যা পরিসংখ্যানবিদ সম্ভবত এটি ক্ষেত্রে জানেন না এবং তাই এখনও প্রয়োগ করতে পারেন GLS)।

একটি রিগ্রেশন ক্ষেত্রে বিবেচনা yi , i=1,,n চিত্রণ জন্য একটি ধ্রুবক উপর (নির্দ্ধিধায় সাধারণ GLS estimators করার সাধারণীকরণ)। এখানে, {yi} গড় μ এবং বৈকল্পিক σ2 সহ একটি জনসংখ্যার থেকে এলোমেলো নমুনা হিসাবে ধরে নেওয়া হয় ।

এর পরে, আমরা জানি যে OLS ঔজ্জ্বল্যের প্রেক্ষাপটে ঠিক হয় β = ˉ Y , নমুনা গড়। পয়েন্ট জোরালো করতে প্রতিটি পর্যবেক্ষণ ওজনের পরিমেয় হয় 1 / এন , যেমন এই লিখতে β = Σ আমি = 1 1β^=y¯1/এন

β^=Σi=1এন1এনYআমি
এটা তোলে সুপরিচিত যেVar(β^)=σ2/n

এখন, আরেকটি অনুমানকারী বিবেচনা করুন যা

β~=i=1nwiyi,
হিসাবে লেখা যেতে পারে , যেখানে ওজন এমন iwi=1 । এটি নিশ্চিত করে যে মূল্নির্ধারক পক্ষপাতিত্বহীন, যেমন হয়
E(i=1nwiyi)=i=1nwiE(yi)=i=1nwiμ=μ.
wi=1/ni

L=V(β~)λ(iwi1)=iwi2σ2λ(iwi1),
wi2σ2wiλ=0iL/λ=0iwi1=0. Solving the first set of derivatives for λ and equating them yields wi=wj, which implies wi=1/n minimizes the variance, by the requirement that the weights sum to one.

Here is a graphical illustration from a little simulation, created with the code below:

EDIT: In response to @kjetilbhalvorsen's and @RichardHardy's suggestions I also include the median of the yi, the MLE of the location parameter pf a t(4) distribution (I get warnings that In log(s) : NaNs produced that I did not check further) and Huber's estimator in the plot.

এখানে চিত্র বর্ণনা লিখুন

We observe that all estimators seem to be unbiased. However, the estimator that uses weights wi=(1±ϵ)/nযেমন নমুনার অর্ধেকের জন্য ওজন বেশি পরিবর্তনশীল, তেমনি মিডিয়ান, টি-ডিস্ট্রিবিউশনের এমএলই এবং হুবারের অনুমানকারী (পরে কিছুটা সামান্য তাই এখানেও দেখুন )।

যে তিনটি ওএলএস সমাধান দ্বারা দক্ষ হয়ে উঠেছে তা অবিলম্বে নূন্য সম্পত্তি দ্বারা নিহিত নয় (কমপক্ষে আমার কাছে নয়), কারণ তারা লিনিয়ার অনুমানকারী কিনা তা স্পষ্ট নয় (এমএলই এবং হুবার পক্ষপাতহীন কিনা তাও আমি জানি না)।

library(MASS)
n <- 100      
reps <- 1e6

epsilon <- 0.5
w <- c(rep((1+epsilon)/n,n/2),rep((1-epsilon)/n,n/2))

ols <- weightedestimator <- lad <- mle.t4 <- huberest <- rep(NA,reps)

for (i in 1:reps)
{
  y <- rnorm(n)
  ols[i] <- mean(y)
  weightedestimator[i] <- crossprod(w,y)  
  lad[i] <- median(y)   
  mle.t4[i] <- fitdistr(y, "t", df=4)$estimate[1]
  huberest[i] <- huber(y)$mu
}

plot(density(ols), col="purple", lwd=3, main="Kernel-estimate of density of OLS and other estimators",xlab="")
lines(density(weightedestimator), col="lightblue2", lwd=3)     
lines(density(lad), col="salmon", lwd=3)     
lines(density(mle.t4), col="green", lwd=3)
lines(density(huberest), col="#949413", lwd=3)
abline(v=0,lty=2)
legend('topright', c("OLS","weighted","median", "MLE t, 4 df", "Huber"), col=c("purple","lightblue","salmon","green", "#949413"), lwd=3)

2
ঝরঝরে! আমি মনে করি এটি একটি খুব সাধারণ উদাহরণস্বরূপ উদাহরণ, আমি যেটির সাথে এসেছি তার চেয়ে সামান্য সাধারণ। লোকেরা যখন ঘন ঘন মন্ডিত স্থাপনায় অনুমানকারী সম্পর্কে শিখছে তখন আমি অনুভব করি যে এই ধরণের উদাহরণগুলি প্রায়শই অনুপস্থিত থাকে, তারা সত্যই আপনাকে ধারণাটির আরও ভাল উপলব্ধি পেতে সহায়তা করে।
গুমেও

4
আর একটি সম্ভাবনা হ'ল (শক্তিশালী) অনুমানকারী যেমন কোনও মানদণ্ড হ্রাস করার উপর ভিত্তি করে ওয়াট=Σআমি=1এনW(আমি) কোথায় আমি ith অবশিষ্টাংশ এবং W কিছু বৈকল্পিক ক্রিয়াকলাপ, উত্তল বা নন-উত্তল, (গ্লোবাল) সর্বনিম্ন 0, W(0)=0। হুবার প্রাক্কলনকারী একটি উদাহরণ হতে পারে।
কেজেটিল বি হালওয়ারসেন

1
@ কেজেটিভালভর্সেন, আমি এখন হুবারের প্রাক্কলনকারীকেও অন্তর্ভুক্ত করছি, যা আসলে পরিবর্তিতভাবে ভাল করে।
ক্রিস্টোফ হ্যাঙ্ক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.