পক্ষপাতদুষ্ট অনুমানকারী কখন নিরপেক্ষ ব্যক্তির চেয়ে পছন্দনীয়?


38

কেন এটি নিরপেক্ষ অনুমানকারীকে বেশি পছন্দ করা যায় তা বহুবার স্পষ্ট। তবে, এমন কোনও পরিস্থিতি রয়েছে যার অধীনে আমরা বাস্তবে কোনও পক্ষপাতহীন ব্যক্তির চেয়ে পক্ষপাতদুষ্ট অনুমানকারীকে পছন্দ করতে পারি?



12
আসলে কেন এটি নিরপেক্ষ অনুমানকারীকে পছন্দ করে তা আমার কাছে স্পষ্ট নয়। বায়াস স্ট্যাটিস্টিক বইতে বুজিম্যানের মতো, পরিসংখ্যান ছাত্রদের মধ্যে অপ্রয়োজনীয় ভয় তৈরি করে। বাস্তবে তথ্যে তাত্ত্বিক পদ্ধতির শেখার জন্য সর্বদা ছোট নমুনাগুলিতে একটি পক্ষপাতমূলক অনুমানের দিকে পরিচালিত করে এবং এটি সীমাতে সামঞ্জস্যপূর্ণ।
ক্যাগডাস ওজজেঙ্ক

4
আমার কাছে ক্লায়েন্ট রয়েছে (বিশেষত আইনী ক্ষেত্রে) যারা পক্ষপাতদুষ্ট অনুমানকারীকে দৃ strongly়ভাবে পছন্দ করবেন, তবে পক্ষপাতিত্ব ব্যবস্থাপনায় তাদের পক্ষে থাকলে!
whuber

2
জেনেসের সম্ভাব্যতা তত্ত্বের ১ 17.২ ("নিরপেক্ষ অনুমানক") : বিজ্ঞানের লজিক একটি দৃষ্টান্তমূলক পক্ষপাতদুটি সত্যই বা গুরুত্বপূর্ণ নয় এবং কেন পক্ষপাতদুষ্টকে পছন্দনীয় হতে পারে (উদাহরণস্বরূপ) উদাহরণ সহ একটি অত্যন্ত অন্তর্দৃষ্টিপূর্ণ আলোচনা in নীচে চকন এর দুর্দান্ত উত্তরের সাথে লাইন)।
pglpm

1
যদি আমি চকন-জেনেসের উত্তর সংক্ষিপ্ত করতে পারি: একজন "নিরপেক্ষ" অনুমানকারী সমান পরিমাণে সঠিক মানের ডান বা বামে ভুল করতে পারে; একজন "পক্ষপাতদুষ্ট" বাম বা বিপরীত দিকে ডানদিকে আরও ভুল করতে পারে। তবে নিরপেক্ষ ব্যক্তির ত্রুটি যদিও প্রতিসাম্যপূর্ণ, পক্ষপাতদুষ্টের চেয়ে অনেক বেশি হতে পারে। চকনির প্রথম চিত্র দেখুন। অনেক পরিস্থিতিতে এটি তাত্পর্যপূর্ণ প্রতিসামগ্রী হওয়ার চেয়ে একজন অনুমানকারীটির একটি ছোট ত্রুটি থাকা আরও বেশি গুরুত্বপূর্ণ।
pglpm

উত্তর:


51

হ্যাঁ। প্রায়শই এটি হয় যে আমরা গড় স্কোয়ার ত্রুটিটি হ্রাস করতে আগ্রহী, যা ভেরিয়েন্স + বায়াস স্কোয়ারে পচে যেতে পারে । এটি মেশিন লার্নিংয়ের একটি অত্যন্ত মৌলিক ধারণা এবং সাধারণভাবে পরিসংখ্যান। প্রায়শই আমরা দেখতে পাই যে পক্ষপাতের ক্ষেত্রে সামান্য বৃদ্ধি পুরো পরিমাণে এমএসই হ্রাস হ্রাস করে বৈকল্পিকতায় যথেষ্ট পরিমাণ হ্রাস নিয়ে আসতে পারে।

β^R=(XTX+λI)1XTYXVar(β^)(XTX)1Var(β^R)

k=1k=1

অবশেষে, এখানে একটি ছবি। মনে করুন যে এটি দুটি অনুমানকারীদের নমুনা বিতরণ এবং আমরা 0 টি অনুমান করার চেষ্টা করছি The চাটুকারটি একটি পক্ষপাতহীন, তবে আরও অনেক পরিবর্তনশীল। সামগ্রিকভাবে আমি মনে করি আমি পক্ষপাতদুষ্টটি ব্যবহার করতে পছন্দ করব, কারণ গড়পড়তা হলেও আমরা সঠিক হতে পারি না, সেই অনুমানের কোনও একক উদাহরণের জন্য আমরা আরও নিকটে থাকব।

পক্ষপাত-ভ্যারিয়েন্স

 
হালনাগাদ

X

X4×3XTX

x <- cbind(0:3, 2:5, runif(4, -.001, .001)) ## almost reduced rank

> x
     [,1] [,2]        [,3]
[1,]    0    2 0.000624715
[2,]    1    3 0.000248889
[3,]    2    4 0.000226021
[4,]    3    5 0.000795289

(xtx <- t(x) %*% x) ## the inverse of this is proportional to Var(beta.hat)

           [,1]        [,2]        [,3]
[1,] 14.0000000 26.00000000 3.08680e-03
[2,] 26.0000000 54.00000000 6.87663e-03
[3,]  0.0030868  0.00687663 1.13579e-06

eigen(xtx)$values ## all eigenvalues > 0 so it is PD, but not by much

[1] 6.68024e+01 1.19756e+00 2.26161e-07


solve(xtx) ## huge values

           [,1]        [,2]        [,3]
[1,]   0.776238   -0.458945     669.057
[2,]  -0.458945    0.352219    -885.211
[3,] 669.057303 -885.210847 4421628.936

solve(xtx + .5 * diag(3)) ## very reasonable values

             [,1]         [,2]         [,3]
[1,]  0.477024087 -0.227571147  0.000184889
[2,] -0.227571147  0.126914719 -0.000340557
[3,]  0.000184889 -0.000340557  1.999998999

আপডেট 2

প্রতিশ্রুতি হিসাবে, এখানে আরও পুঙ্খানুপুঙ্খ উদাহরণ's

X1,...,Xn iid N(μ,σ2)μ

T1(X1,...,Xn)=X1μnμT1

T1T2(X1,...,Xn)=X1+X22Tn(X1,...,Xn)=X1+...+XnnVar(T1)=σ2Var(T2)=σ22Var(Tn)=σ2nn>2 Tn

TθMSE(T)=E((Tθ)2)MSE(T)=Var(T)+Bias(T)2Bias(T)=E(T)θ

TMSE(T)=Var(T)=Bias(T)2=Var(T)

Var(T)+Bias(T)2Bias(T)=0T

θT1T5T1T5T1T5θT1T5T3T1

VBtradeoff

Tλ(X,Y)=(XTX+λI)1XTYλTλ


ছবিটিই আমি বুঝতে পেরেছি। আপনার কি ছবিটির সাথে মিলে এমন আরও সহজ উদাহরণ রয়েছে? অনুমানকারীদের এই আকারগুলি কী হবে?
স্টান শানপাইক

আমি আগামীকাল আরও বিস্তারিত উদাহরণ পোস্ট করব।
jld

@ স্ট্যানশানপাইক আমি একটি দীর্ঘ আপডেট যোগ করেছি। এটি যদি বিষয়গুলি পরিষ্কার করতে সহায়তা করে তবে আমাকে জানান।
jld

সম্ভবত আমার পক্ষে যে কোনও প্রশ্নের উত্তর দেওয়ার জন্য যে কেউ সবচেয়ে চেষ্টা করেছেন। অনেক ধন্যবাদ.
স্টান শানপাইক

1
@ ইউলিভিয়া আমি এমন একক অ-তুচ্ছ মামলার কথা ভাবতে পারি না যেখানে পক্ষপাতিত্বই আমার একমাত্র মানদণ্ড যা আমি যত্নশীল (যদিও এরকম ঘটনাও হতে পারে যা সম্পর্কে আমি কেবল জানি না!) যদিও এমন কিছু সময় আছে যখন পক্ষপাতটি জানা থাকে একটি প্রভাবশালী ফ্যাক্টর হোন (উদাহরণস্বরূপ, আরআইএমএল বিবেচনা করুন, যেখানে পক্ষপাত যথেষ্ট তীব্র যে এটি সম্পর্কে কিছু করা উপযুক্ত)। আমি মনে করি আপনি যা করছেন তা কেবল আপনার একটি নির্দিষ্ট অনুমানকারী সত্যের কাছাকাছি থাকতে পারে না এবং এমএসই এটি করে।
jld

2

দুটি কারণ মাথায় আসে, উপরের এমএসই ব্যাখ্যাটি বাদ দিয়ে (প্রশ্নের সাধারণভাবে গৃহীত উত্তর):

  • ঝুঁকি পরিচালনা
  • দক্ষ পরীক্ষা

T(X)=X¯nX¯nϵθ0θn বলের সীমানায়, এটি একটি বেমানান পরীক্ষায় পরিণত হয়, এটি কখনই জানে না কী চলছে এবং ঝুঁকিটি বিস্ফোরিত হয়।

Γ(α,βn)

Tθ(X)=XiI(Xi<θ)/I(Xi<θ)

দক্ষ পরীক্ষার অর্থ হল আপনার আগ্রহী জিনিসটি আপনি অনুমান করবেন না, তবে এটির একটি প্রায় অনুমান, কারণ এটি আরও শক্তিশালী পরীক্ষা সরবরাহ করে। আমি এখানে সবচেয়ে ভাল উদাহরণটি বলতে পারি লজিস্টিক রিগ্রেশন। মানুষ সর্বদাআপেক্ষিক ঝুঁকি রিগ্রেশন সঙ্গে লজিস্টিক রিগ্রেশন বিভ্রান্ত। উদাহরণস্বরূপ, ধূমপায়ীদের ধূমপায়ীদের তুলনায় ক্যান্সারের তুলনায় 1.6-এর একটি অনুপাতের অর্থ এই নয় যে "ধূমপায়ীদের মধ্যে ক্যান্সারের ঝুঁকি ছিল 1.6"। BZZT ভুল। এটি একটি ঝুঁকি অনুপাত। তাদের প্রযুক্তিগতভাবে ফলাফলের 1.6 গুণ প্রতিকূলতা ছিল (অনুস্মারক: বিজোড়গুলি = সম্ভাবনা / (1-সম্ভাব্যতা))। যাইহোক, বিরল ইভেন্টগুলির জন্য, প্রতিকূলতা অনুপাত ঝুঁকির অনুপাতের প্রায় কাছাকাছি। আপেক্ষিক ঝুঁকি রিগ্রেশন রয়েছে, তবে রূপান্তরকরণের সাথে এটির অনেকগুলি সমস্যা রয়েছে এবং এটি লজিস্টিক রিগ্রেশন হিসাবে শক্তিশালী নয়। সুতরাং আমরা আরআর এর একটি পক্ষপাতিত্বমূলক অনুমান হিসাবে রিপোর্ট করি (বিরল ঘটনাগুলির জন্য), এবং আরও দক্ষ সিআই এবং পি-মান গণনা করি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.