কোন মডেলগুলির জন্য এমএলইয়ের পক্ষপাতিত্ব তারতম্যের চেয়ে দ্রুত পড়ে?


14

θ^θnΘ - θ *θ^θহে ( 1 / এন )O(1/n) θ -θ*Eθ^θEˆθˆθEθ^θ^O(1/n)O(1/n)

আমি চেয়ে দ্রুত সঙ্কোচিত এমন মডেলগুলিতে আগ্রহী , তবে যেখানে ত্রুটিটি এই দ্রুত হারে সঙ্কুচিত হয় না কারণ বিচ্যুতিটি এখনও হিসাবে সঙ্কুচিত হয় । বিশেষত, আমি কোনও মডেলের পক্ষপাতের জন্য O (1 / n) হারে সঙ্কুচিত হওয়ার পর্যাপ্ত শর্তগুলি জানতে চাই ।O(1/n)O(1/n)O(1/n)O(1/n)O(1/n)O(1/n)


নেই Θ - θ *= ( θ - θ * ) 2θ^θ=(θ^θ)2 ? না?
অ্যালেকোস পাপাদোপল্লোস

আমি বিশেষত L2 আদর্শ সম্পর্কে জিজ্ঞাসা করছিলাম, হ্যাঁ। তবে আমি অন্যান্য নিয়মের সাথেও আগ্রহী যদি প্রশ্নটির উত্তর দেওয়া সহজ করে দেয়।
মাইক ইজবিকি

( Θ - θ * ) 2 হে পি ( 1 / এন )(θ^θ)2 হ'ল । Op(1/n)
অ্যালেকোস পাপাদোপল্লোস

দুঃখিত, আমি আপনার মন্তব্য ভুল পড়ে। মাত্রার এল 2 আদর্শের জন্য, t , এবং সুতরাং এর হারে রয়েছে । আমি সম্মত হই যে আমরা যদি এটি স্কোয়ার করি তবে এটি হিসাবে রূপান্তরিত হবে । d da - b = d i = 1 ( a i - b i ) 2(1/ )ab=di=1(aibi)2এন )(1/এন)O(1/n)O(1/n)
মাইক ইজবিকি

আপনি কি রিজ রিগ্রেশন (হোয়ারেল এবং কেনার্ড ১৯ 1970০) কাগজটি দেখেছেন? আমি বিশ্বাস করি এটি ডিজাইন ম্যাট্রিক্স + পেনাল্টিতে শর্ত দেয় যেখানে এটি সত্য বলে প্রত্যাশিত।
dcl

উত্তর:


5

সাধারণভাবে, আপনার এমন মডেলগুলি দরকার যেখানে এমএলই তাত্পর্যপূর্ণভাবে স্বাভাবিক নয় তবে কিছু অন্যান্য বিতরণে রূপান্তরিত হয় (এবং এটি দ্রুত হারে এটি করে)। এটি সাধারণত ঘটে যখন অনুমানের অধীনে প্যারামিটার প্যারামিটার স্পেসের সীমানায় থাকে। স্বজ্ঞাতভাবে, এর অর্থ হ'ল এমএলই প্যারামিটারটির কাছে "কেবল একপাশ থেকে" যাবে, সুতরাং এটি প্যারামিটারের "পিছনে পিছনে" গিয়ে "বিভ্রান্ত" না হওয়ায় এটি "রূপান্তর গতিতে উন্নতি করে"।

একটি স্ট্যান্ডার্ড উদাহরণ, এর আইআইডি নমুনায় এমএলই taθ ইউ ( 0 , θ )θU(0,θ) অভিন্ন আরভি এর দ্য MLE এখানে সর্বোচ্চ অর্ডার পরিসংখ্যাত হয়,

Θ এন=U(এন)

θ^n=u(n)

এর সীমাবদ্ধ নমুনা বিতরণ হয়

এফ θ এন = ( θ এন ) এনθ n ,θ = ( θ এন ) এন - 1n

Fθ^n=(θ^n)nθn,fθ^=n(θ^n)n1θn

E(ˆθn)=nn+1θB(ˆθ)=1n+1θ

E(θ^n)=nn+1θB(θ^)=1n+1θ

সুতরাং B(ˆθn)=O(1/n)B(θ^n)=O(1/n) । তবে একই বর্ধিত হার বৈচিত্রের জন্যও ধরে রাখবে।

সীমাবদ্ধ বিতরণ পেতে যে কেউ তা যাচাই করতে পারে, যেহেতু আমাদের চলক , (যেমন আমাদের দিয়ে স্কেল করা দরকার )n(θˆθn)n(θθ^n)nn

P[n(θˆθn)z]=1P[ˆθnθ(z/n)]

P[n(θθ^n)z]=1P[θ^nθ(z/n)]

=11θn(θ+zn)n=1θnθn(1+z/θn)n

=11θn(θ+zn)n=1θnθn(1+z/θn)n

1ez/θ

1ez/θ

এটি এক্সপেনশিয়াল বিতরণের সিডিএফ F

আমি আশা করি এটি কিছু দিকনির্দেশনা দেয়।


এটি কাছাকাছি আসছে, তবে পক্ষপাতগুলি পরিবর্তনের চেয়ে দ্রুত সঙ্কুচিত হওয়া পরিস্থিতিতে আমি বিশেষভাবে আগ্রহী।
মাইক ইজবিকি

2
@ মাইকআইজবিকি হুম ... পক্ষপাতিত্ব বিতরণের প্রথম মুহুর্তের উপর নির্ভর করে এবং (এর বর্গমূল) বৈচিত্রটিও একটি "প্রথম-আদেশ" প্রস্থতা। আমি তখনও নিশ্চিত নই যে এটি হওয়া সম্ভব because কারণ এটি প্রদর্শিত হবে বলে মনে হয় যে সীমিত বিতরণের মুহূর্তগুলি একে অপরের সাথে সামঞ্জস্যপূর্ণ নয় এমন রূপান্তর হারে "উত্থিত" হবে ... যদিও আমি এটি সম্পর্কে ভাবব।
এলেকোস পাপাদোপল্লোস

2

আমার অন্যান্য উত্তরে মন্তব্যগুলি অনুসরণ করে (এবং ওপি'র প্রশ্নের শিরোনামটি আবার দেখুন!) এখানে ইস্যুটির খুব কঠোর তাত্ত্বিক অনুসন্ধান নেই।

আমরা তা নির্ধারণ করতে চান কিনা বায়াস বি ( θ এন ) = ( θ এন ) - θ ভ্যারিয়েন্স বর্গমূল চেয়ে ভিন্ন অভিসৃতি হার থাকতে পারে,B(θ^n)=E(θ^n)θ

বি ( θ এন ) = হে ( 1 / এন δ ) ,Var ( θ এন ) =হে(1/এন γ ),γ δ? ? ?

B(θ^n)=O(1/nδ),Var(θ^n)=O(1/nγ),γδ???

আমাদের আছে

বি ( θ এন ) = হে ( 1 / এন δ )লিম এন δ ( θ এন ) < কেলিম এন 2 δ [ ( θ এন ) ] 2 < কে '

B(θ^n)=O(1/nδ)limnδE(θ^n)<Klimn2δ[E(θ^n)]2<K

[ ( θ এন ) ] 2 = হে ( 1 / এন 2 δ )

[E(θ^n)]2=O(1/n2δ)(1)

যখন

Var ( θ এন ) =হে(1/এন γ )লিম এন γ ( θ 2 এন ) - [ ( θ এন ) ] 2 <এম

Var(θ^n)=O(1/nγ)limnγE(θ^2n)[E(θ^n)]2<M

লিম এন 2 γ ( θ 2 এন ) - এন 2 γ [ ( θ এন ) ] 2 <এম

limn2γE(θ^2n)n2γ[E(θ^n)]2<M

limn2γE(ˆθ2n)limn2γ[E(ˆθn)]2<M

limn2γE(θ^2n)limn2γ[E(θ^n)]2<M(2)

We see that (2)(2) may hold happen if

A) both components are O(1/n2γ)O(1/n2γ), in which case we can only have γ=δγ=δ.

B) But it may also hold if

limn2γ[E(ˆθn)]20[E(ˆθn)]2=o(1/n2γ)

limn2γ[E(θ^n)]20[E(θ^n)]2=o(1/n2γ)(3)

For (3)(3) to be compatible with (1)(1), we must have

n2γ<n2δδ>γ

n2γ<n2δδ>γ(4)

So it appears that in principle it is possible to have the Bias converging at a faster rate than the square root of the variance. But we cannot have the square root of the variance converging at a faster rate than the Bias.


How would you reconcile this with the existence of unbiased estimators like ordinary least squares? In that case, B(ˆθ)=0, but Var(ˆθ)=O(1/n).
Mike Izbicki

@MikeIzbicki Is the concept of convergence/big-O applicable in this case? Because here B(ˆθ) is not "O()-anything" to begin with.
Alecos Papadopoulos

In this case, Eˆθ=θ, so B(ˆθ)=Eˆθθ=0=O(1)=O(1/n0).
Mike Izbicki

@MikeIzbicki But also B(ˆθ)=O(n) or B(ˆθ)=O(1/n) or any other you care to write down. So which one is the rate of convergence here?
Alecos Papadopoulos

@MikeIzbicki I have corrected my answer to show that it is possible in principle to have the Bias converging faster, although I still think the "zero-bias" example is problematic.
Alecos Papadopoulos
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.