কাটা কাটা বিতরণের জন্য সর্বাধিক সম্ভাবনার অনুমানক


28

একটি এলোমেলো পরিবর্তনশীল এক্স থেকে প্রাপ্ত স্বতন্ত্র নমুনা এস বিবেচনা করুন যা পরিচিত (সসীম) ন্যূনতম এবং সর্বাধিক মান a এবং b তবে অজানা প্যারামিটার μ এবং σ 2 এর একটি কাটা বিতরণ (যেমন একটি ছাঁটাই করা সাধারণ বন্টন ) অনুসরণ করে । তাহলে এক্স একটি অ-ছেঁটে ফেলা বন্টন অনুসৃত, সর্বোচ্চ সম্ভাবনা estimators μ এবং σ 2 জন্য μ এবং σ 2 থেকে এস নমুনা গড় হবে μNSXabμσ2Xμ^σ^2μσ2Sএবং নমুনা ভ্যারিয়েন্স σ 2=1μ^=1NiSi। তবে, কেটে যাওয়া বিতরণের জন্য, এই উপায়ে সংজ্ঞায়িত নমুনা বৈকল্পিক(-)2দ্বারা আবদ্ধ হয়তাই এটি সর্বদা সুসংগত অনুমানকারী হয় না:σ2>(-)2 এর জন্যএটি সম্ভাব্যতায় রূপান্তর করতে পারে নাσ2হিসাবেএনঅনন্ত যেতে। সুতরাং এটা মনে হচ্ছে যে μ এবং σ 2নয় সর্বোচ্চ-সম্ভাবনা estimators হয়μσ^2=1Ni(Siμ^)2(ba)2σ2>(ba)2σ2Nμ^σ^2μএবং একটি ছেঁটে ফেলা বিতরণের জন্য। অবশ্যই, এটি প্রত্যাশিত যেহেতু একটি কাটা সাধারণ বিতরণের μ এবং σ 2 পরামিতিগুলি এর গড় এবং বৈকল্পিক নয়।σ2μσ2

সুতরাং, জানা সর্বনিম্ন এবং সর্বাধিক মানগুলির ছাঁটাই করা বিতরণের এবং σ পরামিতিগুলির সর্বাধিক সম্ভাবনার অনুমানগুলি কী কী ?μσ


আপনি কি আপনার বিশ্লেষণ সম্পর্কে নিশ্চিত? আমি মনে করি আপনি একটি অবৈধ অনুমান করছেন: সংক্ষিপ্ত পরিস্থিতির জন্য, এর এমএলই আর নমুনার বৈকল্পিকতা নয় (এবং সাধারণভাবে, μ এর এমএলই আর নমুনা বোঝায় না)! σ2μ
whuber

whuber: আমি জানি, এই অবিকল আমার প্রশ্ন: এর MLEs কি এবং μ ছেঁটে ফেলা ক্ষেত্রে? এটির জন্য জোর দেওয়ার জন্য একটি বাক্য যুক্ত করা। σ2μ
a3nm

1
কোনও বদ্ধ ফর্ম সমাধান নেই। আপনি যা করতে পারেন তা হ'ল লগ সম্ভাবনা হ্রাস করুন। তবে এটি গুণগতভাবে অন্যান্য অনেক মডেলের তুলনায় আলাদা নয়, যেমন লজিস্টিক রিগ্রেশন, যার কোনও বন্ধ ফর্ম সমাধানও নেই।
হোবার

হুঁশিয়ার: এটি যদি সত্য হয় তবে এটি হতাশ। বন্ধ ফর্ম সমাধানের অভাব সম্পর্কে আপনার কি উল্লেখ রয়েছে? এমন কি কি ক্লোজড-ফর্ম অনুমানক যা সর্বাধিক সম্ভাবনা নয় তবে কমপক্ষে সামঞ্জস্যপূর্ণ (এবং বিকল্পভাবে নিরপেক্ষ?)।
a3nm

1
@ হুইবার: আপনি কি কমপক্ষে আপনার নমুনাগুলিকে পর্যাপ্ত পরিসংখ্যানগুলিতে সহজ করতে পারেন যাতে মিনিমাইজেশন দ্রুত হয়?
নীল জি

উত্তর:


29

কোনও "স্ট্যান্ডার্ড" বিতরণ দ্বারা নির্ধারিত কোনও অবস্থান-স্কেল পরিবার বিবেচনা করুন ,F

ΩF={F(μ,σ):xF(xμσ)σ>0}.

Assuming F differentiable we readily find that the PDFs are 1σf((xμ)/σ)dx.

Truncating these distributions to restrict their support between a and b, a<b, means that the PDFs are replaced by

f(μ,σ;a,b)(x)=f(xμσ)dxσC(μ,σ,a,b),axb

(and are zero for all other values of x) where C(μ,σ,a,b)=F(μ,σ)(b)F(μ,σ)(a) is the normalizing factor needed to ensure that f(μ,σ;a,b) integrates to unity. (Note that C is identically 1 in the absence of truncation.) The log likelihood for iid data xi therefore is

Λ(μ,σ)=i[logf(xiμσ)logσlogC(μ,σ,a,b)].

Critical points (including any global minima) are found where either σ=0 (a special case I will ignore here) or the gradient vanishes. Using subscripts to denote derivatives, we may formally compute the gradient and write the likelihood equations as

0=Λμ=i[fμ(xiμσ)f(xiμσ)Cμ(μ,σ,a,b)C(μ,σ,a,b)]0=Λσ=i[fσ(xiμσ)σ2f(xiμσ)1σCσ(μ,σ,a,b)C(μ,σ,a,b)]

Because a and b are fixed, drop them from the notation and write nCμ(μ,σ,a,b)/C(μ,σ,a,b) as A(μ,σ) and nCσ(μ,σ,a,b)/C(μ,σ,a,b) as B(μ,σ). (With no truncation, both functions would be identically zero.) Separating the terms involving the data from the rest gives

A(μ,σ)=ifμ(xiμσ)f(xiμσ)σ2B(μ,σ)nσ=ifσ(xiμσ)f(xiμσ)

By comparing these to the no-truncation situation it is evident that

  • Any sufficient statistics for the original problem are sufficient for the truncated problem (because the right hand sides have not changed).

  • Our ability to find closed-form solutions relies on the tractability of A and B. If these do not involve μ and σ in simple ways, we cannot hope to obtain closed-form solutions in general.

For the case of a normal family, C(μ,σ,a,b) of course is given by the cumulative normal PDF, which is a difference of error functions: there is no chance that a closed-form solution can be obtained in general. However, there are only two sufficient statistics (the sample mean and variance will do) and the CDF is as smooth as can be, so numerical solutions will be relatively easy to obtain.


Thanks a lot for this very detailed answer! I'm not sure I get what fμ, fσ , Cμ, and Cσ are, could you define them? Also, it's obvious but to be precise maybe you could say that your expression for the pdf is for x[a,b] (and the pdf is zero outside of that). Thanks again!
a3nm

1
The usual longer notation is Cμ=μC(μ,σ,a,b), etc: as announced, it is a derivative. I will make the second change you suggest because it's an important clarification, thanks.
whuber

Also, since your answer is more general than the one I expected, I edited my question to insist less on the case of normal distributions. Thanks again for your effort.
a3nm

1
It was easier to explain at this level of generality compared to focusing on the Normal distributions! Computing the derivatives and showing the precise form of the CDF are unnecessary distractions (although useful when you start actually coding the numerical solution).
whuber

1
Thanks for fixing! You missed one of them; could you review my edit?
a3nm
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.