দুটি বিতরণের মধ্যে হেল্পিংজারের দূরত্বের কি কোনও পক্ষপাতহীন অনুমানকারী?


20

একটি সেটিং যেখানে এক লক্ষ্য সালে X1,,Xn ঘনত্ব একটি বিতরণ থেকে বিতরণ করা f , আমি ভাবছি যদি একটা নিরপেক্ষ মূল্নির্ধারক (উপর ভিত্তি করে Xi ঘনত্ব সঙ্গে অন্য বিতরণের Hellinger দূরত্বের 'গুলি) f0 , যথা

H(f,f0)={1Xf(x)f0(x)dx}1/2.

4
সুতরাং f0 জানা এবং স্থির। তবে চ কি পরিচিত বা কোনও প্যারাম্যাট্রিক পরিবার থেকে বা এটি আপনার নমুনা থেকে আগত সম্পর্কে যা জানা আছে তার সাথে একটি ননপ্যারমেট্রিক কাঠামোয় কাজ করছেন? আমি মনে করি একটি উত্তর চেষ্টা করার সময় এটি একটি পার্থক্য করে।
মাইকেল আর চেরনিক

3
@ মিশেল চের্নিক: ধরে নিন যে আপনি সম্পর্কে জানেন তা সমস্তই নমুনা এক্স 1 , , এক্স এনfX1,,Xn
শি'য়ান

2
আমি মনে করি না এটি গণনা করা হয়েছে (যদি উপস্থিত থাকে)। যদি সেখানে উপস্থিত থাকে, তবে এআইসির একটি হারানো ভাই রয়েছে।

4
আপনি যদি এবং f 0 টি স্বতন্ত্র বলে ধরে নেন তবে এই সমস্যার উপর আক্রমণ আক্রমণযোগ্য বলে মনে হচ্ছে । এটি একটি সুস্পষ্ট অনুমানকারীকে নিয়ে যায় (EDF এবং f 0 এর মধ্যে হ্যালিঞ্জার দূরত্ব গণনা করুন )। বুটস্ট্র্যাপিং (তাত্ত্বিকভাবে, সিমুলেশন দিয়ে নয়!) আমাদের সম্ভাব্য পক্ষপাত সম্পর্কে একটি হ্যান্ডেল দেবে পাশাপাশি পক্ষপাতটি হ্রাস করার (বা এমনকি নির্মূল করার) উপায়ও দেবে। আমি দূরত্বের চেয়ে বর্গক্ষেত্রের দূরত্বের সাথে সফল হওয়ার কিছুটা আশা রাখি কারণ এটি গাণিতিকভাবে আরও ট্র্যাকটেবল। একটি পৃথক এর অনুমান অ্যাপ্লিকেশনগুলিতে কোনও সমস্যা নয়; পৃথক এর স্পেস যাইহোক একটি ঘন সাবসেট। ff0f0ff
whuber

2
রোজেনব্ল্যাট-এর প্রমাণটি মাথায় আসে যে কোনও "বোনা ফাইড" নিরপেক্ষ অনুমানক নেই । আমরা কি এটি কাটিয়ে উঠতে পারি এবং এইচ ( এফ , f 0 ) এর নিরবিচ্ছিন্ন অনুমানকারী পেতে পারি? আমি জানি না। fH(f,f0)
জেন

উত্তর:


5

পারেন এর কোনো নিরপেক্ষ মূল্নির্ধারক অথবা এইচ 2 জন্য বিদ্যমান ডিস্ট্রিবিউশন কোন যুক্তিসঙ্গতভাবে প্রশস্ত nonparametric ক্লাস থেকে।HH2f

আমরা এটির খুব সুন্দর যুক্তি দিয়ে এটি প্রদর্শন করতে পারি

বিকেল এবং লেহম্যান (1969)। উত্তল পরিবারগুলিতে নিরপেক্ষ অনুমান । গাণিতিক পরিসংখ্যানগুলির অ্যানালস, 40 (5) 1523–1535। ( প্রকল্প ইউক্যালিড )

কিছু ডিস্ট্রিবিউশন ত্রুটিমুক্ত , এফ , এবং জি সংশ্লিষ্ট ঘনত্বের সঙ্গে 0 , , এবং । যাক এইচ ( এফ ) বোঝাতে এইচ ( , 0 ) , এবং দিন এইচ ( এক্স ) কিছু মূল্নির্ধারক করা এইচ ( এফ ) উপর ভিত্তি করে এন IID নমুনা X আমি ~ এফF0FGf0fgH(F)H(f,f0)H^(X)H(F)nXiF

ধরুন যে এইচ ফর্ম কোন বন্টন থেকে নমুনার জন্য নিরপেক্ষ হয় এম α : = α এফ + + ( 1 -H^ তবে কিউ ( α )

Mα:=αF+(1α)G.
Q(α)=H(Mα)=x1xnH^(X)dMα(x1)dMα(xn)=x1xnH^(X)[αdF(x1)+(1α)dG(x1)][αdF(xn)+(1α)dG(xn)]=αnEXFn[H^(X)]++(1α)nEXGn[H^(X)],
so that Q(α) must be a polynomial in α of degree at most n.

Now, let's specialize to a reasonable case and show that the corresponding Q is not polynomial.

Let F0 be some distribution which has constant density on [1,1]: f0(x)=c for all |x|1. (Its behavior outside that range doesn't matter.) Let F be some distribution supported only on [1,0], and G some distribution supported only on [0,1].

Now

Q(α)=H(mα,f0)=1Rmα(x)f0(x)dx=110cαf(x)dx01c(1α)g(x)dx=1αBF1αBG,
where BF:=Rf(x)f0(x)dx and likewise for BG. Note that BF>0, BG>0 for any distributions F, G which have a density.

1αBF1αBG is not a polynomial of any finite degree. Thus, no estimator H^ can be unbiased for H on all of the distributions Mα with finitely many samples.

Likewise, because 1αBF1αBG is also not a polynomial, there is no estimator for H2 which is unbiased on all of the distributions Mα with finitely many samples.

This excludes pretty much all reasonable nonparametric classes of distributions, except for those with densities bounded below (an assumption nonparametric analyses sometimes make). You could probably kill those classes too with a similar argument by just making the densities constant or something.


13

I don't know how to construct (if it exists) an unbiased estimator of the Hellinger distance. It seems possible to construct a consistent estimator. We have some fixed known density f0, and a random sample X1,,Xn from a density f>0. We want to estimate

H(f,f0)=1Xf(x)f0(x)dx=1Xf0(x)f(x)f(x)dx
=1E[f0(X)f(X)],
where Xf. By the SLLN, we know that
11ni=1nf0(Xi)f(Xi)H(f,f0),
almost surely, as n. Hence, a resonable way to estimate H(f,f0) would be to take some density estimator fn^ (such as a traditional kernel density estimator) of f, and compute
H^=11ni=1nf0(Xi)fn^(Xi).

3
@Zen: Good point! I consider this answer as the answer because it made me realise H sounds very much like a standard deviation, for which there exists no unbiased estimator. As for the variance of H^n2, no worries: E[(f0(X)/f(X))2]=1 implies that this estimator has a finite variance.
Xi'an

1
Thanks for the clarification about the variance of the estimator, Xi'an!
Zen

2
Some work on other consistent estimators: (a) arxiv.org/abs/1707.03083 and related work based on k-NN density estimators; (b) arxiv.org/abs/1402.2966 based on correcting kernel density estimates; (c) ieeexplore.ieee.org/document/5605355 based on a connection to classification. (Many of these are based on samples from both f and f0, because that's the work I knew about offhand, but I think there are variants for known f0.)
Dougal
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.