একটি ভাঙ্গা লাঠি বৃহত্তম ব্যবধান বিতরণ (স্পেসিংস)


21

1 দৈর্ঘ্যের একটি কাঠি এলোমেলোভাবে k+1 টুকরো টুকরো টুকরো হয়ে যাওয়া হোক দীর্ঘতম খণ্ডের দৈর্ঘ্যের বিতরণ কী?

আরো আনুষ্ঠানিকভাবে যাক (U1,Uk) হতে IID U(0,1) , এবং দিন (U(1),,U(k)) সংশ্লিষ্ট অর্ডার পরিসংখ্যান, হতে অর্থাত তাই আমরা এই ধরনের নমুনা অর্ডার একটি উপায় যে U(1)U(2),,U(k) । দিনZk=max(U(1),U(2)U(1),,U(k)U(k1),1U(k))

আমি বিতরণে আগ্রহী । মুহুর্তগুলি, অ্যাসিম্পটোটিক ফলাফলগুলি বা জন্য আকর্ষণীয়।Zkk


9
এটি একটি সমীক্ষিত সমস্যা; আর পাইক (1965), "স্পেসিংস" জেআরএসএস (বি) 27 : 3, পৃষ্ঠা 395-449 দেখুন। কেউ আমাকে এতে মারধর না করে আমি পরে কিছু তথ্য যুক্ত করতে ফিরে আসার চেষ্টা করব। একই লেখকের 1972 সালের একটি কাগজও রয়েছে (" স্পেসিংস পুনর্বিবেচিত ") তবে আমি মনে করি আপনি যা করছেন তার পরে প্রথমটি বেশ সুন্দর। দেবরোয়েতে কিছু অ্যাসিম্পটিকস রয়েছে (1981) , "ইউনিফর্ম স্পেসিংয়ের অর্ডার স্ট্যাটিস্টিক্সের জন্য আইট্রেটেড লোগারিদমের আইন" আন । Probab। , 9 : 5, 860-867।
গ্লেন_বি -রিনস্টেট মনিকা

4
আপনার যদি এটির প্রয়োজন হয় তবে পরে কাজ সন্ধান করার জন্য সেগুলিকে কিছু ভাল অনুসন্ধানের পদ দেওয়া উচিত।
গ্লেন_বি -রিনস্টেট মনিকা

3
এটা সত্যিই দারুন. প্রথম রেফারেন্স খুঁজে পাওয়া শক্ত। আগ্রহীদের জন্য, আমি এটি গ্র্যান্ড লোকাসে রেখেছি ।
gui11aume

ভুল ছাপান সংশোধন করুন: Y(k) পরিবর্তে U(k)
ভিক্টর

ধন্যবাদ @ ভিক্টর! এই জাতীয় ছোট জিনিসগুলির জন্য, সম্পাদনাটি নিজে করতে দ্বিধা করবেন না (আমি মনে করি এটি অনুমোদনের জন্য অন্যান্য ব্যবহারকারীরা পর্যালোচনা করবেন)।
gui11aume

উত্তর:


18

@ গ্লেন_বি প্রদত্ত তথ্যের সাথে আমি উত্তরটি খুঁজে পেতে পারি। প্রশ্নের মতো একই স্বরলিপি ব্যবহার করে

P(Zkx)=j=0k+1(k+1j)(1)j(1jx)+k,

যেখানে যদি a > 0 এবং 0 অন্যথায় হয়। আমি গম্বেল ( এনবি : বিটা নয় ) বিতরণে প্রত্যাশা এবং অ্যাসিম্পটোটিক রূপান্তরটিও দিয়েছিa+=aa>00

E(Zk)=1k+1i=1k+11ilog(k+1)k+1,P(Zkx)exp(e(k+1)x+log(k+1)).

প্রমাণগুলির উপাদানটি উল্লেখগুলির সাথে যুক্ত কয়েকটি প্রকাশনা থেকে নেওয়া হয় is এগুলি কিছুটা লম্বা, তবে সোজা।

1. সঠিক বিতরণের প্রমাণ

আসুন বিরতিতে আইআইডি ইউনিফর্ম র্যান্ডম ভেরিয়েবল হতে হবে ( 0 , 1 ) । তাদের অর্ডার দিয়ে আমরা কে অর্ডার পরিসংখ্যান প্রাপ্ত ( ইউ ( 1 ) , , ইউ ( কে ) ) পেয়েছি । অভিন্ন spacings হিসাবে সংজ্ঞায়িত করা হয় Δ আমি = ইউ ( আমি ) - ইউ ( আমি - 1 ) , সঙ্গে ইউ ((U1,,Uk)(0,1)k(U(1),,U(k))Δi=U(i)U(i1)এবং ইউ ( কে + 1 ) =1। অর্ডার করা স্পেসিংস হ'ল সম্পর্কিত আদেশযুক্ত পরিসংখ্যান Δ ( 1 ) Δ ( কে + 1 ) । সুদের পরিবর্তনশীল হ'ল Δ ( কে + 1 )U(0)=0U(k+1)=1Δ(1)Δ(k+1)Δ(k+1)

ফিক্সড বা অপরিবর্তিত , আমরা নির্দেশক পরিবর্তনশীল সংজ্ঞায়িত 1 আমি = 1 { Δ আমি > এক্স } । প্রতিসাম্য দ্বারা, এলোমেলো ভেক্টর ( 1 1 , , 1 কে + 1 ) বিনিময়যোগ্য, তাই আকারের জে একটি উপসেটের যৌথ বন্টন প্রথম জেটির যৌথ বন্টনের সমান । পণ্য প্রসারিত করে, আমরা এইভাবে প্রাপ্তx(0,1)1i=1{Δi>x}(11,,1k+1)jj

P(Δ(k+1)x)=E(i=1k+1(11i))=1+j=1k+1(k+1j)(1)jE(i=1j1i).

আমরা এখন প্রমাণ করব যে , যা উপরে বর্ণিত বিতরণটি প্রতিষ্ঠা করবে। আমরা জে = 2 এর জন্য এটি প্রমাণ করি , কারণ সাধারণ ক্ষেত্রেও একইভাবে প্রমাণিত হয়।E(i=1j1i)=(1jx)+kj=2

E(i=121i)=P(Δ1>xΔ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).

যদি তবে কে ব্রেকপয়েন্টগুলি ব্যবধানে থাকে ( x , 1 ) । শর্তসাপেক্ষে এই ইভেন্টে ব্রেকপয়েন্টগুলি এখনও বিনিময়যোগ্য, সুতরাং দ্বিতীয় এবং প্রথম ব্রেকপয়েন্টের মধ্যে দূরত্ব x এর চেয়ে বেশি হওয়ার সম্ভাবনাটি প্রথম ব্রেকপয়েন্ট এবং বাম বাধার মধ্যবর্তী দূরত্ব (পজিশনে x ) x এর চেয়ে বড় । সুতরাংΔ1>xk(x,1)xxx

P(Δ2>x|Δ1>x)=P(all points are in (2x,1)|all points are in (x,1)),soP(Δ2>xΔ1>x)=P(all points are in (2x,1))=(12x)+k.

2. Expectation

For distributions with finite support, we have

E(X)=P(X>x)dx=1P(Xx)dx.

Integrating the distribution of Δ(k+1), we obtain

E(Δ(k+1))=1k+1j=1k+1(k+1j)(1)j+1j=1k+1j=1k+11j.

The last equality is a classic representation of harmonic numbers Hi=1+12++1i, which we demonstrate below.

Hk+1=011+x++xkdx=011xk+11xdx.

With the change of variable u=1x and expanding the product, we obtain

Hk+1=01j=1k+1(k+1j)(1)j+1uj1du=j=1k+1(k+1j)(1)j+1j.

3. Alternative construction of uniform spacings

In order to obtain the asymptotic distribution of the largest fragment, we will need to exhibit a classical construction of uniform spacings as exponential variables divided by their sum. The probability density of the associated order statistics (U(1),,U(k)) is

fU(1),U(k)(u(1),,u(k))=k!,0u(1)u(k+1).

If we denote the uniform spacings Δi=U(i)U(i1), with U(0)=0, we obtain

fΔ1,Δk(δ1,,δk)=k!,0δi++δk1.

By defining U(k+1)=1, we thus obtain

fΔ1,Δk+1(δ1,,δk+1)=k!,δ1++δk=1.

Now, let (X1,,Xk+1) be IID exponential random variables with mean 1, and let S=X1++Xk+1. With a simple change of variable, we can see that

fX1,Xk,S(x1,,xk,s)=es.

Define Yi=Xi/S, such that by a change of variable we obtain

fY1,Yk,S(y1,,yk,s)=skes.

Integrating this density with respect to s, we thus obtain

fY1,Yk,(y1,,yk)=0skesds=k!,0yi++yk1,and thusfY1,Yk+1,(y1,,yk+1)=k!,y1++yk+1=1.

So the joint distribution of k+1 uniform spacings on the interval (0,1) is the same as the joint distribution of k+1 exponential random variables divided by their sum. We come to the following equivalence of distribution

Δ(k+1)X(k+1)X1++Xk+1.

4. Asymptotic distribution

Using the equivalence above, we obtain

P((k+1)Δ(k+1)log(k+1)x)=P(X(k+1)(x+log(k+1))X1++Xk+1k+1)=P(X(k+1)log(k+1)x+(x+log(k+1))Tk+1),

where Tk+1=X1++Xk+1k+11. This variable vanishes in probability because E(Tk+1)=0 and Var(log(k+1)Tk+1)=(log(k+1))2k+10. Asymptotically, the distribution is the same as that of X(k+1)log(k+1). Because the Xi are IID, we have

P(X(k+1)log(k+1)x)=P(X1x+log(k+1))k+1=(1exlog(k+1))k+1=(1exk+1)k+1exp{ex}.

5. Graphical overview

The plot below shows the distribution of the largest fragment for different values of k. For k=10,20,50, I have also overlaid the asymptotic Gumbel distribution (thin line). The Gumbel is a very bad approximation for small values of k so I omit them to not overload the picture. The Gumbel approximation is good from k50.

Distribution of the largest fragment of a broken stick

6. References

The proofs above are taken from references 2 and 3. The cited literature contains many more results, such as the distribution of the ordered spacings of any rank, their limit distribution and some alternative constructions of the ordered uniform spacings. The key references are not easily accessible, so I also provide links to the full text.

  1. Bairamov et al. (2010) Limit results for ordered uniform spacings, Stat papers, 51:1, pp 227-240
  2. Holst (1980) On the lengths of the pieces of a stick broken at random, J. Appl. Prob., 17, pp 623-634
  3. Pyke (1965) Spacings, JRSS(B) 27:3, pp. 395-449
  4. Renyi (1953) On the theory of order statistics, Acta math Hung, 4, pp 191-231

Brilliant. By the way, is there a known asymptotics to E(Zk2)?
Amir Sagiv

@AmirSagiv this is a good question. I had a quick look at the references and I could not find it. I could also not adapt the proof above. This made me realize that I don't know what the distribution of a square of a Gumbel is. Perhaps a good place to start?
gui11aume

1
$gui11aume Look here : mathoverflow.net/a/293381/42864
Amir Sagiv

1
@AmirSagiv This is a very good post. For some reason, I misunderstood your question and thought you were interested in the asymptotic distribution of Zk2 (even though your comment was very clear), so my comment above is not so relevant.
gui11aume

3

This is not a complete answer, but I did some quick simulations, and this is what I obtained: Histogram of the longest fragment

This looks remarkably beta-ish, and this makes a bit of sense, since the order statistics of i.i.d. uniform distributions are beta wiki.

This might give some starting point to derive the resulting p.d.f..

I'll update if I get to a final closed solution.

Cheers!


Just one more thing, the shape of histogram for increasing k doesn't change considerably, apart from getting "squished" close to 0.
Lima

1
Thank you for your thoughts @Lima (and welcome to Cross Validated). I think your answer can be improved. First, I would refrain from making statements without proof. If this is incorrect, you may put the people who see this thread on the wrong track. Second, I would document what you did. Without the value of k that you used nor the code, the figure does not help anybody. Finally, I would copy-edit the answer and remove everything that is not directly answering the question.
gui11aume

1
Thanks for the suggestions. They're valid beyond stack exchange, and I'll remember to use them.
Lima

1

I produced the answer for a conference in Siena (Italy) in 2005. The paper (2006) is presented on my web-site here (pdf). The exact distributions of all the spacings (smallest to largest) are found on pages 75 & 76.

I'm hoping to give a presentation on this topic at the RSS Conference in Manchester (England) in September 2016.


2
Welcome to the site. We are trying to build a permanent repository of high-quality statistical information in the form of questions & answers. Thus, we're wary of link-only answers, due to linkrot. Can you post a full citation & a summary of the information at the link, in case it goes dead? Also, please don't sign your posts here. Every post has a link to your userpage where you can post that information.
gung - Reinstate Monica
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.