বলগুলিকে বিনের মধ্যে ফেলে দেওয়া, এটির সম্ভাব্যতার নিম্নাঞ্চলটি অনুমান করুন


14

এটি কোনও হোম ওয়ার্ক নয়, যদিও এটি দেখতে ভাল লাগে। কোন রেফারেন্স স্বাগত। :-)

পরিস্থিতি: এখানে n বিভিন্ন বল এবং n আলাদা আলাদা বিন রয়েছে (1 থেকে পর্যন্ত লেবেল n, বাম থেকে ডানে)। প্রতিটি বল স্বাধীনভাবে এবং সমানভাবে বিনে ফেলে দেওয়া হয়। যাক f(i) মধ্যে বল সংখ্যা হতে i ~ তম বিন। যাক Ei নিম্নলিখিত ইভেন্টে বোঝান।

প্রতিটি ji , kjf(k)j1

এটি হ'ল, প্রথম j বিনগুলি (সর্বাধিক বাম j বিন) প্রতিটি জে i এর জন্য j বলের চেয়ে কম রয়েছে ।ji

প্রশ্ন: অনুমান i<nPr(Ei) , পদে n? যখন n যায় অনন্ত। একটি নিম্নগামী পছন্দ হয়। আমি সহজে গণনা করা সূত্রটি বিদ্যমান বলে মনে করি না।

উদাহরণ: limnPr(E1)=limn(n1n)n=1e । দ্রষ্টব্যPr(En)=0

আমার অনুমান: আমি অনুমান করি i<nPr(Ei)=lnn , যখন n অনন্ত হয়ে যায়। আমি সংক্ষেপে প্রথম lnn আইটেম বিবেচনা করেছি ।


1
জন্মদিনের সমস্যা থেকে দেখে মনে হচ্ছে এটি সাবসেসের মতো ..
গোপী

@ গোপী আমি নিজেকে বোঝাতে পারি না যে আমার প্রশ্ন জন্মদিনের একটি সীমাবদ্ধ সমস্যা। আপনি কি তা স্পষ্টভাবে ব্যাখ্যা করতে পারেন? আপনাকে অনেক ধন্যবাদ. দ্রষ্টব্য: সীমাবদ্ধতা প্রথম j বাক্সের বলের যোগফলের উপর নির্ভর করে, নির্দিষ্ট বিনের বিনের সংখ্যার উপর নয়।
পেং ঝাং

সত্যই, আমার খারাপ, জন্মদিনের সমস্যা সম্পর্কিত উইকিপিডিয়া নিবন্ধটি পুনরায় পড়ার পরে আমি বুঝতে পেরেছিলাম যে আমি জন্মদিনের সমস্যা থেকে অভিযোজিত আরও একটি সমস্যা বিবেচনা করছি।
গোপী

2
কিছু ভুল ধারণা ... সুতরাং একটি রাষ্ট্রকে কীভাবে এনকোড করা যায় সে সম্পর্কে চিন্তা করুন: বিন থেকে ডানদিকে ফর্মটি পড়ুন। যদি প্রথম বিনটিতে আই বল থাকে, তবে আমি একটি ক্রম আউটপুট আনব এবং তার পরে 0 থাকবে। বাম থেকে ডানে সমস্ত বিনয়ের জন্য এটি করুন। আপনার কোডিশনটি দেখে মনে হচ্ছে আপনি সবচেয়ে বড় আমি আগ্রহী যে এই বাইনারি স্ট্রিংটিতে (যেটিতে এন জিরো এবং এন আছে) এটি প্রথমবারের মতো শূন্যের চেয়ে বেশি রয়েছে। এখন, সমান সম্ভাবনা থাকে ভাগ্য একটি লীপ করতে এবং উৎপন্ন 0 এবং 1 দেয় 1/2 । (এটি সম্পূর্ণ বোকা হতে পারে)। এই সমস্যাটি কাতালান সংখ্যা এবং ডাইক শব্দের সাথে সম্পর্কিত। এবং...???
সারিল হার-পিল্ড 22'12

4
বলগুলি আলাদা যে কেন তা গুরুত্বপূর্ণ তা আমি আপনার সংজ্ঞায় দেখতে পাচ্ছি না। এছাড়াও, স্ট্রিং ইন্টিপেটেশনটি বিনগুলি আলাদা হওয়ার বিষয়টি গ্রহণ করে।
সারিল হ্যার-পিল্ড

উত্তর:


11

সম্পাদনা: (2014-08-08) ডগলাস জের মন্তব্যগুলিতে যেমন উল্লেখ করেছেন, নীচের যুক্তিটি, বিশেষত দুটি সম্ভাবনার মধ্যে 'সেতু' ভুল। আমি এটি সংশোধন করার জন্য সরাসরি কোনও অগ্রসর উপায় দেখতে পাচ্ছি না। আমি উত্তর এখানে ছেড়ে দেব যেমন আমি বিশ্বাস করি এখনও কিছু অনুভূতি, কিন্তু জানি যে

Pr(Em)l=1mPr(Fl)
হয় না সাধারণভাবে সত্য।

এটি একটি সম্পূর্ণ উত্তর হবে না তবে আশা করি এটির পর্যাপ্ত সামগ্রী থাকবে যা আপনি বা আমার চেয়ে বেশি জ্ঞানী কেউ এটিকে শেষ করতে পারেন।

ঠিক সম্ভাবনা বিবেচনা করুন প্রথম মধ্যে পতিত বাজে কথা (এর এন ) বিন:kln

(nk)(ln)k(nln)nk

সম্ভাব্যতা কল কম যে বাজে কথা প্রথম পড়া বিন এফ :llFl

Pr(Fl)=k=0l1(nk)(ln)k(nln)nk

সম্ভাব্যতা যে ঘটনা, , উপরোক্ত ঘটে যদি আমরা প্রতিটি বিবেচিত চেয়ে কম হয় এফ একবারে ঘটনা স্বাধীনভাবে ঘটছে এবং সব। এটি আমাদের দুজনের মধ্যে একটি সেতু দেয়:ElFl

Pr(Em)l=1mPr(Fl)=l=1m(k=1l1(nk)(lnk)(nln)nk)=l=1mF(l1;n,ln)

যেখানে হয়বাইনমিয়াল বন্টনের জন্য ক্রমবর্ধমান বণ্টনের ফাংশনেরসঙ্গেপি=F(l1;n,ln) । উইকিপিডিয়া পৃষ্ঠায় কেবল কয়েকটি লাইন পড়ে, এবং এটি লক্ষ করে(l-1pn), আমরাচেরনফের বৈষম্যটিপেতেব্যবহারকরতে পারি:p=ln(l1pn)

Pr(Em)l=1mexp[12l]=exp[12l=1m1l]=exp[12Hm]exp[12(12m+ln(m)+γ)]

Where Hm is the m'th Harmonic Number, γ is the Euler-Mascheroni constant and the inequality for the Hm is taken from Wolfram's MathWorld linked page.

Not worrying about the e1/4m factor, this finally gives us:

Pr(Em)eγ/2m

Below is a log-log plot of an average of 100,000 instances for n=2048 as a function of m with the function রেফারেন্সের জন্য চক্রান্তও করেছি:eγ/2m

এখানে চিত্র বর্ণনা লিখুন

ধ্রুবকগুলি বন্ধ থাকা অবস্থায়, ফাংশনের ফর্মটি সঠিক বলে মনে হচ্ছে।

নীচে তারতম্য একটি লগ-লগ চক্রান্ত প্রতিটি বিন্দুতে এর কার্যকারিতা হিসেবে 100,000 দৃষ্টান্ত গড় হচ্ছে মি :nm

এখানে চিত্র বর্ণনা লিখুন

অবশেষে, আপনি যে মূল প্রশ্নের উত্তর চেয়েছিলেন তা পেতে, যেহেতু আমরা জানি যে আমরা আছে:Pr(Em)1m

i<nPr(Ei)n

And as numerical verification, below is a log-log plot of the sum, S, versus instance size, n. Each point represents the average of the sum of 100,000 instances. The function x1/2 has been plotted for reference:

enter image description here

While I see no direct connection between the two, the tricks and final form of this problem have a lot of commonalities with the Birthday Problem as initially guessed at in the comments.


4
How do you get Pr(E2)Pr(F1)×Pr(F2)? For example, for n=100, I calculate that Pr(E2)=0.267946>0.14761=Pr(F1)Pr(F2). If you are told that the first bin is empty, does this make it more or less likely that the first two bins hold at most 1 ball? It's more likely, so Pr(F1)Pr(F2) is an underestimate.
Douglas Zare

@DouglasZare, I've verified your calculations, you're correct. Serves me right for not being more rigorous.
user834

15

The answer is Θ(n).

En1

nnknk1e1k!

এখন, আসুন বলগুলিকে বিনগুলিতে বিতরণের একটি ভিন্ন উপায়। পোইসন বিতরণ থেকে নির্বাচিত প্রতিটি বিনের জন্য আমরা বেশ কয়েকটি বল নিক্ষেপ করি এবং সেখানে রয়েছে এমন ইভেন্টের শর্তn balls total. I claim that this gives exactly the same distribution as throwing n balls into n bins. Why? It is easy to see that the probability of having kj balls in the jth bin is proportional to j=1n1kj! in both distributions.

So let's consider a random walk where at each step, you go from t to t+1k with probability 1e1k!. I claim that if you condition on the event that this random walk returns to 0 after n steps, the probability that this random always stays above 0 is the probability that the OP wants to calculate. Why? This height of this random walk after s steps is s minus the number of balls in the first s bins.

If we had chosen a random walk with a probability of 12 of going up or down 1 on each step, this would be the classical ballot problem, for which the answer is 12(n1). This is a variant of the ballot problem which has been studied (see this paper), and the answer is still Θ(1n). I don't know whether there is an easy way to compute the constant for the Θ(1n) for this case.

The same paper shows that when the random walk is conditioned to end at height k, the probability of always staying positive is Θ(k/n) as long as k=O(n). This fact will let us estimate Es for any s.

I'm going to be a little handwavy for the rest of my answer, but standard probability techniques can be used to make this rigorous.

We know that as n goes to , this random walk converges to a Brownian bridge, i.e., Brownian motion conditioned to start and end at 0. From general probability theorems, for ϵn<s<(1ϵ)n, the random walk is roughly Θ(n) away from the x-axis. In the case it has height t>0, the probability that it has stayed above 0 for the entire time before s is Θ(t/s). Since t is likely to be Θ(n) when s=Θ(n), we have EsΘ(1/n).


4

[Edit 2014-08-13: Thanks to a comment by Peter Shor, I have changed my estimate of the asymptotic growth rate of this series.]

My belief is that limni<nPr(Ei) grows as n. I do not have a proof but I think I have a convincing argument.

Let Bi=f(i) be a random variable that gives the number of balls in bin i. Let Bi,j=k=ijBk be a random variable that gives the total number of balls in bins i through j inclusive.

You can now write Pr(Ei)=b<jPr(EjB1,j=b)Pr(EiEjB1,j=b) for any j<i. To that end, let's introduce the functions π and gi.

π(j,k,b)=Pr(Bj=kB1,j1=b)=(nbk)(1nj+1)k(njnj+1)nbk

gi(j,k,b)=Pr(EiBj,ikEj1B1,j1=b)={0k<01k>=0j>il=0jb1π(j,l,b)gi(j+1,kl,b+l)otherwise

We can write Pr(Ei) in terms of gi:

Pr(Ei)=gi(1,i1,0)

Now, it's clear from the definition of gi that

Pr(Ei)=(ni)ni+1nnhi(n)

where hi(n) is a polynomial in n of degree i1. This makes some intuitive sense too; at least ni+1 balls will have to be put in one of the (i+1)th through nth bins (of which there are ni).

Since we're only talking about Pr(Ei) when n, only the lead coefficient of hi(n) is relevant; let's call this coefficient ai. Then

limnPr(Ei)=aiei

How do we compute ai? Well, this is where I'll do a little handwaving. If you work out the first few Ei, you'll see that a pattern emerges in the computation of this coefficient. You can write it as

ai=μi(1,i1,0)
where
μi(j,k,b)={0k<01k>=0i>jl=0jb11l!μi(j+1,kl,b+l)otherwise

Now, I wasn't able to derive a closed-form equivalent directly, but I computed the first 20 values of Pr(Ei):

N       a_i/e^i
1       0.367879
2       0.270671
3       0.224042
4       0.195367
5       0.175467
6       0.160623
7       0.149003
8       0.139587
9       0.131756
10      0.12511
11      0.119378
12      0.114368
13      0.10994
14      0.105989
15      0.102436
16      0.0992175
17      0.0962846
18      0.0935973
19      0.0911231
20      0.0888353

Now, it turns out that

Pr(Ei)=iii!ei=Pois(i;i)

where Pois(i;λ) is the probability that a random variable X has value i when it's drawn from a Poisson distribution with mean λ. Thus we can write our sum as

limni=1nPr(Ei)=x=1xxx!ex

Wolfram Alpha tells me this series diverges. Peter Shor points out in a comment that Stirling's approximation allows us to estimate Pr(Ei):

limnPr(Ex)=xxx!ex12πx

Let

ϕ(x)=12πx

Since

  • limxϕ(x)ϕ(x+1)=1
  • ϕ(x) is decreasing
  • 1nϕ(x)dx as n

our series grows as 1nϕ(x)dx (See e.g. Theorem 2). That is,

i=1nPr(Ei)=Θ(n)

1
Wolfram Alpha is wrong. Use Stirling's formula. It says that, xx/(x!ex)1/2πx.
Peter Shor

@PeterShor Thanks! I've updated the conclusion thanks to your insight, and now I am in agreement with the other two answers. It's interesting to me to see 3 quite different approaches to this problem.
ruds

4

Exhaustively checking the first few terms (by examining all n^n cases) and a bit of lookup shows that the answer is https://oeis.org/A036276 / nn. This implies that the answer is n12π2.

More exactly, the answer is:

n!2nnk=0n2nkk!
and there is no closed-form answer.

Oeis is pretty awesome
Thomas Ahle
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.