উত্তর হ্যাঁ, প্রদত্ত ডেটা সুস্পষ্ট ধারাবাহিকতার প্রয়োজনীয়তা পূরণ করে। একটি সহজ নির্মাণের উপর ভিত্তি করে যুক্তিটি সোজাসাপ্টা, তবে এটির জন্য কিছু সেটআপ প্রয়োজন। এটি একটি স্বজ্ঞাতভাবে আবেদনমূলক সত্য নেমে আসে: প্যারামিটার বাড়ানো increasingএকটিa একটি বিটাতে(একটি,খ)(a,b) বিতরণ বৃহত্তর জন্য আরও তার ঘনত্ব (পিডিএফ) এর মান বৃদ্ধি করে এক্সx ছোট চেয়ে এক্সx; এবং বৃদ্ধিখb বিপরীত: ছোট এক্সx পিডিএফ এর মান আরও বৃদ্ধি পায়।
বিস্তারিত অনুসরণ করুন।
কাঙ্ক্ষিত হোক কুই1q1 কোয়ান্টাইল হতে এক্স1x1 এবং পছন্দসই কুই2q2 কোয়ান্টাইল হতে এক্স2x2 সঙ্গে 1>কুই2>কুই1>01>q2>q1>0 এবং সেইজন্য) 1>এক্স2>এক্স1>01>x2>x1>0। তারপরে অনন্য রয়েছেএকটিa এবং খb যার জন্য বিটা(একটি,খ)(a,b) বিতরণ এই কোয়ান্টাইলস আছে।
এটি দেখানোর ক্ষেত্রে অসুবিধাটি হ'ল বিটা বিতরণে একটি পুনরুদ্ধারকরা স্বাভাবিক ধ্রুবক জড়িত। সংজ্ঞাটি প্রত্যাহার করুন: জন্যএকটি>0a>0 এবং খ>0b>0বিটা(একটি,খ)(a,b) বিতরণ একটি ঘনত্ব ফাংশন আছে (পিডিএফ)
চ(এক্স;একটি,খ)=1বি(একটি,খ)এক্সএকটি-1(1-এক্স)খ-1।f(x;a,b)=1B(a,b)xa−1(1−x)b−1.
স্বাভাবিককরণের ধ্রুবকটি হ'ল বিটা ফাংশন
বি(একটি,খ)=∫10এক্সএকটি-1(1-এক্স)খ-1ঘএক্স=Γ(একটি)Γ(খ)Γ(একটি+ +খ)।B(a,b)=∫10xa−1(1−x)b−1dx=Γ(a)Γ(b)Γ(a+b).
আমরা আলাদা করার চেষ্টা করলে সবকিছু অগোছালো হয়ে যায় চ(এক্স;একটি,খ)f(x;a,b) সরাসরি সম্মান সঙ্গে একটিa এবং খb, যা একটি বিক্ষোভ চেষ্টা করার জন্য নিষ্ঠুর শক্তি উপায় হবে।
বিটা ফাংশন বিশ্লেষণ করা এড়ানোর একটি উপায় হ'ল কোয়ান্টাইলগুলি আপেক্ষিক অঞ্চল। এটাই,
কুইআমি=এফ(এক্সআমি;একটি,খ)=∫এক্সআমি0চ(এক্স;একটি,খ)ঘএক্স∫10চ(এক্স;একটি,খ)ঘএক্সqi=F(xi;a,b)=∫xi0f(x;a,b)dx∫10f(x;a,b)dx
জন্য আমি=1,2i=1,2। এখানে, উদাহরণস্বরূপ, পিডিএফ এবং संचयी বিতরণ ফাংশন (সিডিএফ)এফF একটি বিটা(1.15,0.57)(1.15,0.57) বিতরণ যার জন্য এক্স1=1/3x1=1/3 এবং কুই1=1/6q1=1/6।
ঘনত্ব ফাংশন এক্স→চ(এক্স;একটি,খ)x→f(x;a,b) বাম দিকে চক্রান্ত করা হয়। কুই1q1হয় এলাকায় বাঁদিকে বক্ররেখা অধীনেএক্স1x1, রেখাচিত্রে প্রদর্শিত, বক্ররেখার নিচে মোট ক্ষেত্রের তুলনায় । কুই2q2 বাম দিকের অঞ্চল এক্স2x2, equal to the sum of the red and blue regions, again relative to the total area. The CDF at the right shows how (x1,q1)(x1,q1) and (x2,q2)(x2,q2) mark two distinct points on it.
In this figure, (x1,q1)(x1,q1) was fixed at (1/3,1/6)(1/3,1/6), aa was selected to be 1.151.15, and then a value of bb was found for which (x1,q1)(x1,q1) lies on the Beta(a,b)(a,b) CDF.
Lemma: Such a bb can always be found.
To be specific, let (x1,q1)(x1,q1) be fixed once and for all. (They stay the same in the illustrations that follow: in all three cases, the relative area to the left of x1x1 equals q1q1.) For any a>0a>0, the Lemma claims there is a unique value of bb, written b(a),b(a), for which x1x1 is the q1q1 quantile of the Beta(a,b(a))(a,b(a)) distribution.
To see why, note first that as bb approaches zero, all the probability piles up near values of 00, whence F(x1;a,b)F(x1;a,b) approaches 11. As bb approaches infinity, all the probability piles up near values of 11, whence F(x1;a,b)F(x1;a,b) approaches 00. In between, the function b→F(x1;a,b)b→F(x1;a,b) is strictly increasing in bb.
This claim is geometrically obvious: it amounts to saying that if we look at the area to the left under the curve x→xa−1(1−x)b−1x→xa−1(1−x)b−1 relative to the total area under the curve and compare that to the relative area under the curve x→xa−1(1−x)b′−1x→xa−1(1−x)b′−1 for b′>bb′>b, then the latter area is relatively larger. The ratio of these two functions is (1−x)b′−b(1−x)b′−b. This is a function equal to 11 when x=0,x=0, dropping steadily to 00 when x=1.x=1. Therefore the heights of the function x→f(x;a,b′)x→f(x;a,b′) are relatively larger than the heights of x→f(x;a,b)x→f(x;a,b) for xx to the left of x1x1 than they are for xx to the right of x1.x1. Consequently, the area to the left of x1x1 in the former must be relatively larger than the area to the right of x1.x1. (This is straightforward to translate into a rigorous argument using a Riemann sum, for instance.)
We have seen that the function b→f(x1;a,b)b→f(x1;a,b) is strictly monotonically increasing with limiting values at 00 and 11 as b→0b→0 and b→∞,b→∞, respectively. It is also (clearly) continuous. Consequently there exists a number b(a)b(a) where f(x1;a,b(a))=q1f(x1;a,b(a))=q1 and that number is unique, proving the lemma.
The same argument shows that as bb increases, the area to the left of x2x2 increases. Consequently the values of f(x2;a,b(a))f(x2;a,b(a)) range over some interval of numbers as aa progresses from almost 00 to almost ∞.∞. The limit of f(x2;a,b(a))f(x2;a,b(a)) as a→0a→0 is q1.q1.
Here is an example where aa is close to 00 (it equals 0.10.1). With x1=1/3x1=1/3 and q1=1/6q1=1/6 (as in the previous figure), b(a)≈0.02.b(a)≈0.02. There is almost no area between x1x1 and x2:x2:
The CDF is practically flat between x1x1 and x2,x2, whence q2q2 is practically on top of q1.q1. In the limit as a→0a→0, q2→q1.q2→q1.
At the other extreme, sufficiently large values of aa lead to F(x2;a,b(a))F(x2;a,b(a)) arbitrarily close to 1.1. Here is an example with (x1,q1)(x1,q1) as before.
Here a=8a=8 and b(a)b(a) is nearly 10.10. Now F(x2;a,b(a))F(x2;a,b(a)) is essentially 1: there is almost no area to the right of x2.
Consequently, you may select any q2 between q1 and 1 and adjust a until F(x2;a,a(b))=q2. Just as before, this a must be unique, QED.
Working R
code to find solutions is posted at Determining beta distribution parameters α and β from two arbitrary points (quantiles) .