সংক্ষিপ্তসার
আপনি নমুনা মিডিয়ানদের জন্য কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যটিতে বর্ণিত নির্মাণের অংশটি পুনরায় আবিষ্কার করেছেন , যা একটি নমুনার মধ্যকের বিশ্লেষণকে চিত্রিত করে। (বিশ্লেষণটি স্পষ্টতই প্রযোজ্য, মিট্যাটিস মিউটানডিস , যে কোনও কোয়ান্টাইলের জন্য, কেবল মধ্যস্থ নয়)। সুতরাং এটি বিস্ময়কর নয় যে বৃহত বিটা প্যারামিটারগুলির জন্য (বৃহত নমুনাগুলির সাথে মিল রেখে) প্রশ্নের মধ্যে বর্ণিত রূপান্তরের অধীনে একটি সাধারণ বিতরণ দেখা দেয়। আগ্রহের বিষয়টি হল ছোট বিটা পরামিতিগুলির এমনকি সাধারণ বিতরণটি কতটা কাছাকাছি । এটি একটি ব্যাখ্যা প্রাপ্য।
আমি নীচে একটি বিশ্লেষণ স্কেচ করব। এই পোস্টটি যুক্তিসঙ্গত দৈর্ঘ্যে রাখার জন্য, এতে হাতের মোড়কে প্রচুর পরিমাণে পরামর্শ দেওয়া হয়েছে: আমি কেবল মূল ধারণাগুলি দেখানো লক্ষ্য করি। অতএব আমাকে এখানে ফলাফলগুলি সংক্ষিপ্তসার দিন:
যখন পাসে হবে বিটা , সবকিছু প্রতিসম হয়। এর ফলে রূপান্তরিত বিতরণ ইতিমধ্যে সাধারণ দেখায়।αβ
ফর্ম কার্যাবলী বর্ণন মোটামুটি প্রথম স্থানে সাধারন, এমনকি ছোট মানের জন্য α এবং β (প্রদত্ত উভয় অতিক্রম 1 এবং তাদের অনুপাত খুব নয় থেকে বন্ধ 0 বা 1 )।Φα−1(x)(1−Φ(x))β−1αβ101
রুপান্তরিত বিতরণের আপাত স্বাভাবিকতা এই কারণে যে এর ঘনত্বটি একটি সাধারণ ঘনত্ব নিয়ে গঠিত যা একটি ফাংশন (2) দ্বারা গুণিত হয়েছিল।
এবং β বৃদ্ধি হিসাবে , স্বাভাবিকতা থেকে প্রস্থান লগের ঘনত্বের জন্য টেলর সিরিজের বাকী পদগুলিতে পরিমাপ করা যেতে পারে। আদেশের মেয়াদ এন অনুপাতে কমে যায় ( এন - 2 ) / 2 এর ক্ষমতা α এবং β । এর দ্বারা বোঝা যাচ্ছে যে শেষ পর্যন্ত যথেষ্ট পরিমাণে α এবং β এর জন্য , n = 3 বা তারও বেশি পাওয়ারের সমস্ত পদ অপেক্ষাকৃত ছোট হয়ে গেছে, কেবল একটি চতুর্ভুজকে রেখে গেছে: এটি সাধারণ বিতরণের লগ ঘনত্ব অবিকল।αβn(n−2)/2αβαβn=3
সম্মিলিতভাবে, এই আচরণগুলি খুব ভালভাবে ব্যাখ্যা করে যে এমনকি ছোট ও β কোনও আইআইডি নরমাল নমুনার অ-চরম কোয়ান্টাইলগুলিও প্রায় সাধারণ দেখায়।αβ
বিশ্লেষণ
কারণ এটা সাধারণীকরণ করা উপযোগী হতে পারে যাক হতে কোন বণ্টনের ফাংশনের, যদিও আমরা মনে আছে এফ = Φ ।FF=Φ
বিটার ( α , β ) ভেরিয়েবলের ঘনত্ব ফাংশন , সংজ্ঞা অনুসারে, আনুপাতিকg(y)(α,β)
yα−1(1−y)β−1dy.
লেটিং সম্ভাব্যতা অবিচ্ছেদ্য এর রুপান্তর হতে এক্স এবং লেখার চ ডেরিভেটিভ জন্য এফ , এটা অবিলম্বে যে এক্স একটি ঘনত্ব আছে সমানুপাতিক করতেy=F(x)xfFx
G(x;α,β)=F(x)α−1(1−F(x))β−1f(x)dx.
কারণ এটি দৃ strongly়ভাবে অবিমোচনীয় বিতরণ (একটি বিটা) এর একঘেয়ে রূপান্তর, যদি না অদ্ভুত হয় তবে রূপান্তরিত বিতরণটিও সর্বমোচনীয় হবে। এটি সাধারণের কতটা কাছাকাছি হতে পারে তা অধ্যয়নের জন্য, আসুন এর ঘনত্বের লগারিদম পরীক্ষা করি,F
logG(x;α,β)=(α−1)logF(x)+(β−1)log(1−F(x))+logf(x)+C(1)
যেখানে হ'ল সাধারণীকরণের অপ্রাসঙ্গিক ধ্রুবক।C
টেলর সিরিজে এর উপাদানগুলি প্রসারিত করুন একটি মান x 0 (যা একটি মোডের কাছাকাছি থাকবে ) এর চারদিকে তিনটি অর্ডার করতে। উদাহরণ হিসেবে বলা যায়, আমরা সম্প্রসারণ লিখতে পারে লগ এফ যেমনlogG(x;α,β)x0logF
logF(x)=cF0+cF1(x−x0)+cF2(x−x0)2+cF3h3
কিছু সঙ্গে | এইচ | ≤ | x - x 0 | । লগের জন্য অনুরূপ স্বরলিপি ব্যবহার করুন ( 1 - এফ ) এবং লগ এফ । h|h|≤|x−x0|log(1−F)logf
লিনিয়ার পদ
মধ্যে রৈখিক শব্দটি যার ফলে হয়ে(1)
g1(α,β)=(α−1)cF1+(β−1)c1−F1+cf1.
যখন জি এর একটি মোড (x0 , এই অভিব্যক্তিটি শূন্য। নোট করুন যেহেতু সহগগুলি x 0 এর ক্রমাগত ফাংশন, যেমন α এবং β বিবিধ হয়, মোড x 0 অবিচ্ছিন্নভাবেও পরিবর্তিত হবে। তদতিরিক্ত , একবার onceএবং β পর্যাপ্ত পরিমাণে বড়হয়ে গেলে, সি এফ 1 পদটি তুলনামূলকভাবে অসম্পূর্ণ হয়ে যায়। আমরা যত সীমা অধ্যয়ন লক্ষ্য রাখি তাহলে α → ∞ এবং β → ∞ , যার জন্য α : β ধ্রুবক অনুপাতে থাকার বিষয়টি মতেই γG(;α,β)x0αβx0αβcf1α→∞β→∞ α:βγ, তাই আমরা একবার এবং সবার জন্য একটি বেস পয়েন্ট forx0
γcF1+c1−F1=0.
একটি সুন্দর ক্ষেত্রে কোথায় , যেখানে α = β সর্বত্র, এবং এফ সম্পর্কে প্রতিসম হয় 0 । যে ক্ষেত্রে এটা সুস্পষ্ট এক্স 0 = এফ ( 0 ) = 1 / 2 ।γ=1α=βF0x0=F(0)=1/2
আমরা একটি পদ্ধতি অর্জন করেছি যার মাধ্যমে (ক) সীমাবদ্ধভাবে, টেলর সিরিজের প্রথম-আদেশের শর্তটি অদৃশ্য হয়ে যায় এবং (খ) সুনির্দিষ্ট বর্ণিত বিশেষ ক্ষেত্রে প্রথম আদেশের মেয়াদ সর্বদা শূন্য থাকে।
Quadratic terms
These are the sum
g2(α,β)=(α−1)cF2+(β−1)c1−F2+cf2.
একটি সাধারণ বন্টনের, যার দ্বিঘাত শব্দ তুলনায় , আমরা অনুমান করতে পারে যে - 1 / ( 2 G 2 ( α , β ) ) প্রায় ভ্যারিয়েন্স হয় জি । আমাদের প্রমিত যাক জি rescaling দ্বারা এক্স তার বর্গমূল দ্বারা। আমাদের সত্যিই বিশদ প্রয়োজন নেই; এটি বোঝার পক্ষে যথেষ্ট যে এই পুনরুদ্ধারটি ( x এর সহগ) গুণ করে চলেছে−(1/2)(x−x0)2/σ2−1/(2g2(α,β))GGx(x−x0)n in the Taylor expansion by (−1/(2g2(α,β)))n/2.
Remainder term
Here's the punchline: the term of order n in the Taylor expansion is, according to our notation,
gn(α,β)=(α−1)cFn+(β−1)c1−Fn+cfn.
After standardization, it becomes
g′n(α,β)=gn(α,β)(−2g2(α,β))n/2).
Both of the gi are affine combination of α and β. By raising the denominator to the n/2 power, the net behavior is of order −(n−2)/2 in each of α and β. As these parameters grow large, then, each term in the Taylor expansion after the second decreases to zero asymptotically. In particular, the third-order remainder term becomes arbitrarily small.
The case when F is normal
The vanishing of the remainder term is particularly fast when F is standard Normal, because in this case f(x) is purely quadratic: it contributes nothing to the remainder terms. Consequently, the deviation of G from normality depends solely on the deviation between Fα−1(1−F)β−1 and normality.
This deviation is fairly small even for small α and β. To illustrate, consider the case α=β. G is symmetric, whence the order-3 term vanishes altogether. The remainder is of order 4 in x−x0=x.
Here is a plot showing how the standardized fourth order term changes with small values of α>1:
The value starts out at 0 for α=β=1, because then the distribution obviously is Normal (Φ−1 applied to a uniform distribution, which is what Beta(1,1) is, gives a standard Normal distribution). Although it increases rapidly, it tops off at less than 0.008--which is practically indistinguishable from zero. After that the asymptotic reciprocal decay kicks in, making the distribution ever closer to Normal as α increases beyond 2.