অর্ডার পরিসংখ্যানগুলির মাধ্যমে অনুমানকে পার্সেন্টাইলে রূপান্তর করে


10

পরামিতি সহ, আলফা স্থিতিশীল বিতরণ থেকে নমুনা দেওয়া আইআইডি র্যান্ডম ভেরিয়েবলগুলির ক্রম Let ।X1,X2,,X3nα=1.5,β=0,c=1.0,μ=1.0

এখন অনুক্রমটি বিবেচনা করুন , যেখানে , । Y j + 1 = X 3 j + 1 X 3 j + 2 X 3 j + 3 - 1 জে = 0 , , এন - 1Y1,Y2,,YnYj+1=X3j+1X3j+2X3j+31j=0,,n1

আমি পারসেন্টাইল অনুমান করতে ।0.01

আমার ধারণাটি মন্টে-কার্লো সিমুলেশন সাজানোর জন্য:

l = 1;
while(l < max_iterations)
{
  Generate $X_1, X_2, \ldots, X_{3n}$ and compute $Y_1, Y_2, \ldots, Y_{n}$;
  Compute $0.01-$percentile of current repetition;
  Compute mean $0.01-$percentile of all the iterations performed;
  Compute variance of $0.01-$percentile of all the iterations performed;
  Calculate confidence interval for the estimate of the $0.01-$percentile;

  if(confidence interval is small enough)
    break;

}

সব নমুনা গড় কলিং শতকরা হতে নির্ণিত এবং তাদের ভ্যারিয়েন্স , জন্য উপযুক্ত আস্থা ব্যবধান গনা , আমি অবলম্বন থেকে কেন্দ্রীয় সীমা উপপাদ্য এর স্ট্রং ফর্ম :- μ এন σ 2 এন μ0.01μ^nσ^n2μ

যাক সঙ্গে IID র্যান্ডম ভেরিয়েবল একটা ক্রম হতে এবং । নমুনাটির অর্থ হিসাবে নির্ধারণ করুন । তারপরে, এর একটি সীমিত মান সাধারণ বন্টন রয়েছে, যেমন [ এক্স আই ] = μX1,X2,E[Xi]=μμ এন = ( 1 / এন ) Σ এন আমি = 1 এক্স আমি ( μ এন - μ ) / 0<V[Xi]=σ2<μ^n=(1/n)i=1nXiμ এন -μ(μ^nμ)/σ2/n

μ^nμσ2/nnN(0,1).

এবং স্লটকসির উপপাদ্যটি এই সিদ্ধান্তে পৌঁছেছে যে

nμ^nμσ^n2nN(0,1).

তারপর একটি -confidence ব্যবধান জন্য হয়μ(1α)×100%μ

জেড1-α/2(1-α/2)

Iα=[μ^nz1α/2σ^n2n,μ^n+z1α/2σ^n2n],
যেখানে the হ'ল স্ট্যান্ডার্ড সাধারণ বিতরণের পরিমাণ।z1α/2(1α/2)

প্রশ্নাবলী:

1) আমার পদ্ধতির সঠিক? কীভাবে আমি সিএলটি-র প্রয়োগকে ন্যায়সঙ্গত করতে পারি? মানে, আমি কীভাবে দেখাব যে বৈকল্পিক সীমাবদ্ধ? (আমার কি এর বৈকল্পিকতাগুলি ? কারণ আমি মনে করি না এটি সীমাবদ্ধ ...)Yj

2) আমি কীভাবে দেখাতে পারি যে সমস্ত নমুনা পার্সেন্টাইল গণনা করা হয় তার গড় মান পারসেন্টাইলের সত্যিকার মানে রূপান্তর করে ? (আমার অর্ডার পরিসংখ্যান ব্যবহার করা উচিত তবে কীভাবে এগিয়ে আসবেন সে সম্পর্কে আমি অনিশ্চিত; তথ্যসূত্রগুলি প্রশংসা করা হয়))0.01 -0.010.01


3
স্ট্যাটস.স্ট্যাকেক্সেঞ্জিং / কোয়েশনস / 45124 এ স্যাম্পল মিডিয়ানদের প্রয়োগ করা সমস্ত পদ্ধতি অন্যান্য পারসেন্টাইলগুলিতেও প্রযোজ্য। বাস্তবে, আপনার প্রশ্নটি সেই একইরকম তবে কেবল 50 তম পার্সেন্টাইলকে 1 ম (বা 0.01 সম্ভবত?) শতাংশের সাথে প্রতিস্থাপন করবে।
হোবার

@ হুবুহু, আপনার এই প্রশ্নের উত্তরটি খুব ভাল। তবে, গ্লেন_ বি তার পোস্টের শেষে (স্বীকৃত উত্তর) বলেছেন যে আনুমানিক স্বাভাবিকতা "চূড়ান্ত কোয়ান্টাইলগুলিকে ধরে রাখে না, কারণ সিএলটি সেখানে লাথি দেয় না (জেডের গড় গড় asyptotically স্বাভাবিক হবে না) )। চরম মানগুলির জন্য আপনার আলাদা তত্ত্বের প্রয়োজন need এই বিবৃতি সম্পর্কে আমার কতটা উদ্বিগ্ন হওয়া উচিত?
মায়া

2
আমি বিশ্বাস করি তিনি চূড়ান্ত কোয়ান্টাইলগুলি সত্যই বোঝাতে পারেননি , তবে তারা কেবল চূড়ান্তভাবে চূড়ান্ত করেছে। (প্রকৃতপক্ষে, তিনি একই বাক্যটির শেষে সেই ল্যাপস সংশোধন করেছিলেন, তাদের "চূড়ান্ত মান" বলে উল্লেখ করেছেন) পার্থক্যটি হ'ল একটি চূড়ান্ত পরিমাণ, যেমন .01 পার্সেন্টাইল (যা নীচের 1/10000 তম চিহ্নিত করে) বিতরণ) সীমাতে স্থিতিশীল হবে কারণ একটি নমুনায় আরও বেশি তথ্য এখনও নীচে নেমে আসবে এবং আরও এবং আরও কিছু শতাংশের উপরে চলে যাবে। একটি সঙ্গে চরম (যেমন সর্বাধিক বা ন্যূনতম হিসাবে) যে এখন আর তা নেই।
whuber

এটি এমন একটি সমস্যা যা অভিজ্ঞতামূলক প্রক্রিয়া তত্ত্ব ব্যবহার করে সাধারণভাবে সমাধান করা উচিত। আপনার প্রশিক্ষণের স্তর সম্পর্কে কিছু সহায়তা সহায়ক হবে।
অ্যাডামো

উত্তর:


2

এর ভিন্নতা সীমাবদ্ধ নয়। Y এটি কারণ 3/2 (একটি হল্টজমার্ক বিতরণ ) সহ একটি আলফা-স্থিতিশীল ভেরিয়েবল সসীম প্রত্যাশা থাকে তবে এর বৈচিত্রটি অসীম। যদি এর একটি সীমাবদ্ধ বৈকল্পিকতা ছিল , তবে এর স্বাধীনতা এবং বৈকল্পিক সংজ্ঞাটি ব্যবহার করে আমরা গণনা করতে পারিα = 3 / 2 μ ওয়াই σ 2 এক্স আমিXα=3/2μYσ2Xi

σ2=Var(Y)=E(Y2)E(Y)2=E(X12X22X32)E(X1X2X3)2=E(X2)3(E(X)3)2=(Var(X)+E(X)2)3μ6=(Var(X)+μ2)3μ6.

এ এই ঘন সমীকরণটির কমপক্ষে একটি আসল সমাধান রয়েছে (এবং তিনটি সমাধান পর্যন্ত, তবে আর নেই), বোঝানো সীমাবদ্ধ হবে - তবে তা নয়। এই বৈপরীত্য দাবিটি প্রমাণ করে।Var(X)Var(X)


দ্বিতীয় প্রশ্নের দিকে ঘুরে আসা যাক।

নমুনা বড় হওয়ার সাথে সাথে যে কোনও নমুনা কোয়ান্টাইল প্রকৃত কোয়ান্টাইলে রূপান্তরিত হয়। পরবর্তী কয়েকটি অনুচ্ছেদ এই সাধারণ বিষয়টিকে প্রমাণ করে।

সম্পর্কিত সম্ভাব্যতা (বা এবং মধ্যে অন্য কোনও মান , একচেটিয়া) হওয়া যাক। ডিস্ট্রিবিউশন ফাংশনটির জন্য লিখুন , যাতে হয় the । কোয়ান্টাইল।q=0.0101FZq=F1(q)qth

আমাদের কেবল ধরে নেওয়া দরকার যে (কোয়ান্টাইল ফাংশন) অবিচ্ছিন্ন। এটি আমাদের আশ্বাস দেয় যে যে কোনও এর জন্য সম্ভাব্যতা রয়েছে এবং যার জন্যF1ϵ>0q<qq+>q

F(Zqϵ)=q,F(Zq+ϵ)=q+,

এবং যে যেমন , ব্যবধান সীমা হয় ।ϵ0[q,q+]{q}

আকারের কোনো IID নমুনা বিবেচনা । কম এই নমুনা উপাদানের সংখ্যা একটি বাইনমিয়াল হয়েছে , বিতরণ কারণ প্রতিটি উপাদান স্বাধীনভাবে সুযোগ রয়েছে হচ্ছে কম । কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য (স্বাভাবিক এক!) বোঝায় যে পর্যাপ্ত পরিমাণে বড় , চেয়ে কম উপাদানগুলির সংখ্যা এবং ভেরিয়েন্স সহ একটি সাধারণ বিতরণ দ্বারা দেওয়া হয় ( একটি নির্বিচারে ভাল আনুমানিক)। মানক সাধারণ বিতরণের সিডিএফ হতে দিন । এই পরিমাণটি ছাড়িয়েছেnZq(q,n)qZqnZqnqnq(1q)Φnq সুতরাং ইচ্ছামত কাছাকাছি

1Φ(nqnqnq(1q))=1Φ(nqqq(1q)).

কারণ উপর যুক্তি ডান দিকে একটি নির্দিষ্ট একাধিক হয় , এটা ইচ্ছামত বড় হিসাবে বৃদ্ধি বৃদ্ধি। যেহেতু একটি সিডিএফ, তাই এর সম্ভাব্যতার সীমাবদ্ধতা মান শূন্য দেখায় এর মান নির্বিচারে কাছাকাছি পৌঁছে ।ΦnnΦ1

কথায়: সীমা, এটা প্রায় নিশ্চয় ক্ষেত্রে যে নমুনা উপাদানের কম না হয় । একটি অনুরূপ যুক্তি এটা প্রায় নিশ্চয় ক্ষেত্রে যে প্রমাণ নমুনা উপাদানের চেয়ে অনেক বেশী হয় না । একসঙ্গে, এই পরোক্ষভাবে পর্যাপ্ত বৃহৎ নমুনা সমাংশক মধ্যে মিথ্যা অত্যন্ত সম্ভবত এবংnqZqnqZq+qZqϵZq+ϵ

সিমুলেশন কাজ করবে তা জানতে আমাদের কেবল এটিই প্রয়োজন। আপনি যেকোন পছন্দসই নির্ভুলতা এবং আত্মবিশ্বাসের স্তর চয়ন করতে পারেন এবং জানেন যে যথেষ্ট পরিমাণে বড় নমুনার আকার , সেই নমুনায় নিকটতম অর্ডার পরিসংখ্যানের কমপক্ষে থাকার সুযোগ থাকবে সত্য কোয়ান্টাইল ।ϵ1αnnq1αϵZq


একটি সিমুলেশন কাজ করবে যে স্থাপন করে, বাকি সহজ। আত্মবিশ্বাস সীমাটি দ্বিপদী বিতরণের সীমা থেকে পাওয়া যায় এবং তারপরে ব্যাক-ট্রান্সফর্মড হয়। আরও ব্যাখ্যা ( কোয়ান্টাইলের জন্য, তবে সমস্ত কোয়ান্টাইলকে সাধারণীকরণের জন্য) নমুনা মিডিয়ানদের জন্য কেন্দ্রীয় সীমাবদ্ধ তত্ত্বের উত্তরগুলিতে পাওয়া যাবে ।q=0.50

চিত্র: 1000 পুনরাবৃত্তির জন্য এন = 300 সহ ওয়াই এর 0.01 কোয়ান্টাইলের হিস্টোগ্রাম

এর কোয়ান্টাইলটি is ণাত্মক । এটির নমুনা বিতরণ অত্যন্ত স্কিউড। স্কিউ কমানোর জন্য এই চিত্র শো একটি হিস্টোগ্রাম নেগেটিভ লগারিদমের 1,000 কৃত্রিম নমুনার মান ।Y n = 300 Yq=0.01Yn=300Y

library(stabledist)
n <- 3e2
q <- 0.01
n.sim <- 1e3

Y.q <- replicate(n.sim, {
  Y <- apply(matrix(rstable(3*n, 3/2, 0, 1, 1), nrow=3), 2, prod) - 1
  log(-quantile(Y, 0.01))
})
m <- median(-exp(Y.q))
hist(Y.q, freq=FALSE, 
     main=paste("Histogram of the", q, "quantile of Y for", n.sim, "iterations" ),
     xlab="Log(-Y_q)",
     sub=paste("Median is", signif(m, 4), 
               "Negative log is", signif(log(-m), 4)),
     cex.sub=0.8)
abline(v=log(-m), col="Red", lwd=2)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.