পোইসন বিতরণের সাধারণ অনুমান


12

এখানে উইকিপিডিয়ায় বলা হয়েছে:

এর যথেষ্ট বৃহৎ মানের জন্য (বলতে λ> 1000 ), গড় সঙ্গে সাধারণ বণ্টনের λ এবং ভ্যারিয়েন্স λ (আদর্শ বিচ্যুতি যদি \ sqrt {\ ল্যামডা} ), পইসন বিতরণের একটি চমৎকার পড়তা হয়। তাহলে λ 10 সম্পর্কে তার চেয়ে অনেক বেশী হয়, তাহলে সাধারণ বণ্টনের একটি ভাল পড়তা যদি একটি উপযুক্ত ধারাবাহিকতা সংশোধন, অর্থাত, সঞ্চালিত হয় পি (এক্স ≤ x) যেখানে (লোয়ার-কেস) এক্স একটি অ-নেতিবাচক পূর্ণসংখ্যা, দ্বারা প্রতিস্থাপিত হয় পি (এক্স ≤ x + 0.5)।λλ>1000λλλλP(Xx),xP(Xx+0.5).

FPoisson(x;λ)Fnormal(x;μ=λ,σ2=λ)

দুর্ভাগ্যক্রমে এটি উদ্ধৃত হয় না। আমি কিছু কঠোরতার সাথে এটি প্রদর্শন / প্রমাণ করতে সক্ষম হতে চাই। আপনি আসলে কীভাবে বলতে পারেন যে সাধারণ বিতরণটি একটি ভাল আনুমানিকতা হয় যখন λ>1000 , আপনি কীভাবে এই 'চমত্কার' সান্নিধ্যটি মেটান, কী কী ব্যবস্থা ব্যবহার করা হয়েছিল?

এর সাথে আমার কাছে পৌঁছে যাওয়া এখানেই রয়েছে যেখানে জন বেরি – এসিন উপপাদ্যটি ব্যবহার করার বিষয়ে কথা বলেছেন এবং দুটি সিডিএফ-তে ত্রুটিটি প্রায় অনুমান করে। আমি যা দেখতে পাচ্ছি সে থেকে সে λ1000 এর কোনও মান চেষ্টা করে না ।


6
'ভাল' সংজ্ঞা না দিয়ে আপনি এটি প্রমাণ করতে পারবেন না । (আপনি একটি অ্যাসিম্পটোটিক ফলাফল প্রমাণ করতে পারেন, তবে আপনি নিজের মানদণ্ডটি নির্দিষ্ট না করে নির্দিষ্ট নমুনার আকারে এটিকে 'ভাল' হিসাবে ঘোষণা করতে পারবেন না)) আপনি সরাসরি এর উদাহরণ দিয়ে এর আচরণটি প্রদর্শন করতে পারেন (যেখান থেকে লোকেরা দেখতে পাবে যে 'কতটা ভাল' তাদের নিজস্ব আলো দ্বারা)। সাধারণ মানদণ্ডের জন্য লোকেদের ব্যবহারের জন্য, যতক্ষণ আপনি লেজের গভীরে না যান ততক্ষণ জন্য একটি ধারাবাহিকতা সংশোধন ভালভাবে কাজ করে । λ>10
গ্লেন_বি -রিনস্টেট মনিকা

1
(আরও সুনির্দিষ্টভাবে বলতে গেলে, যদি আপনার মানদণ্ডটি সম্পূর্ণ ত্রুটি হয় তবে আপনি সম্ভবত 10 এর মতো ছোট নমুনা আকারে সর্বত্র 'ভাল' অর্জন করতে পারেন, তবে বেশিরভাগ লোক আপেক্ষিক ত্রুটির আরও নিকটে কিছু সম্পর্কে
যত্নবান হন

উত্তর:


7

ধরুন পরামিতি সঙ্গে পইসন হয় , এবং গড় এবং ভ্যারিয়েন্স সঙ্গে স্বাভাবিক । আমার কাছে মনে হচ্ছে উপযুক্ত তুলনাটি এবং । সরলতার জন্য এখানে আমি লিখি , অর্থাত্ থেকে স্ট্যান্ডার্ড বিচ্যুতির সাথে আমরা আগ্রহী ।λ ওয়াই λ পিআর ( এক্স = এন ) পিআর ( ওয়াই [ এন - 1)XλYλPr(X=n)এন=λ+α√ √Pr(Y[n12,n+12]) এনαn=λ+αλnα

তাই আমি প্রতারণা করেছি। আমি ম্যাথমেটিকাকে ব্যবহার করেছি। সুতরাং উভয় এবং থেকে asymptotic হয় হিসাবে । কিন্তু তাদের পার্থক্য থেকে মধ্যে asymptotic হয় তাহলে আপনি এটি ফাংশন হিসাবে পরিকল্পনা করেছেন , আপনি http://www.johndcook.com/blog/normal_approx_to_poisson/ এ দ্বিতীয় থেকে শেষ চিত্র হিসাবে দেখানো হয়েছে একই বক্ররেখা পাবেন ।pr ( ওয়াই [ এন - 1Pr(X=n)Pr(Y[n12,n+12])λα(α2-3)-α2/2

12πλeα2/2
λα
α(α23)eα2/262πλ
α

আমি যে আদেশগুলি ব্যবহার করেছি তা এখানে:

  n = lambda + alpha Sqrt[lambda];
  p1 = Exp[-lambda] lambda^n/n!;
  p2 = Integrate[1/Sqrt[2 Pi]/Sqrt[lambda] Exp[-(x-lambda)^2/2/lambda], {x, n-1/2, n+1/2}];
  Series[p1, {lambda, Infinity, 1}]
  Series[p2, {lambda, Infinity, 1}]

এছাড়াও, পরীক্ষা একটি বিট সঙ্গে, এটা আমার মনে হচ্ছে যে একটি ভাল মধ্যে asymptotic পড়তা হয় । তারপরে ত্রুটিটি হ'ল যা প্রায় বার ছোট।pr ( ওয়াই [ এন - α 2 / 6 , এন + + 1 - α 2 / 6 ] ) - ( 5 α 4 - 9 α 2 - 6 )- α 2 / 2Pr(X=n)Pr(Y[nα2/6,n+1α2/6])

(5α49α26)eα2/2722πλ3/2
λ

2

Glen_b সঠিক যে "ভাল ফিট" একটি খুব বিষয়গত ধারণা। তবে, যদি আপনি যাচাই করতে চান যে আপনার পোয়েসন বিতরণ যথাযথভাবে স্বাভাবিক, আপনি নকল অনুমানটি with সহ একটি অনুমানের কলম্বোরভ-স্মারনভ পরীক্ষা ব্যবহার করতে পারেন সিডিএফ একটি ল্যাম্বদা, mb ল্যাম্বদা বিতরণ থেকে অনুমান করে এসেছে আপনার নমুনাটি পোয়েসন (mb ) থেকে আসবে । যেহেতু আপনি প্রকৃতপক্ষে কোনও নমুনা পরীক্ষা করছেন না, তবে অন্যটির বিপরীতে একটি বিতরণ করছেন, তাই আপনাকে এই হাইপোথিয়াল টেস্টের জন্য যে নমুনার আকার এবং তাত্পর্য স্তরটি ধরে নিয়েছেন সে সম্পর্কে সতর্কতার সাথে চিন্তা করতে হবে (যেহেতু আমরা কেএস পরীক্ষাটি তার সাধারণ ফ্যাশনে ব্যবহার করছি না)। এটাই:এন ( λ , λ ) λH0:N(λ,λ)λ

  • একটি প্রতিনিধি চয়ন করুন, অনুমানের নমুনার আকার, এন এবং পরীক্ষার তাত্পর্য স্তরটিকে একটি আদর্শ মানের সাথে সমন্বিত করুন, উদাহরণস্বরূপ, 5%।

এখন, এই পরীক্ষার জন্য টাইপ II ত্রুটি হার গণনা করুন আপনার ডেটা আসলে পোয়েসন ( ) থেকে এসেছে তা ধরে নিয়ে । আপনার সাধারণ ডিস্ট্রিবিউশন সহ ফিটের ডিগ্রি এই ধরণের দ্বিতীয় ত্রুটি হার হবে, এই অর্থে যে আপনার নির্দিষ্ট পোয়েজন বিতরণ থেকে আকার এন এর নমুনাগুলি, গড়ে, আপনার নির্বাচিত কেএস নরমাল্টি টেস্টের দ্বারা time সময়ের % গ্রহণ করা হবে তাত্পর্য স্তর।বিটাλβ

যাইহোক, "ফিটের সদ্ব্যবহার" অনুভূতি অর্জনের একটাই উপায়। যাইহোক, সমস্ত "ধার্মিকতা" এর কিছু বিষয়গত ধারণার উপর নির্ভর করে যা আপনাকে নিজের জন্য নির্ধারণ করতে হবে।


2

দ্বিপদী বিতরণ থেকে প্রাপ্ত বিপর্যয় আপনাকে কিছুটা অন্তর্দৃষ্টি পেতে পারে।

আমাদের কাছে দ্বিপদী র্যান্ডম ভেরিয়েবল রয়েছে;

p(x)=(nx)px(1p)nx

এটি বিকল্পভাবে পুনরাবৃত্তভাবে গণনা করা যেতে পারে;

p(x)=(nx+1)px(1p)p(x1)

আপনি যদি প্রাথমিক শর্তটি রাখেন;

p(0)=(1p)n

এখন ধরে নেওয়া যাক যে বড় এবং ছোট তবে গড় সাফল্য ধ্রুবক । তারপরে আমরা নিম্নলিখিতগুলি করতে পারি;npp(x)(np=λ)

P(X=i)=(ni)px(1p)nx

আমরা সেই ব্যবহার করি ।p=λ/n

P(X=i)=n!(ni)!i!(λn)i(1λn)ni

আমরা কিছু পরিবর্তনশীল চারপাশে স্যুইচ এবং মূল্যায়ন;

P(X=i)=n(n1)(n2)(ni+1)niλii!(1λn)n(1λn)i

ক্যালকুলাস থেকে আমরা জানি যে । আমরা আরও জানি যে কারণ উপরের এবং নীচে উভয়ই ডিগ্রি এর বহুভুজ ।limn(1+x/n)n=ex[n(n1)(n2)(ni+1)]/ni1i

এটি এই সিদ্ধান্তে পৌঁছায় যে :n

P(X=i)eλλii!

তারপরে আপনি সংজ্ঞাটির মাধ্যমে এবং যাচাই করতে পারেন । আমরা জানি যে দ্বি-দ্বি বিতরণ যতক্ষণ না আপনি ধারাবাহিকতার জন্য সংশোধন করেন ততক্ষণ দে মাইভ্রে-ল্যাপ্লেস উপপাদকের শর্তে স্বাভাবিকের সমান হয়, এজন্য দ্বারা প্রতিস্থাপিত হয় ।E(X)=λVar(X)=λপি ( এক্স এক্স )P(Xx)P(Xx+0.5)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.