কীভাবে পয়সন বিতরণটি সাধারণ বন্টন থেকে আলাদা?


29

আমি একটি ভেক্টর তৈরি করেছি যার একটি পোইসন বিতরণ রয়েছে, নীচে:

x = rpois(1000,10)

যদি আমি ব্যবহার করে কোনও হিস্টোগ্রাম তৈরি করি hist(x)তবে বিতরণটি পরিচিত বেল-আকৃতির স্বাভাবিক বন্টনের মতো দেখায়। তবে কোলমোগোরভ-স্মারনফ পরীক্ষা ব্যবহার করে ks.test(x, 'pnorm',10,3)বলেছে যে খুব কম pমূল্যের কারণে বিতরণটি একটি সাধারণ বিতরণের চেয়ে উল্লেখযোগ্যভাবে আলাদা ।

সুতরাং আমার প্রশ্নটি হল: হিস্টোগ্রাম যখন সাধারণ বিতরণের সাথে একই রকম দেখায় তখন পয়সন বিতরণ কীভাবে একটি সাধারণ বিতরণ থেকে আলাদা হয়?


এছাড়াও (ডেভিডের উত্তরে অ্যাড-ইন হিসাবে): এটি পড়ুন ( stats.stackexchange.com/a/2498/603 ) এবং আপনার নমুনার আকারটি 100 এ সেট করুন এবং এটি তারতম্যটি দেখুন।
ব্যবহারকারী 60

উত্তর:


20
  1. একটি সাধারণ বিতরণ অবিচ্ছিন্ন থাকাকালীন একটি পোইসন বিতরণ পৃথক হয় এবং একটি পায়সন এলোমেলো পরিবর্তনশীল সর্বদা> = 0 থাকে Thus সুতরাং, কোলগোমোরভ-স্মারনভ পরীক্ষা প্রায়শই পার্থক্য বলতে সক্ষম হবে।

  2. যখন পইসন বিতরণের গড় বড় হয়, এটি একটি সাধারণ বিতরণের অনুরূপ হয়ে যায়। তবে এটিrpois(1000, 10) এমনকি সাধারণ বিতরণের মতো দেখতেও লাগে না (এটি 0 এ ছোট হয় এবং ডান লেজটি খুব দীর্ঘ)।

  3. আপনি এর ks.test(..., 'pnorm', 10, 3)চেয়ে তুলনা করছেন কেন ks.test(..., 'pnorm', 10, sqrt(10))? 3 এবং between এর মধ্যে পার্থক্যটি সামান্য তবে বিতরণগুলির সাথে তুলনা করার সময় নিজেই একটি পার্থক্য আনবে। এমনকি যদি বিতরণটি সত্যিকার অর্থে স্বাভাবিক হয় তবে আপনি একটি বিরোধী-রক্ষণশীল পি-মান বিতরণ সহ শেষ করবেন:10

    set.seed(1)
    
    hist(replicate(10000, ks.test(rnorm(1000, 10, sqrt(10)), 'pnorm', 10, 3)$p.value))
    

এখানে চিত্র বর্ণনা লিখুন


3
প্রায়শই লোকেরা কিছু অস্পষ্টভাবে প্রতিসাম্য দেখবে এবং ধরে নেবে এটি "স্বাভাবিক" বলে মনে হচ্ছে। আমি সন্দেহ করি যে @ রোজ যা দেখেছিলেন।
ফ্রেইজো

2
নোট করুন যে কেএস পরীক্ষাটি সাধারণত অবিচ্ছিন্ন বিতরণ অনুমান করে, সুতরাং এই ক্ষেত্রে রিপোর্ট করা পি-মানের উপর নির্ভর করা (এছাড়াও) কিছুটা সন্দেহ হতে পারে।
কার্ডিনাল

1
সত্য: চলমান hist(replicate(1000, ks.test(rpois(1000, 10), rpois(1000, 10))$p.value))দেখায় যে দুটি অভিন্ন পয়সন বিতরণের তুলনা করা পরীক্ষা খুব রক্ষণশীল হবে।
ডেভিড রবিনসন

@ ফ্রেইজো: আসলেই। এই থিমটিতে আমাদের
সিলভারফিশ

17

এটি বোঝার জন্য এখানে আরও সহজ উপায়:

আপনি দ্বিপদী বিতরণকে বেশিরভাগ বিতরণের "মা" হিসাবে দেখতে পারেন। সাধারণ বিতরণ দ্বিগুণ বিতরণ মাত্র একটি আনুমানিক যখন n যথেষ্ট পরিমাণে বড় হয়ে যায়। প্রকৃতপক্ষে, আনুমানিক দ্বিপদী বিতরণ করার চেষ্টা করার সময় আব্রাহাম ডি মাইভ্রে প্রয়োজনীয়ভাবে সাধারণ বিতরণ আবিষ্কার করেছিলেন কারণ দ্বিপদী বিতরণ গণনা করার জন্য এটি দ্রুত হাতের বাইরে চলে যায় কারণ বিশেষত যখন আপনার কম্পিউটার ( রেফারেন্স ) নেই don't

পইসন বিতরণও দ্বিপদী বিতরণের এক অন্য মাত্রা তবে এটি যখন এন বড় হয় এবং পি ছোট হয় বা সাধারণত স্পষ্টভাবে যখন গড় প্রায় বৈচিত্রের সমান হয় তখন এটি সাধারণত বিতরণের তুলনায় অনেক ভাল থাকে (মনে রাখবেন যে দ্বিপদী বিতরণের জন্য গড় = এনপি এবং ভার = এনপি (1-পি)) ( রেফারেন্স )। কেন এই বিশেষ পরিস্থিতি এত গুরুত্বপূর্ণ? স্পষ্টতই এটি বাস্তব জগতে অনেকগুলি পৃষ্ঠভূমিতে আসে এবং সে কারণেই আমাদের এই "বিশেষ" প্রায় অনুমান হয়। নীচে উদাহরণস্বরূপ চিত্রগুলি চিত্রিত করে যেখানে পইসন আনুমানিকতা সত্যিই দুর্দান্ত কাজ করে।

উদাহরণ

আমাদের ১০,০০,০০০ কম্পিউটারের ডাটাসেন্টার রয়েছে। আজ প্রদত্ত যে কোনও কম্পিউটারের ব্যর্থতার সম্ভাবনা 0.001। সুতরাং গড়ে এনপি = 100 কম্পিউটার ডেটা সেন্টারে ব্যর্থ হয়। আজ কেবল ৫০ টি কম্পিউটারই ব্যর্থ হওয়ার সম্ভাবনা কী?

Binomial: 1.208E-8
Poisson: 1.223E-8
Normal: 1.469E-7

প্রকৃতপক্ষে, সাধারণ বিতরণের জন্য আনুমানিক মানটি বন্টনের লেজে যাওয়ার সাথে সাথে ড্রেনের নিচে নেমে যায় তবে পইসন খুব সুন্দরভাবে ধরে রেখেছেন। উপরের উদাহরণে, আসুন বিবেচনা করুন যে কেবলমাত্র 5 টি কম্পিউটার আজ ব্যর্থ হবার সম্ভাবনাটি কী?

Binomial: 2.96E-36 
Poisson: 3.1E-36
Normal: 9.6E-22

আশা করি, এটি আপনাকে এই 3 টি বিতরণের আরও ভাল স্বজ্ঞাত বোঝা দেয়।


কি আশ্চর্যজনক এবং দুর্দান্ত উত্তর! অনেক ধন্যবাদ. :)
বোরা এম আল্পার

11

λnpnpn=λ/n

একটি বরং দীর্ঘতর বিকাশ এই ব্লগে পাওয়া যাবে ।

XnBinomial(n,λ/n) k

P(Xn=k)=n!k!(nk)!(λn)k(1λn)nk=n!nk(nk)!1λkk!(1λ/n)neλ(1λ/n)k1.

nk

P(Xn=k)eλλkk!,
n(1λ/n)neλ

npdN(np,np(1p))পি পি এন = λ / এন 0 λ এনnppn=λ/n0λn


(+1) সাইটে স্বাগতম। আমি কয়েকটি সম্পাদনা করেছি; দয়া করে পরীক্ষা করুন যে আমি প্রক্রিয়াটিতে কোনও ত্রুটি চালু করি নি। আমি শেষ বাক্যে খুব শেষ বাক্যাংশটি কী করব তা সম্পর্কে আমি নিশ্চিত ছিলাম না। কিছু অতিরিক্ত স্পষ্টতা এখানে সহায়ক হতে পারে।
কার্ডিনাল

1
npnλpλ

1
nλpn1/2

ধন্যবাদ। আপনি এখন যা বলতে চাইছেন তা আমি দেখতে পাচ্ছি। আমি সাধারনত একমত যে এই প্যারামিটারগুলির মধ্যে সম্পর্কের সাথে কিছু যত্ন নেওয়া দরকার, যা নির্দিষ্ট হিসাবে বিবেচিত হয় এবং যা অন্যদের সাথে পৃথক হয়। :)
কার্ডিনাল

λ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.