দুটি পোইসন নমুনার একইরকম আছে কিনা তা পরীক্ষা করা হচ্ছে


30

এটি একটি প্রাথমিক প্রশ্ন, তবে আমি উত্তরটি খুঁজে পাইনি। আমার দুটি পরিমাপ রয়েছে: টাইম টি 1 এ এন 1 ইভেন্ট এবং টি টি 2-তে এন 2 ইভেন্ট, উভয়ই পয়েসন প্রসেস দ্বারা উত্পাদিত (বলুন) সম্ভবত বিভিন্ন-ল্যাম্বডা মান সহ।

এটি আসলে একটি সংবাদ নিবন্ধ থেকে এসেছে, যা মূলত দাবি করে যে যেহেতু যে দুটি পৃথক, তবে আমি নিশ্চিত যে দাবিটি বৈধ কিনা not মনে করুন যে সময়সীমাগুলি দূষিতভাবে বেছে নেওয়া হয়নি (এক বা অন্যটিতে ইভেন্টগুলি সর্বাধিক করার জন্য)।n1/t1n2/t2

আমি শুধু একটি করতে পারি টি -test, বা যে উপযুক্ত হবে না? বিতরণগুলিকে আনুমানিকভাবে কল করতে আমার পক্ষে ইভেন্টের সংখ্যা খুব কম small



1
বিজ্ঞানের সাংবাদিকতার দুর্দান্ত নমুনা, সেখানে ...
ম্যাট পার্কার

1
হ্যাঁ ... আপনি দেখতে পাচ্ছেন কেন আমি ব্যবহৃত পরিসংখ্যান পরীক্ষা করতে চেয়েছিলাম।
চার্লস

উত্তর:


25

পোইসন মানে পরীক্ষা করার জন্য, শর্তসাপেক্ষ পদ্ধতিটি প্রিজোরোভস্কি এবং উইলেন্স্কি (1940) দ্বারা প্রস্তাবিত হয়েছিল। X1 + X2 প্রদত্ত এক্স 1 এর শর্তাধীন বিতরণ দ্বিপদী বিতরণ অনুসরণ করে যার সাফল্য সম্ভাবনা দুটি ল্যাম্বডা অনুপাতের একটি কার্যকারিতা। সুতরাং, দ্বিপাক্ষিক সাফল্যের সম্ভাবনা সম্পর্কে ধারণা তৈরি করার সঠিক পদ্ধতিগুলি থেকে অনুমানের পরীক্ষা এবং অন্তর অন্তর নির্ধারণের পদ্ধতিগুলি সহজেই বিকাশ করা যেতে পারে। এই উদ্দেশ্যে সাধারণত দুটি পদ্ধতি বিবেচনা করা হয়,

  1. সি-পরীক্ষা
  2. ই-পরীক্ষা

এই দুটি পরীক্ষার বিবরণ আপনি এই কাগজে খুঁজে পেতে পারেন। দুটি পইসন মানে তুলনার জন্য আরও শক্তিশালী পরীক্ষা


4
+1 ভাল রেফারেন্স, ধন্যবাদ। সি-টেস্টটি আমি যেটি স্কেচ করেছিলাম তার একটি আরও কঠোর সংস্করণ, সুতরাং এটি ভালভাবে বিবেচনা করা উচিত। ই-পরীক্ষাটি একটি উপযুক্ত বন্টনের সাথে টি-স্ট্যাটিস্টিক সম্পর্কিত। ডিস্ট্রিবিউশন গণনা করতে দ্বিগুণ অসীম যোগফল জড়িত যা রূপান্তর করতে গণনা গ্রহণ করবে : কোডে মোটামুটি সহজ, সংবাদপত্রটি পরীক্ষা করার জন্য সম্ভবত ওভারকিল! হে(এন1এন2)
whuber

1
ই-টেস্ট পেপারের লেখক এখানে দুটি পোয়েসনের অর্থ পি-ভ্যালু গণনা করার জন্য একটি সহজ ফোরট্রান বাস্তবায়ন লিখেছেন: ucs.louisiana.edu/~kxk4695 আমি তাদের কৌতুকটি
git.io/vNP86- এ্যান্ডিএল

11

কেমন:

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

এটি এমন একটি পরীক্ষা যা 1 এবং 2 এর পয়েসন হারকে একে অপরের সাথে তুলনা করে এবং এপি মান এবং 95% আত্মবিশ্বাসের ব্যবধান উভয়ই দেয়।


এটি লক্ষ করা উচিত যে একটি দ্বি-নমুনা সমস্যার জন্য, এটি হারের তুলনা করতে দ্বি-দ্বি পরীক্ষা ব্যবহার করে
জন

10

আপনি একটি দ্রুত এবং সহজ চেক খুঁজছেন।

λt=t1+t2[0,t1]n1[t1,t1+t2]n2

λ^=n1+n2t1+ +t2

এবং সেখান থেকে আপনি এর বিতরণ অনুমান করতে পারেন এনআমি: তারা কাছাকাছি তীব্রতার পোয়েসন টিআমিλ^। যদি একটি বা উভয়এনআমিএই বিতরণের লেজগুলিতে অবস্থিত, সম্ভবত দাবিটি বৈধ; যদি তা না হয় তবে দাবিটি সম্ভাবনা পরিবর্তনের উপর নির্ভর করছে।


1
ধন্যবাদ (+1), এই ধরণের অফ-দ্য কফ জিনিসটির জন্য এটি কেবল সঠিক পরীক্ষা। এটি অত্যন্ত উল্লেখযোগ্য (পি = 0.005) হয়ে শেষ হয়েছে তাই নিবন্ধটি ভাল fine আমি আশা করি আপনি আপত্তি করবেন না, যদিও আমি অন্য উত্তরটি গ্রহণ করেছি - এটি গুরুত্বপূর্ণ যখন এটি গুরুত্বপূর্ণ তখন এটি করার 'আসল' উপায়টি জেনে রাখা ভাল।
চার্লস

5

আমি এপি মানের চেয়ে আত্মবিশ্বাসের ব্যবধানে আরও আগ্রহী হব, এখানে একটি বুটস্ট্র্যাপ আনুমানিক।

প্রথমে অন্তরগুলির দৈর্ঘ্য এবং একটি চেক গণনা করা হচ্ছে:

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

এই চেকটি প্রকাশনার (101% বৃদ্ধি) তুলনায় কিছুটা আলাদা ফলাফল (100.03% বৃদ্ধি) দেয়। বুটস্ট্র্যাপের সাথে এগিয়ে যান (এটি দুটি বার করুন):

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706 

বৃদ্ধির 95% আত্মবিশ্বাসের ব্যবধান 31% থেকে 202%।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.