আমার কাছে একটি ডেটা সেট রয়েছে যা 7 দিনের মধ্যে ব্যক্তিদের দ্বারা সম্পাদিত ক্রিয়াকলাপগুলির সংখ্যার সমন্বয় করে। নির্দিষ্ট ক্রিয়াটি এই প্রশ্নের জন্য প্রাসঙ্গিক হওয়া উচিত নয়। ডেটা সেট করার জন্য এখানে কিছু বর্ণনামূলক পরিসংখ্যান রয়েছে:
এখানে ডেটাগুলির একটি হিস্টগ্রাম রয়েছে:

তথ্যের উত্স থেকে বিচার করে, আমি অনুভব করেছি যে এটি কোনও পয়েসন বিতরণের উপযুক্ত। যাইহোক, গড় ≠ বৈকল্পিক এবং হিস্টোগ্রামটি ভারীভাবে বামদিকে ওজনযুক্ত। অতিরিক্তভাবে, আমি goodfitআর তে পরীক্ষা চালিয়েছি এবং পেয়েছি:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
সর্বাধিক সম্ভাবনা পদ্ধতিতে পি-মান = 0ও পাওয়া যায় নাল অনুমানটি ধরে নেওয়া: ডেটা একটি পয়েসন বিতরণের সাথে মিলে যায় (ডকুমেন্টেশন এটি সুনির্দিষ্ট করে না), তারপরে goodfitপরীক্ষাটি বলে যে আমাদের নাল অনুমানটি বাতিল করা উচিত, অতএব তথ্যটি দেয় না একটি পয়সন বিতরণ মেলে।
এটা কি বিশ্লেষণ সঠিক? যদি তা হয় তবে আপনার কাছে কি বিতরণ এই ডেটা মাপসই করবে বলে মনে করেন?
আমার চূড়ান্ত লক্ষ্যটি হল 2 টি নমুনার মধ্যে ক্রিয়াকলাপের গড় সংখ্যার সাথে তুলনা করা এটি দেখার জন্য যে উপায়গুলি আলাদা কিনা; বিতরণ এমনকি চেক করা প্রয়োজন? আমার বোঝার সাধারণ পরীক্ষাগুলি (জেড-, টি-, পরীক্ষা) পোইসন বিতরণের জন্য কাজ করে না। ডেটা সত্যই যদি পয়সন-বিতরণ করা হয় তবে আমার কোন পরীক্ষা করা উচিত?