আমার কাছে একটি ডেটা সেট রয়েছে যা 7 দিনের মধ্যে ব্যক্তিদের দ্বারা সম্পাদিত ক্রিয়াকলাপগুলির সংখ্যার সমন্বয় করে। নির্দিষ্ট ক্রিয়াটি এই প্রশ্নের জন্য প্রাসঙ্গিক হওয়া উচিত নয়। ডেটা সেট করার জন্য এখানে কিছু বর্ণনামূলক পরিসংখ্যান রয়েছে:
এখানে ডেটাগুলির একটি হিস্টগ্রাম রয়েছে:
তথ্যের উত্স থেকে বিচার করে, আমি অনুভব করেছি যে এটি কোনও পয়েসন বিতরণের উপযুক্ত। যাইহোক, গড় ≠ বৈকল্পিক এবং হিস্টোগ্রামটি ভারীভাবে বামদিকে ওজনযুক্ত। অতিরিক্তভাবে, আমি goodfit
আর তে পরীক্ষা চালিয়েছি এবং পেয়েছি:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
সর্বাধিক সম্ভাবনা পদ্ধতিতে পি-মান = 0ও পাওয়া যায় নাল অনুমানটি ধরে নেওয়া: ডেটা একটি পয়েসন বিতরণের সাথে মিলে যায় (ডকুমেন্টেশন এটি সুনির্দিষ্ট করে না), তারপরে goodfit
পরীক্ষাটি বলে যে আমাদের নাল অনুমানটি বাতিল করা উচিত, অতএব তথ্যটি দেয় না একটি পয়সন বিতরণ মেলে।
এটা কি বিশ্লেষণ সঠিক? যদি তা হয় তবে আপনার কাছে কি বিতরণ এই ডেটা মাপসই করবে বলে মনে করেন?
আমার চূড়ান্ত লক্ষ্যটি হল 2 টি নমুনার মধ্যে ক্রিয়াকলাপের গড় সংখ্যার সাথে তুলনা করা এটি দেখার জন্য যে উপায়গুলি আলাদা কিনা; বিতরণ এমনকি চেক করা প্রয়োজন? আমার বোঝার সাধারণ পরীক্ষাগুলি (জেড-, টি-, পরীক্ষা) পোইসন বিতরণের জন্য কাজ করে না। ডেটা সত্যই যদি পয়সন-বিতরণ করা হয় তবে আমার কোন পরীক্ষা করা উচিত?