আমার কাছে একটি ডেটা সেট রয়েছে যা আমি কোনও পয়সন বিতরণ অনুসরণ করতে পারি বলে আশা করি তবে এটি প্রায় 3-ভাগে অতিক্রম করে। বর্তমানে, আমি আর এই নীচের কোডটির মতো কিছু ব্যবহার করে এই ওভারডিস্পারশনটি মডেলিং করছি।
## assuming a median value of 1500
med = 1500
rawdist = rpois(1000000,med)
oDdist = rawDist + ((rawDist-med)*3)
দৃশ্যত, এটি আমার অভিজ্ঞতা অভিজ্ঞতা খুব ভাল ফিট করে। যদি আমি ফিট থেকে খুশি, তবে এখানে কি বর্ণিত আছে যে কোনও নেতিবাচক দ্বিপদী বিতরণ ব্যবহার করার মতো আরও জটিল কিছু করা উচিত হওয়ার কোনও কারণ আছে কি? (যদি তা হয় তবে এটি করার জন্য কোনও পয়েন্টার বা লিঙ্কগুলি প্রশংসিত হবে)।
ওহ, এবং আমি সচেতন যে এটি কিছুটা দাগযুক্ত বিতরণ তৈরি করে (তিনটি দ্বারা গুণনের কারণে), তবে এটি আমার আবেদনের জন্য গুরুত্বপূর্ণ নয়।
আপডেট: এই প্রশ্নটি অনুসন্ধান ও সন্ধানকারী অন্য কারও পক্ষে, নেতিবাচক দ্বিপদী বিতরণ ব্যবহার করে অতিরিক্ত মাত্রায় পোষনকে মডেল করার জন্য এখানে একটি সাধারণ আর ফাংশন। পছন্দসই গড় / বৈকল্পিক অনুপাতের জন্য ডি সেট করুন:
rpois.od<-function (n, lambda,d=1) {
if (d==1)
rpois(n, lambda)
else
rnbinom(n, size=(lambda/(d-1)), mu=lambda)
}
(আর মেইলিং তালিকার মাধ্যমে: https://stat.ethz.ch/pipermail/r-help/2002- জুন/022425. html )