গণনার ডেটা সহ কোন মডেলটি ব্যবহার করবেন তা সিদ্ধান্ত নেওয়ার জন্য উপযুক্ত কৌশল কী? আমার কাছে মাল্টিলেভেল মডেল হিসাবে মডেল করার প্রয়োজনীয় ডেটা রয়েছে এবং এটি আমার কাছে (এই সাইটে) সুপারিশ করা হয়েছিল যে এটি করার সর্বোত্তম উপায়টি বাগ বা এমসিএমসিজিএমএমএমের মাধ্যমে। তবে আমি এখনও বেইসিয়ান পরিসংখ্যান সম্পর্কে জানার চেষ্টা করছি এবং আমি ভেবেছিলাম আমার প্রথমে আমার তথ্যটি সাধারণীকরণীয় রৈখিক মডেল হিসাবে ফিট করার চেষ্টা করা উচিত এবং উপাত্তের নেস্টেড কাঠামোটি উপেক্ষা করা উচিত (ঠিক কীভাবে আমি কী আশা করব তা সম্পর্কে একটি অস্পষ্ট ধারণা পেতে পারি)।
ডেটাগুলির প্রায় 70% 0 হয় এবং গড়ের পরিবর্তনের অনুপাত 33 হয় So সুতরাং ডেটাটি বেশ বেশি ছড়িয়ে পড়ে।
বিভিন্ন ধরণের বিকল্পের চেষ্টা করার পরে (পিসন, নেতিবাচক দ্বিপদী, আধা এবং শূন্য স্ফীত মডেল সহ) আমি ফলাফলগুলিতে খুব সামান্য ধারাবাহিকতা দেখি (সমস্ত কিছুর চেয়ে আলাদা হওয়া কোনও কিছুর পক্ষে তাৎপর্যপূর্ণ নয়)।
0 মুদ্রাস্ফীতি এবং অতিরিক্ত-ছড়িয়ে পড়ার ভিত্তিতে কোন ধরণের মডেল নির্বাচন করবেন সে সম্পর্কে আমি একটি অবগত সিদ্ধান্ত নেওয়ার বিষয়ে কীভাবে যেতে পারি? উদাহরণস্বরূপ, আমি কীভাবে অনুমান করতে পারি যে কোয়াডস-পোইসনটি নেতিবাচক দ্বিপদী (বা ভাইস বিপরীতে) এর চেয়ে বেশি উপযুক্ত এবং আমি কীভাবে জানতে পারি যে অতিরিক্ত জিরোগুলির সাথে ব্যবহার করে পর্যাপ্ত পরিমাণে (বা নাও) সমস্যা হয়েছে? একইভাবে, আমি কীভাবে মূল্যায়ন করব যে শূন্য-স্ফীত মডেল ব্যবহার করা হলে সেখানে আরও বেশি ছড়িয়ে পড়া নেই? বা আমি কীভাবে একটি শূন্য স্ফীত পোষক এবং একটি শূন্য স্ফীত নেতিবাচক দ্বিপদী মধ্যে সিদ্ধান্ত নিতে হবে?