আমি আর এর মধ্যে গণনা ডেটা মডেল করার চেষ্টা করছি যা আপাতদৃষ্টিতে নিম্নচাপযুক্ত (বিচ্ছুরণ প্যারামিটার ~ .40)। এটি সম্ভবত কেন একটি হল glm
সঙ্গে family = poisson
বা নেতিবাচক দ্বিপদ ( glm.nb
) মডেল উল্লেখযোগ্য নয়। আমি যখন আমার ডেটা বর্ণনার দিকে নজর দিই, তখন আমার কাছে গণনা তথ্যগুলির সাধারণ স্কিউ নেই এবং আমার দুটি পরীক্ষামূলক অবস্থার অবশিষ্টাংশগুলিও একজাতীয় ge
সুতরাং আমার প্রশ্নগুলি হ'ল:
আমার গণনা ডেটা যদি সত্যিই গণনা ডেটার মতো আচরণ না করে তবে আমার গণনা ডেটার জন্যও কি বিশেষ প্রতিরোধ বিশ্লেষণগুলি ব্যবহার করতে হবে? আমি মাঝে মাঝে অ-স্বাভাবিকতার মুখোমুখি হই (সাধারণত কুর্তোসিসের কারণে), তবে আমি ছাঁটাইযুক্ত মাধ্যমের তুলনা করার জন্য পারসেন্টাইল বুটস্ট্র্যাপ পদ্ধতিটি ব্যবহার করেছি (উইলকক্স, ২০১২) অ-স্বাভাবিকতার জন্য অ্যাকাউন্টে। উইলকক্স দ্বারা প্রস্তাবিত কোনও শক্ত পদ্ধতি দ্বারা গণ্য ডেটার জন্য বিকল্পগুলি প্রতিস্থাপন করা যেতে পারে এবং ডাব্লুআরএস প্যাকেজে উপলব্ধি করা যেতে পারে?
যদি আমার গণনা সম্পর্কিত ডেটার জন্য রিগ্রেশন বিশ্লেষণগুলি ব্যবহার করতে হয় তবে আমি কীভাবে আন্ডার-ডিসপ্রেসনের জন্য অ্যাকাউন্ট করব? পোইসন এবং নেতিবাচক দ্বিপদী বিতরণ একটি উচ্চতর বিচ্ছুরণ ধরেছে, সুতরাং এটি উপযুক্ত না হওয়া উচিত, তাই না? আমি কোয়েস-পয়েসন বিতরণ প্রয়োগ করার কথা ভাবছিলাম , তবে এটি সাধারণত অতিরিক্ত ছড়িয়ে দেওয়ার জন্য সুপারিশ করা হয়। আমি বিটা-বাইনোমিয়াল মডেলগুলি পড়েছি যা দেখে মনে হয় যে তারা অতিরিক্ত হিসাব করতে সক্ষম হবেন - পাশাপাশি আন্ডার ডিস্পারশনও
VGAM
আর এর প্যাকেজটিতে পাওয়া যাবে The লেখকরা অবশ্য একটি টিলড পোইসন বিতরণের প্রস্তাব দিচ্ছেন , তবে আমি প্যাকেজে এটি পাই না can't ।
কেউ কি সুবিশাল ডেটাগুলির জন্য কোনও পদ্ধতির প্রস্তাব দিতে পারে এবং এর জন্য কিছু উদাহরণের কোড দিতে পারে?