আমি আর এর মধ্যে গণনা ডেটা মডেল করার চেষ্টা করছি যা আপাতদৃষ্টিতে নিম্নচাপযুক্ত (বিচ্ছুরণ প্যারামিটার ~ .40)। এটি সম্ভবত কেন একটি হল glmসঙ্গে family = poissonবা নেতিবাচক দ্বিপদ ( glm.nb) মডেল উল্লেখযোগ্য নয়। আমি যখন আমার ডেটা বর্ণনার দিকে নজর দিই, তখন আমার কাছে গণনা তথ্যগুলির সাধারণ স্কিউ নেই এবং আমার দুটি পরীক্ষামূলক অবস্থার অবশিষ্টাংশগুলিও একজাতীয় ge
সুতরাং আমার প্রশ্নগুলি হ'ল:
আমার গণনা ডেটা যদি সত্যিই গণনা ডেটার মতো আচরণ না করে তবে আমার গণনা ডেটার জন্যও কি বিশেষ প্রতিরোধ বিশ্লেষণগুলি ব্যবহার করতে হবে? আমি মাঝে মাঝে অ-স্বাভাবিকতার মুখোমুখি হই (সাধারণত কুর্তোসিসের কারণে), তবে আমি ছাঁটাইযুক্ত মাধ্যমের তুলনা করার জন্য পারসেন্টাইল বুটস্ট্র্যাপ পদ্ধতিটি ব্যবহার করেছি (উইলকক্স, ২০১২) অ-স্বাভাবিকতার জন্য অ্যাকাউন্টে। উইলকক্স দ্বারা প্রস্তাবিত কোনও শক্ত পদ্ধতি দ্বারা গণ্য ডেটার জন্য বিকল্পগুলি প্রতিস্থাপন করা যেতে পারে এবং ডাব্লুআরএস প্যাকেজে উপলব্ধি করা যেতে পারে?
যদি আমার গণনা সম্পর্কিত ডেটার জন্য রিগ্রেশন বিশ্লেষণগুলি ব্যবহার করতে হয় তবে আমি কীভাবে আন্ডার-ডিসপ্রেসনের জন্য অ্যাকাউন্ট করব? পোইসন এবং নেতিবাচক দ্বিপদী বিতরণ একটি উচ্চতর বিচ্ছুরণ ধরেছে, সুতরাং এটি উপযুক্ত না হওয়া উচিত, তাই না? আমি কোয়েস-পয়েসন বিতরণ প্রয়োগ করার কথা ভাবছিলাম , তবে এটি সাধারণত অতিরিক্ত ছড়িয়ে দেওয়ার জন্য সুপারিশ করা হয়। আমি বিটা-বাইনোমিয়াল মডেলগুলি পড়েছি যা দেখে মনে হয় যে তারা অতিরিক্ত হিসাব করতে সক্ষম হবেন - পাশাপাশি আন্ডার ডিস্পারশনও
VGAMআর এর প্যাকেজটিতে পাওয়া যাবে The লেখকরা অবশ্য একটি টিলড পোইসন বিতরণের প্রস্তাব দিচ্ছেন , তবে আমি প্যাকেজে এটি পাই না can't ।
কেউ কি সুবিশাল ডেটাগুলির জন্য কোনও পদ্ধতির প্রস্তাব দিতে পারে এবং এর জন্য কিছু উদাহরণের কোড দিতে পারে?