শূন্য-স্ফীত পাখির সংখ্যা বিশ্লেষণের জন্য আমি আর প্যাকেজ পিএসসিএল ব্যবহার করে শূন্য-স্ফীত গণনা মডেলগুলি প্রয়োগ করতে চাই । যাইহোক, মূল ফাংশনগুলির একটি ( ? Zeroinfl ) এর জন্য ডকুমেন্টেশনে প্রদত্ত উদাহরণটি একবার দেখে , আমি এই মডেলগুলির আসল সুবিধা কী তা নিয়ে সন্দেহ শুরু করি। সেখানে দেওয়া নমুনা কোড অনুসারে আমি স্ট্যান্ডার্ড পোইসন, কোসি-পোইসন এবং নেগেটিভ দ্বিওমিয়াল মডেলগুলি, সাধারণ শূন্য-স্ফীত পোইসন এবং নেতিবাচক দ্বিপদী মডেলগুলি এবং শূন্য-স্ফীত পোইসন এবং নেতিবাচক-দ্বিপদী মডেলগুলি শূন্য উপাদানটির জন্য রেজিস্ট্রার সহ গণনা করেছি। তারপরে আমি পর্যবেক্ষণের হিস্টোগ্রামগুলি এবং লাগানো ডেটাগুলি পরিদর্শন করেছি। (এটি প্রতিলিপি দেওয়ার জন্য কোড এখানে।
library(pscl)
data("bioChemists", package = "pscl")
## standard count data models
fm_pois <- glm(art ~ ., data = bioChemists, family = poisson)
fm_qpois <- glm(art ~ ., data = bioChemists, family = quasipoisson)
fm_nb <- glm.nb(art ~ ., data = bioChemists)
## with simple inflation (no regressors for zero component)
fm_zip <- zeroinfl(art ~ . | 1, data = bioChemists)
fm_zinb <- zeroinfl(art ~ . | 1, data = bioChemists, dist = "negbin")
## inflation with regressors
fm_zip2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists)
fm_zinb2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists, dist = "negbin")
## histograms
breaks <- seq(-0.5,20.5,1)
par(mfrow=c(4,2))
hist(bioChemists$art, breaks=breaks)
hist(fitted(fm_pois), breaks=breaks)
hist(fitted(fm_qpois), breaks=breaks)
hist(fitted(fm_nb), breaks=breaks)
hist(fitted(fm_zip), breaks=breaks)
hist(fitted(fm_zinb), breaks=breaks)
hist(fitted(fm_zip2), breaks=breaks)
hist(fitted(fm_zinb2), breaks=breaks)!
আমি বিভিন্ন মডেলের মধ্যে কোনও মৌলিক পার্থক্য দেখতে পাচ্ছি না (উদাহরণস্বরূপ আমার কাছে ডেটা খুব "শূন্য-স্ফীত" হয় না ...); আসলে কোনও মডেল জিরো সংখ্যার অর্ধেক যুক্তিসঙ্গত অনুমান দেয় না। শূন্য-স্ফীত মডেলগুলির সুবিধা কী তা কি কেউ ব্যাখ্যা করতে পারেন? আমি মনে করি ফাংশনটির উদাহরণ হিসাবে এটি বেছে নেওয়ার কোনও কারণ থাকতে হবে।