আরে শূন্য-স্ফীত গণনা মডেল: আসল সুবিধা কী?


11

শূন্য-স্ফীত পাখির সংখ্যা বিশ্লেষণের জন্য আমি আর প্যাকেজ পিএসসিএল ব্যবহার করে শূন্য-স্ফীত গণনা মডেলগুলি প্রয়োগ করতে চাই । যাইহোক, মূল ফাংশনগুলির একটি ( ? Zeroinfl ) এর জন্য ডকুমেন্টেশনে প্রদত্ত উদাহরণটি একবার দেখে , আমি এই মডেলগুলির আসল সুবিধা কী তা নিয়ে সন্দেহ শুরু করি। সেখানে দেওয়া নমুনা কোড অনুসারে আমি স্ট্যান্ডার্ড পোইসন, কোসি-পোইসন এবং নেগেটিভ দ্বিওমিয়াল মডেলগুলি, সাধারণ শূন্য-স্ফীত পোইসন এবং নেতিবাচক দ্বিপদী মডেলগুলি এবং শূন্য-স্ফীত পোইসন এবং নেতিবাচক-দ্বিপদী মডেলগুলি শূন্য উপাদানটির জন্য রেজিস্ট্রার সহ গণনা করেছি। তারপরে আমি পর্যবেক্ষণের হিস্টোগ্রামগুলি এবং লাগানো ডেটাগুলি পরিদর্শন করেছি। (এটি প্রতিলিপি দেওয়ার জন্য কোড এখানে।

library(pscl)
data("bioChemists", package = "pscl")

## standard count data models
fm_pois  <- glm(art ~ .,    data = bioChemists, family = poisson)
fm_qpois <- glm(art ~ .,    data = bioChemists, family = quasipoisson)
fm_nb    <- glm.nb(art ~ ., data = bioChemists)

## with simple inflation (no regressors for zero component)
fm_zip  <- zeroinfl(art ~ . | 1, data = bioChemists)
fm_zinb <- zeroinfl(art ~ . | 1, data = bioChemists, dist = "negbin")

## inflation with regressors
fm_zip2  <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd + 
                     ment, data = bioChemists)
fm_zinb2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd + 
                     ment, data = bioChemists, dist = "negbin")

## histograms
breaks <- seq(-0.5,20.5,1)
par(mfrow=c(4,2))
hist(bioChemists$art,  breaks=breaks)
hist(fitted(fm_pois),  breaks=breaks)
hist(fitted(fm_qpois), breaks=breaks)
hist(fitted(fm_nb),    breaks=breaks)
hist(fitted(fm_zip),   breaks=breaks)
hist(fitted(fm_zinb),  breaks=breaks)
hist(fitted(fm_zip2),  breaks=breaks)
hist(fitted(fm_zinb2), breaks=breaks)!

পর্যবেক্ষণ করা এবং লাগানো ডেটাগুলির হিস্টোগ্রাম

আমি বিভিন্ন মডেলের মধ্যে কোনও মৌলিক পার্থক্য দেখতে পাচ্ছি না (উদাহরণস্বরূপ আমার কাছে ডেটা খুব "শূন্য-স্ফীত" হয় না ...); আসলে কোনও মডেল জিরো সংখ্যার অর্ধেক যুক্তিসঙ্গত অনুমান দেয় না। শূন্য-স্ফীত মডেলগুলির সুবিধা কী তা কি কেউ ব্যাখ্যা করতে পারেন? আমি মনে করি ফাংশনটির উদাহরণ হিসাবে এটি বেছে নেওয়ার কোনও কারণ থাকতে হবে।

উত্তর:


15

আমি মনে করি এটি শূন্য স্ফীত মডেলের সুবিধাগুলি অন্বেষণের জন্য খুব খারাপভাবে নির্বাচিত ডেটা সেট, কারণ আপনি যেমন লক্ষ করেছেন, তেমন শূন্য মূল্যস্ফীতি নেই isn't

plot(fitted(fm_pois), fitted(fm_zinb))

পূর্বাভাসিত মানগুলি প্রায় অভিন্ন বলে দেখায়।

আরও শূন্য-মুদ্রাস্ফীতি সহ ডেটা সেটগুলিতে, জেডআই মডেলগুলি পোইসনের চেয়ে আলাদা (এবং সাধারণত আরও ভাল ফিটিং) ফলাফল দেয়।

মডেলগুলির ফিটের সাথে তুলনা করার আরেকটি উপায় হ'ল অবশিষ্টগুলির আকারের তুলনা করা:

boxplot(abs(resid(fm_pois) - resid(fm_zinb)))

এটি দেখায় যে, এখানেও, পোইসনের অবশিষ্টাংশগুলি জিআইএনবি-র চেয়ে ছোট। যদি আপনার কাছে অবশিষ্টাংশের প্রকৃতির যে পরিমাণটি সত্যই সমস্যাযুক্ত তা সম্পর্কে কিছু ধারণা থাকে তবে আপনি দেখতে পারবেন যে প্রতিটি মডেলের অবশিষ্টাংশের অনুপাতের পরিমাণ কত উপরে। উদাহরণস্বরূপ, যদি 1 এর বেশি দ্বারা অফ করা অগ্রহণযোগ্য ছিল

sum(abs(resid(fm_pois) > 1))
sum(abs(resid(fm_zinb) > 1))

পরে দেখানো হয়েছে কিছুটা ভাল - 20 টি কম বড় অবশিষ্টাংশ।

তারপরে প্রশ্ন হ'ল মডেলগুলির যুক্ত হওয়া জটিলতা আপনার পক্ষে উপযুক্ত।


6

এক্সআমি~পিআমিগুলি(μ)এক্সআমিμ^আমিএক্সআমি*এক্সআমি*~পিআমিগুলি(μ^)এক্সআমি*এক্সআমি


আপনি অন্য কোন তুলনা সুপারিশ করবেন?
ব্যবহারকারী 7417

মডেলগুলির মধ্যে ভাল তুলনা করার জন্য পিটারের উত্তর দেখুন।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.