আমার এই ডেটা আছে:
set.seed(1)
predictor <- rnorm(20)
set.seed(1)
counts <- c(sample(1:1000, 20))
df <- data.frame(counts, predictor)
আমি একটি পিসন রিগ্রেশন চালিয়েছি
poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson")
এবং একটি নেতিবাচক দ্বিপদী রিগ্রেশন:
require(MASS)
nb_counts <- glm.nb(counts ~ predictor, data = df)
তারপরে আমি পয়েসন রিগ্রেশনটির জন্য ছড়িয়ে পড়া পরিসংখ্যানের জন্য গণনা করেছি:
sum(residuals(poisson_counts, type="pearson")^2)/df.residual(poisson_counts)
# [1] 145.4905
এবং নেতিবাচক দ্বিপদী রিগ্রেশন:
sum(residuals(nb_counts, type="pearson")^2)/df.residual(nb_counts)
# [1] 0.7650289
যদি কেউ ব্যাখ্যা করতে সক্ষম হয়, মূল্য ব্যবহার না করে কেন, নেতিবাচক দ্বিপদী প্রতিরোধের জন্য ছড়িয়ে পড়া পরিসংখ্যানটি পোয়েসন রিগ্রেশনের জন্য ছড়িয়ে পড়া পরিসংখ্যানের তুলনায় যথেষ্ট ছোট?