আমি লক্ষ করেছি যে আর, পোইসন এবং নেতিবাচক দ্বিপদী (এনবি) রিগ্রেশনগুলি সর্বদা শ্রেণিবদ্ধ, তবে ধারাবাহিক নয়, ভবিষ্যদ্বাণীকারীদের জন্য একই গুণফলের সাথে মানায়।
উদাহরণস্বরূপ, এখানে একটি শ্রেণিবদ্ধ ভবিষ্যদ্বাণীটির সাথে একটি প্রতিরোধ এখানে রয়েছে:
data(warpbreaks)
library(MASS)
rs1 = glm(breaks ~ tension, data=warpbreaks, family="poisson")
rs2 = glm.nb(breaks ~ tension, data=warpbreaks)
#compare coefficients
cbind("Poisson"=coef(rs1), "NB"=coef(rs2))
এখানে অবিচ্ছিন্ন ভবিষ্যদ্বাণীকারীর একটি উদাহরণ রয়েছে যেখানে পয়সন এবং এনবি বিভিন্ন সহগের সাথে ফিট করে:
data(cars)
rs1 = glm(dist ~ speed, data=cars, family="poisson")
rs2 = glm.nb(dist ~ speed, data=cars)
#compare coefficients
cbind("Poisson"=coef(rs1), "NB"=coef(rs2))
(অবশ্যই এগুলি ডেটা গণনা করা হয় না, এবং মডেলগুলি অর্থবহ নয় ...)
তারপরে আমি ভবিষ্যদ্বাণীকে একটি ফ্যাক্টর হিসাবে পুনঃনির্মাণ করলাম এবং দুটি মডেল আবার একই সহগের সাথে ফিট করে:
library(Hmisc)
speedCat = cut2(cars$speed, g=5)
#you can change g to get a different number of bins
rs1 = glm(cars$dist ~ speedCat, family="poisson")
rs2 = glm.nb(cars$dist ~ speedCat)
#compare coefficients
cbind("Poisson"=coef(rs1), "NB"=coef(rs2))
যাইহোক, জোসেফ Hilbe এর ঋণাত্মক বাইনমিয়াল রিগ্রেশন একটি উদাহরণ (6.3, পৃষ্ঠা 118-119) যেইক্ষেত্রে কোনো নিঃশর্ত predictor, লিঙ্গ, পইসন (দ্বারা কিছুটা ভিন্ন কোফিসিয়েন্টস সঙ্গে ফিট দেয় ) ও বিশেষ দ্রষ্টব্য ( খ = 0.881 )। তিনি বলেছেন: “পইসন এবং এনবি মডেলগুলির মধ্যে ঘটনা হারের অনুপাত বেশ একই রকম। এই কাছাকাছি দেওয়া বিস্ময়কর α [সংশ্লিষ্ট 1 / θ শুন্যতে দ]। "
summary(rs2)
তাহলে সহগ কেন ঠিক একই রকম? এবং কেন কেবল শ্রেণিবদ্ধ ভবিষ্যদ্বাণীদের জন্য?
সম্পাদনা # 1
এখানে দুটি অ-orthogonal ভবিষ্যদ্বাণী সহ একটি উদাহরণ is প্রকৃতপক্ষে সহগগুলি আর আগের মতো নেই:
data(cars)
#make random categorical predictor
set.seed(1); randomCats1 = sample( c("A","B","C"), length(cars$dist), replace=T)
set.seed(2); randomCats2 = sample( c("C","D","E"), length(cars$dist), replace=T)
rs1 = glm(dist ~ randomCats1 + randomCats2, data=cars, family="poisson")
rs2 = glm.nb(dist ~ randomCats1 + randomCats2, data=cars)
#compare coefficients
cbind("Poisson"=coef(rs1), "NB"=coef(rs2))
এবং, অন্য একজন ভবিষ্যদ্বাণীকারী সহ নতুন ভবিষ্যদ্বাণী অবিচ্ছিন্ন থাকা সত্ত্বেও মডেলগুলি বিভিন্ন সহগের সাথে ফিট করে। সুতরাং, এটি আমার আসল উদাহরণে আমি যে ডামি ভেরিয়েবলগুলি তৈরি করেছি তার অরথোগোনালটির সাথে কিছু করা?
rs1 = glm(dist ~ randomCats1 + speed, data=cars, family="poisson")
rs2 = glm.nb(dist ~ randomCats1 + speed, data=cars)
#compare coefficients
cbind("Poisson"=coef(rs1), "NB"=coef(rs2))