আমার প্রশ্নটি পয়সন রিগ্রেশন এবং সাধারণভাবে জিএলএম সম্পর্কে আমার খারাপ ধারণা প্রকাশ করে। আমার প্রশ্নটি তুলে ধরতে এখানে কিছু জাল তথ্য রয়েছে:
### some fake data
x=c(1:14)
y=c(0, 1, 2, 3, 1, 4, 9, 18, 23, 31, 20, 25, 37, 45)
Psuedo-R2 ফিরিয়ে আনতে কিছু কাস্টম ফাংশন:
### functions of pseudo-R2
psuR2 <- function(null.dev, model.dev) { 1 - (model.dev / null.dev)}
predR2 <- function(actuals, predicted) { 1 - (sum((actuals - predicted)^2)) / sum((actuals - mean(actuals))^2)}
চারটি মডেল ফিট করুন: ওএলএস, পরিচয় লিঙ্ক সহ গাউসিয়ান জিএলএম, লগ লিঙ্ক সহ পোইসন জিএলএম, পরিচয় লিঙ্ক সহ পোইসন জিএলএম
#### OLS MODEL
mdl.ols=lm(y~x)
summary(mdl.ols)
pred.ols = predict(mdl.ols)
summary(mdl.ols)$r.squared
predR2(y, pred.ols)
#### GLM MODEL, family=gaussian(link="identity")
mdl.guass <- glm(y~x, family=gaussian(link="identity"), maxit=500)
summary(mdl.guass)
pred.guass = predict(mdl.guass)
psuR2(mdl.guass$null.deviance, mdl.guass$deviance)
predR2(y, pred.guass)
#### GLM MODEL, family=possion (canonical link)
mdl.poi_log <- glm(y~x, family=poisson(link="log"), maxit=500)
summary(mdl.poi_log)
pred.poi_log= exp(predict(mdl.poi_log)) #transform
psuR2(mdl.poi_log$null.deviance, mdl.poi_log$deviance)
predR2(y, pred.poi_log)
#### GLM MODEL, family=poisson((link="identity")
mdl.poi_id <- glm(y~x, family=poisson(link="identity"), start=c(0.5,0.5), maxit=500)
summary(mdl.poi_id)
pred.poi_id = predict(mdl.poi_id)
psuR2(mdl.poi_id$null.deviance, mdl.poi_id$deviance)
predR2(y, pred.poi_id)
শেষ পর্যন্ত ভবিষ্যদ্বাণীগুলি প্লট করুন:
#### Plot the Fit
plot(x, y)
lines(x, pred.ols)
lines(x, pred.guass, col="green")
lines(x,pred.poi_log, col="red")
lines(x,pred.poi_id, col="blue")
আমার 2 টি প্রশ্ন রয়েছে:
দেখা যাচ্ছে যে পরিচয়ের লিঙ্ক সহ ওএলএস এবং গাউসিয়ান জিএলএম থেকে আসা সহগ বা ভবিষ্যদ্বাণীগুলি হুবহু এক। এটা কি সবসময় সত্য?
আমি খুব আশ্চর্য হয়েছি যে ওএলএসের অনুমান এবং পূর্বাভাসগুলি পরিচয় লিঙ্কের সাথে পোয়েসন জিএলএম থেকে খুব আলাদা । আমি ভেবেছিলাম যে দুটি পদ্ধতিই E (Y | X) অনুমান করার চেষ্টা করবে। আমি যখন পইসনের জন্য পরিচয় লিঙ্কটি ব্যবহার করি তখন সম্ভাবনা ফাংশনটি কেমন দেখায়?