পরিচয় লিঙ্কের সাথে ওএলএস বনাম পোইসন জিএলএম


11

আমার প্রশ্নটি পয়সন রিগ্রেশন এবং সাধারণভাবে জিএলএম সম্পর্কে আমার খারাপ ধারণা প্রকাশ করে। আমার প্রশ্নটি তুলে ধরতে এখানে কিছু জাল তথ্য রয়েছে:

### some fake data
x=c(1:14)
y=c(0,  1,  2,  3,  1,  4,  9, 18, 23, 31, 20, 25, 37, 45)

Psuedo-R2 ফিরিয়ে আনতে কিছু কাস্টম ফাংশন:

### functions of pseudo-R2

psuR2 <- function(null.dev, model.dev) { 1 - (model.dev / null.dev)}

predR2 <- function(actuals, predicted) { 1 - (sum((actuals - predicted)^2)) / sum((actuals - mean(actuals))^2)}

চারটি মডেল ফিট করুন: ওএলএস, পরিচয় লিঙ্ক সহ গাউসিয়ান জিএলএম, লগ লিঙ্ক সহ পোইসন জিএলএম, পরিচয় লিঙ্ক সহ পোইসন জিএলএম

#### OLS MODEL
mdl.ols=lm(y~x)
summary(mdl.ols)
pred.ols = predict(mdl.ols)

summary(mdl.ols)$r.squared
predR2(y, pred.ols)

#### GLM MODEL, family=gaussian(link="identity")
mdl.guass <- glm(y~x, family=gaussian(link="identity"), maxit=500)
summary(mdl.guass)
pred.guass = predict(mdl.guass)

psuR2(mdl.guass$null.deviance, mdl.guass$deviance)
predR2(y, pred.guass)

#### GLM MODEL, family=possion (canonical link)
mdl.poi_log <- glm(y~x, family=poisson(link="log"), maxit=500)
summary(mdl.poi_log)
pred.poi_log= exp(predict(mdl.poi_log))  #transform

psuR2(mdl.poi_log$null.deviance, mdl.poi_log$deviance)
predR2(y, pred.poi_log)

#### GLM MODEL, family=poisson((link="identity")
mdl.poi_id <- glm(y~x, family=poisson(link="identity"), start=c(0.5,0.5), maxit=500)
summary(mdl.poi_id)
pred.poi_id = predict(mdl.poi_id)

psuR2(mdl.poi_id$null.deviance, mdl.poi_id$deviance)
predR2(y, pred.poi_id)

শেষ পর্যন্ত ভবিষ্যদ্বাণীগুলি প্লট করুন:

#### Plot the Fit
plot(x, y) 
lines(x, pred.ols)
lines(x, pred.guass, col="green")
lines(x,pred.poi_log, col="red")
lines(x,pred.poi_id, col="blue")

আমার 2 টি প্রশ্ন রয়েছে:

  1. দেখা যাচ্ছে যে পরিচয়ের লিঙ্ক সহ ওএলএস এবং গাউসিয়ান জিএলএম থেকে আসা সহগ বা ভবিষ্যদ্বাণীগুলি হুবহু এক। এটা কি সবসময় সত্য?

  2. আমি খুব আশ্চর্য হয়েছি যে ওএলএসের অনুমান এবং পূর্বাভাসগুলি পরিচয় লিঙ্কের সাথে পোয়েসন জিএলএম থেকে খুব আলাদা । আমি ভেবেছিলাম যে দুটি পদ্ধতিই E (Y | X) অনুমান করার চেষ্টা করবে। আমি যখন পইসনের জন্য পরিচয় লিঙ্কটি ব্যবহার করি তখন সম্ভাবনা ফাংশনটি কেমন দেখায়?



1
আপনি যদি পরিচয় লিঙ্ক সহ পোইসন মডেলটিকে আনুমানিকভাবে কমপক্ষে স্কোয়ার করতে চান তবে একটি ওজনযুক্ত সর্বনিম্ন স্কোয়ার মডেল, এমডিএল.ওলস = এলএম (y ~ x, ওজন = 1 / লগ (y + 1.00000000001)) ফিট করতে পারেন যেখানে লগ (y + 1.0000000000001) তারপরে পরিবর্তনের প্রথম অনুমান হিসাবে নেওয়া হয় (স্কয়ার্ট (y + 1E-10)) এছাড়াও কাজ করে - এই জাতীয় মডেলগুলির অনুমানটি পরিচয় লিঙ্কের সাথে পয়েসন জিএলএম এর খুব কাছাকাছি থাকবে ...
টম Wenseleers

উত্তর:


14
  1. হ্যাঁ, তারা একই জিনিস। গাউসির জন্য এমএলই সর্বনিম্ন স্কোয়ার, সুতরাং আপনি যখন পরিচয় লিঙ্ক সহ কোনও গাউসিয়ান জিএলএম করেন, আপনি ওএলএস করছেন।

  2. ক) " আমি ভেবেছিলাম যে দুটি পদ্ধতিই E (Y | X) অনুমান করার চেষ্টা করবে "

    প্রকৃতপক্ষে, তারা করে তবে তথ্যের ফাংশন হিসাবে শর্তাধীন প্রত্যাশাটি যেভাবে অনুমান করা হয় তা এক নয়। এমনকি যদি আমরা বিতরণটিকে উপেক্ষা করি (এবং সুতরাং ডেটা কীভাবে সম্ভাবনাতে প্রবেশ করে) এবং জিএলএম সম্পর্কে কেবলমাত্র গড় এবং বৈচিত্রের ক্ষেত্রে বিবেচনা করি (যেন এটি কেবল একটি ভারী রিগ্রেশন ছিল) তবে পোইসনের বৈচিত্রটি গড়ের সাথে বেড়ে যায়, তাই পর্যবেক্ষণগুলিতে আপেক্ষিক ওজন আলাদা হবে।

    খ) " আমি যখন পয়সনের পরিচয় লিঙ্কটি ব্যবহার করি তখন সম্ভাবনা কার্যকারিতাটি কেমন লাগে? "

    L(β0,β1)=ieλiλiyi/yi!

    =exp(iλi+yilog(λi)log(yi!))λi=β0+β1xi

    =exp(i(β0+β1xi)+yilog(β0+β1xi)log(yi!))


4
গ্লেন_ বি এর দ্বিতীয় দফায় একটি বিশদ বিবরণ। একটি গল্প যা আমি নিজেকে বলেছিলাম, যা আমি বেশ স্পষ্ট করে দেখতে পেয়েছি তা হ'ল, অনুমান শর্তসাপেক্ষ গড়টি পোয়েসন মডেলে যেমন বড় হয়, তেমনি শর্তসাপেক্ষ থেকে অনেক দূরে ডেটা মানগুলিকে আরও সহনশীল করে তোলা। সোজা লিনিয়ার মডেলের সাথে এটি বৈষম্য করুন, যা শর্তসাপেক্ষে অনুমান করা হয় না কেন তা একরকম সহনশীল।
ম্যাথু ড্র্যারি

@ গ্লেন_বি, আপনি কী বলেছিলেন তা স্পষ্ট করে দিতে জিজ্ঞাসা করতে পারি: "সুতরাং কীভাবে ডেটা সম্ভাবনাতে প্রবেশ করে"। আপনি কি বলছেন যে এমএলই ব্যবহার করে ফিট করার সময় কোনও ওএলএস এবং পিসন (লিঙ্ক = পরিচয়) এর মধ্যে মডেল ফিট হওয়ার সম্ভাবনা আলাদা? উদাহরণস্বরূপ, যদি এমএলই ব্যবহার করে ওএলএসকে ফিট করে, তবে আপনি কি সাধারণ বিতরণের জন্য সম্ভাব্যতার ফাংশনটি ফিটের সম্ভাবনা গণনা করতে ব্যবহার করেন, পরবর্তী ক্ষেত্রে পোয়েসন বিতরণ থেকে সম্ভাবনা ফাংশন বনাম?
অ্যালেক্স

1
@ অ্যালেক্স রাইট;
ওএলএস গাউসিতে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.