আমি সাধারণ রৈখিক মডেলগুলি গণনার উপাত্তের কয়েকটি সেটের সাথে ফিট করার চেষ্টা করছি যা হয়তো বা অতিরঞ্জিত হতে পারে। এখানে প্রযোজনীয় দুটি বিতরণ হ'ল পোইসন এবং নেগেটিভ বোনোমিয়াল (নেগবিন), ইভি এবং বৈকল্পিক সহ
যা যথাক্রমে আর ব্যবহার করে glm(..,family=poisson)
এবং লাগানো যেতে পারে glm.nb(...)
। রয়েছে quasipoisson
পরিবার, যা আমার বোঝার একই EV তে এবং ভ্যারিয়েন্স সঙ্গে একটি স্থায়ী পইসন হয়
,
অর্থ্যাৎ পইসন এবং নেগবিনের মধ্যে কোথাও পড়ে যাওয়া। কাসিপোইসন পরিবারের প্রধান সমস্যাটি হ'ল এর পক্ষে সম্পর্কিত কোনও সম্ভাবনা নেই এবং তাই প্রচুর উপকারী স্ট্যাটিস্টিকাল টেস্ট এবং ফিটের ব্যবস্থা (এআইসি, এলআর এসটেরা) অনুপলব্ধ।
তোমার তুলনা QP এবং Negbin ভেরিয়ানস থাকে, তাহলে আপনি লক্ষ্য হতে পারে আপনি তাদের নির্বাণ দ্বারা সমার্থক পারে । এই যুক্তি অব্যাহত রেখে, আপনি কোয়াসিপিনস বিতরণকে নেগবিনের একটি বিশেষ কেস হিসাবে প্রকাশ করার চেষ্টা করতে পারেন:
,
অর্থাত্ একটি নেগবিন যার সাথে রৈখিকভাবে নির্ভর করে । আমি উপরের সূত্র অনুসারে সংখ্যার এলোমেলো ক্রম উত্পন্ন করে এটিকে ফিট করে এই ধারণাটি যাচাই করার চেষ্টা করেছি :glm
#fix parameters
phi = 3
a = 1/50
b = 3
x = 1:100
#generating points according to an exp-linear curve
#this way the default log-link recovers the same parameters for comparison
mu = exp(a*x+b)
y = rnbinom(n = length(mu), mu = mu, size = mu/(phi-1)) #random negbin generator
#fit a generalized linear model y = f(x)
glmQP = glm(y~x, family=quasipoisson) #quasipoisson
glmNB = glm.nb(y~x) #negative binomial
> glmQP
Call: glm(formula = y ~ x, family = quasipoisson)
Coefficients:
(Intercept) x
3.11257 0.01854
(Dispersion parameter for quasipoisson family taken to be 3.613573)
Degrees of Freedom: 99 Total (i.e. Null); 98 Residual
Null Deviance: 2097
Residual Deviance: 356.8 AIC: NA
> glmNB
Call: glm.nb(formula = y ~ x, init.theta = 23.36389741, link = log)
Coefficients:
(Intercept) x
3.10182 0.01873
Degrees of Freedom: 99 Total (i.e. Null); 98 Residual
Null Deviance: 578.1
Residual Deviance: 107.8 AIC: 824.7
উভয়ই পরামিতিগুলির পুনরুত্পাদন করতে ফিট করে এবং কোয়াশিপিসন ফাইয়ের জন্য একটি 'যুক্তিসঙ্গত' অনুমান দেয় । কাসিপোসাইনের জন্য আমরা এখন একটি এআইসির মানও সংজ্ঞায়িত করতে পারি:
df = 3 # three model parameters: a,b, and phi
phi.fit = 3.613573 #fitted phi value copied from summary(glmQP)
mu.fit = glmQP$fitted.values
#dnbinom = negbin density, log=T returns log probabilities
AIC = 2*df - 2*sum(dnbinom(y, mu=mu.fit, size = mu.fit/(phi.fit - 1), log=T))
> AIC
[1] 819.329
(আমাকে নিজে থেকে i মানটি অনুলিপি করতে হয়েছিল , কারণ আমি এটি বস্তুটিতে এটি পাইনি )summary(glmQP)
glmQP
যেহেতু এটি ইঙ্গিত দিবে যে কাসিপোসাইসন, আশ্চর্যজনকভাবে, আরও ভাল ফিট; সুতরাং কমপক্ষে এটি করা উচিত যা করে এবং তাই এটি ক্যাসিপোসাইনের এআইসির (এবং এক্সটেনশন দ্বারা, সম্ভাবনা দ্বারা) যুক্তিসঙ্গত সংজ্ঞা হতে পারে। আমি যে বড় প্রশ্নগুলি রেখে এসেছি তা হ'ল A I C Q P
- এই ধারণাটি কি কোনও অর্থবোধ করে? আমার যাচাই বিজ্ঞপ্তি যুক্তি উপর ভিত্তি করে?
- যে কারও কাছে মূল প্রশ্নটি এমন কিছু আবিষ্কার করেছে যা একটি সুপ্রতিষ্ঠিত বিষয় থেকে অনুপস্থিত মনে হচ্ছে: যদি এই ধারণাটি বোঝায়, তবে কেন এটি ইতিমধ্যে বাস্তবায়িত হচ্ছে না
glm
?
সম্পাদনা: চিত্র যোগ করা হয়েছে