কেন একটি লজিস্টিক রিগ্রেশন 95% আত্মবিশ্বাসের ব্যবধানের ম্যানুয়ালি গণনা করা, এবং আর-তে সীমাবদ্ধতা () ফাংশন ব্যবহারের মধ্যে পার্থক্য রয়েছে?


34

প্রিয় সবাই - আমি এমন কিছু অদ্ভুতভাবে লক্ষ্য করেছি যা আমি ব্যাখ্যা করতে পারি না, পারো? সংক্ষেপে: একটি লজিস্টিক রিগ্রেশন মডেলটিতে একটি আত্মবিশ্বাসের ব্যবধান গণনা করার ম্যানুয়াল পদ্ধতি এবং আর ফাংশনটি confint()বিভিন্ন ফলাফল দেয়।

আমি হোসমার এবং লেমশোর প্রয়োগযুক্ত লজিস্টিক রিগ্রেশন (২ য় সংস্করণ) দিয়ে যাচ্ছি । তৃতীয় অধ্যায়ে বিজোড় অনুপাত এবং 95% আত্মবিশ্বাসের ব্যবধান গণনা করার একটি উদাহরণ রয়েছে। আর ব্যবহার করে, আমি সহজেই মডেলটি পুনরুত্পাদন করতে পারি:

Call:
glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial")

Deviance Residuals: 
   Min      1Q  Median      3Q     Max  
-1.734  -0.847  -0.847   0.709   1.549  

Coefficients:
                             Estimate Std. Error z value Pr(>|z|)    
(Intercept)                   -0.8408     0.2551  -3.296  0.00098 ***
as.factor(dataset$dich.age)1   2.0935     0.5285   3.961 7.46e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 136.66  on 99  degrees of freedom
Residual deviance: 117.96  on 98  degrees of freedom
AIC: 121.96

Number of Fisher Scoring iterations: 4

যাইহোক, আমি যখন প্যারামিটারগুলির আত্মবিশ্বাসের অন্তরগুলি গণনা করি, আমি পাঠ্যের মধ্যে দেওয়াটির সাথে একটি আলাদা বিরতি পাই:

> exp(confint(model))
Waiting for profiling to be done...
                                 2.5 %     97.5 %
(Intercept)                  0.2566283  0.7013384
as.factor(dataset$dich.age)1 3.0293727 24.7013080

হোস্টার এবং লেমেশো নিম্নলিখিত সূত্রটি পরামর্শ দেয়:

[β^1±z- র1-α/2×দঃপূঃ^(β^1)]

এবং তারা আত্মবিশ্বাসের ব্যবধান গণনা করে as.factor(dataset$dich.age)1(২.৯, ২২.৯)।

এটি আর এ করা সহজবোধ্য বলে মনে হচ্ছে:

# upper CI for beta
exp(summary(model)$coefficients[2,1]+1.96*summary(model)$coefficients[2,2])
# lower CI for beta
exp(summary(model)$coefficients[2,1]-1.96*summary(model)$coefficients[2,2])

বইয়ের মতো একই উত্তর দেয়।

যাইহোক, কেন কোনও ধারণা কেন confint()বিভিন্ন ফলাফল দেয় বলে মনে হয়? আমি ব্যবহার করে প্রচুর উদাহরণ দেখেছি confint()


1
হোসমার এবং লেমশোর জন্য সঠিক সাহিত্যের রেফারেন্সটি যুক্ত করতে আপনি কি আপত্তি করবেন? আমি বেশ কিছুদিন ধরে তাদের নকল এবং বইয়ের পরামর্শটি সন্ধান করেছি, কিন্তু এখনও এটি পাইনি।
ডেভিডআর

উত্তর:


36

সহবর্তী ওয়েবসাইট থেকে ডেটা আনার পরে , আমি এখানে এটি কীভাবে করব:

chdage <- read.table("chdage.dat", header=F, col.names=c("id","age","chd"))
chdage$aged <- ifelse(chdage$age>=55, 1, 0)
mod.lr <- glm(chd ~ aged, data=chdage, family=binomial)
summary(mod.lr)

প্রোফাইল সম্ভাবনার উপর ভিত্তি করে 95% সিআই প্রাপ্ত হয়

require(MASS)
exp(confint(mod.lr))

MASSপ্যাকেজটি স্বয়ংক্রিয়ভাবে লোড হলে এটি প্রায়শই ডিফল্ট হয়। এই ক্ষেত্রে, আমি পেতে

                2.5 %     97.5 %
(Intercept) 0.2566283  0.7013384
aged        3.0293727 24.7013080

এখন, আমি যদি 95% ওয়াল্ড সিআই (অ্যাসিপটোটিক নরমালটির উপর ভিত্তি করে) আপনি নিজের হাতে গণনা করেছেন এমনটির সাথে তুলনা করতে চাই, তবে আমি তার confint.default()পরিবর্তে ব্যবহার করব ; এই ফলন

                2.5 %     97.5 %
(Intercept) 0.2616579  0.7111663
aged        2.8795652 22.8614705

ওয়াল্ড সিআই বেশিরভাগ পরিস্থিতিতে ভাল, যদিও প্রোফাইল সম্ভাবনা-ভিত্তিক জটিল নমুনা কৌশলগুলির সাথে কার্যকর হতে পারে। তারা কীভাবে কাজ করে তা আপনি যদি উপলব্ধি করতে চান তবে এখানে মূল নীতিগুলির একটি সংক্ষিপ্ত বিবরণ দেওয়া হয়েছে: ভেটেরিনারি এপিডেমিওলজিতে অ্যাপ্লিকেশন সহ প্রোফাইল সম্ভাবনা পদ্ধতি দ্বারা আত্মবিশ্বাসের বিরতি । আপনি ভেনেবলস এবং রিপলির এমএএসএস বই, §8.4, পৃষ্ঠা 220-221 এ একবার দেখে নিতে পারেন।


25

অনুসরণ করা: প্রোফাইল আত্মবিশ্বাসের অন্তরগুলি আরও নির্ভরযোগ্য (সম্ভাবনার জন্য উপযুক্ত কাটঅফ নির্বাচন করা একটি অ্যাসিম্পটিক (বৃহত নমুনা) অনুমানকে জড়িত করে তবে ওয়াল্ডের আত্মবিশ্বাসের অন্তর অন্তর্নিহিত অন্তর্ভুক্ত চতুর্ভুজ-সম্ভাবনা-পৃষ্ঠ অনুমানের চেয়ে এটি অনেক দুর্বল অনুমান)। যতদূর আমি জানি, ওয়াল্ডের পরিসংখ্যানগুলির জন্য প্রোফাইল আত্মবিশ্বাসের ব্যবস্থাগুলি নিয়ে কোনও যুক্তি নেই except ওয়াল্ড পরিসংখ্যানগুলি দ্রুত গতিতে আসে এবং অনেক পরিস্থিতিতে "যথেষ্ট ভাল" হতে পারে (তবে মাঝে মাঝে উপায়টিও খুঁজে পাওয়া যায়: হউক- দাতা প্রভাব)।


2
এর জন্য ধন্যবাদ, এবং পরামর্শ দেওয়ার জন্য আমি হক-ডোনার প্রভাবটি সন্ধান করছি। প্রভাব পাঠ্যপুস্তকে তেমন চিকিত্সা পায় না তবে এটি বেশ গুরুত্বপূর্ণ বলে মনে হচ্ছে!
অ্যান্ড্রু

18

আমি বিশ্বাস করি যদি আপনি সীমাবদ্ধতার জন্য সহায়তা ফাইলটি সন্ধান করেন () তবে আপনি দেখতে পাবেন যে আত্মবিশ্বাসের ব্যবধানটি নির্মাণ করা হচ্ছে ওয়াল্ড আত্মবিশ্বাসের ব্যবধানের পরিবর্তে (এইচএল থেকে আপনার সূত্র) একটি "প্রোফাইল" ব্যবধান।


5
আহা। যে প্রশ্নের উত্তর। যাইহোক, এটি পরবর্তী একের দিকে নিয়ে যায় - কোনটি পছন্দ হয়?
অ্যান্ড্রু
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.