পইসন রিগ্রেশন ব্যবহার করে বাইনারি ডেটাগুলিতে অ্যাডজাস্টেড ঝুঁকি অনুপাতের অনুমান করা


9

আমি লজিস্টিক রিগ্রেশন ব্যবহার করে কীভাবে কোনও অ্যাডজাস্টড বিজোড় অনুপাতটি অনুমান করে তার সাথে সাদৃশ্যযুক্ত একটি সমন্বিত ঝুঁকি অনুপাত অনুমান করতে আগ্রহী। কিছু সাহিত্য (উদাহরণস্বরূপ, এটি ) নির্দেশ করে যে হুবার-হোয়াইট স্ট্যান্ডার্ড ত্রুটির সাথে পয়েসন রিগ্রেশন ব্যবহার করা এটি করার একটি মডেল-ভিত্তিক উপায়

ক্রমাগত covariates জন্য সামঞ্জস্যকরণ এটি কীভাবে প্রভাবিত করে সে সম্পর্কে আমি সাহিত্য পাই না। নিম্নলিখিত সাধারণ সিমুলেশনটি দেখায় যে এই সমস্যাটি এত সহজ নয়:

arr <- function(BLR,RR,p,n,nr,ce)
{
   B = rep(0,nr)
   for(i in 1:nr){
   b <- runif(n)<p 
   x <- rnorm(n)
   pr <- exp( log(BLR) + log(RR)*b + ce*x)
   y <- runif(n)<pr
   model <- glm(y ~ b + x, family=poisson)
   B[i] <- coef(model)[2]
   }
   return( mean( exp(B), na.rm=TRUE )  )
}

set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326 

এই ক্ষেত্রে, আসল ঝুঁকি অনুপাত 2, যা কোভারিয়েট প্রভাবটি ছোট হলে নির্ভরযোগ্যতার সাথে পুনরুদ্ধার করা হয়। কিন্তু, যখন covariate প্রভাব বড় হয়, এটি বিকৃত হয়। আমি ধরে নিলাম এটি উত্থাপিত হয়েছে কারণ কোভারিয়েট প্রভাবটি উপরের সীমানা (1) এর বিরুদ্ধে চাপ দিতে পারে এবং এটি অনুমানকে দূষিত করে।

আমি দেখেছি কিন্তু সামঞ্জস্যিত ঝুঁকি অনুপাতের অনুমানের মধ্যে অবিচ্ছিন্ন covariates জন্য সামঞ্জস্য করার জন্য কোন সাহিত্যের সন্ধান পাই নি। আমি এই সাইটে নিম্নলিখিত পোস্ট সম্পর্কে সচেতন:

তবে তারা আমার প্রশ্নের উত্তর দেয় না। এটিতে কোনও কাগজপত্র রয়েছে? এমন কোন জ্ঞাত সতর্কতা রয়েছে যা ব্যবহার করা উচিত?



এছাড়াও এই প্রশ্নোত্তর স্ট্যাটাস.স্ট্যাকেক্সেঞ্জারওয়েজগুলি / প্রশ্নগুলি / 18595 /… সহায়তা করতে পারে।
mdewey

উত্তর:


1

আপনার এখনও এই প্রশ্নের উত্তর প্রয়োজন কিনা তা আমি জানি না, তবে আমার একটি অনুরূপ সমস্যা রয়েছে যাতে আমি পয়েসন রিগ্রেশন ব্যবহার করতে চাই। আপনার কোড চালানোর সময়, আমি আবিষ্কার করেছি যে আমি যদি মডেলটি সেট আপ করি তবে

model <- glm(y ~ b + x, family=binomial(logit)

আপনার পোইসন রিগ্রেশন মডেলের পরিবর্তে একই ফলস্বরূপ ঘটে: সিআর কাছে আসা হিসাবে আনুমানিক OR ~ 1.5 হয় So সুতরাং, আমি নিশ্চিত নই যে আপনার উদাহরণটি বাইনারি ফলাফলের জন্য পোইসন রিগ্রেশন ব্যবহারের একটি সম্ভাব্য সমস্যার তথ্য সরবরাহ করে।


1
লগিট মডেল লাগানোর ক্ষেত্রে সমস্যাটি যখন এটি 1 এর চেয়ে বেশি ঝুঁকির পূর্বাভাস দেয় না, তবে সমস্যাগুলি অনুপাতটি ঝুঁকির অনুপাতের পক্ষপাতদুষ্ট অনুমানকারী এবং ফলাফল আরও প্রচলিত হওয়ার সাথে সাথে পক্ষপাতটি নাটকীয়ভাবে বৃদ্ধি পায়। আপনি binomial(link=log)আসলে একটি আপেক্ষিক ঝুঁকি মডেল ফিট করতে নির্দিষ্ট করতে পারেন , তবে অত্যধিক পূর্বাভাসের ফলাফলের কারণে এটি খুব কমই রূপান্তরিত হয়।
অ্যাডমো

1

আমি দেখতে পেয়েছি যে যথাযথ সম্ভাব্যতা ফাংশনটির সাথে প্রত্যক্ষ সর্বাধিক সম্ভাবনা ব্যবহার করা আপেক্ষিক ঝুঁকির অনুমানকে অনেক উন্নত করে। প্রক্রিয়াটির পূর্বাভাসের হার হিসাবে আপনি সরাসরি ছাঁটাই ঝুঁকি ফাংশনটি নির্দিষ্ট করতে পারেন।

এখানে চিত্র বর্ণনা লিখুন

সাধারণত আমরা অনুমানের জন্য সিআই তৈরি করতে হেসিয়ান ব্যবহার করি। আমি হুবার হোয়াইট ত্রুটিতে "বি" ম্যাট্রিক্স (মাংস) হিসাবে ব্যবহার করার এবং "এ" ম্যাট্রিক্স (রুটি) পেতে উপযুক্ত ঝুঁকি ব্যবহার করার সম্ভাবনাটি সন্ধান করি নি ... তবে আমার সন্দেহ হয় যে এটি কার্যকর হতে পারে! আরও সম্ভবত সম্ভাব্য আপনি মডেল ত্রুটিগুলি অর্জন করতে বুটস্ট্র্যাপ ব্যবহার করতে পারেন যা একটি ভুল বর্ণিত গড়-বৈচিত্র্যের সম্পর্কের পক্ষে শক্ত।

## the negative log likelihood for truncated risk function
negLogLik <- function(best, X, y) { 
  pest <- pmin(1, exp(X %*% best))
  -sum(dpois(x = y, lambda = pest, log=TRUE))
}

set.seed(100)

sim <- replicate(100, {
  n <- 200
  X <- cbind(1, 'b'=rbinom(n, 1, 0.5), 'x'=rnorm(n))
  btrue <- c(log(0.3), log(2), 1)
  ptrue <- pmin(1, exp(X %*% matrix(btrue)))
  y <- rbinom(n, 1, ptrue) ## or just take y=ptrue for immediate results
  nlm(f = logLik, p = c(log(mean(y)),0,0), X=X, y=y)$estimate
})

rowMeans(exp(sim))

দেয়:

> rowMeans(exp(sim))
[1] 0.3002813 2.0680780 3.0888280

মাঝারি সহগ আপনাকে যা চান তা আপনাকে দেয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.