বৈষম্য অনুপাতের মেটা-বিশ্লেষণগুলি কি মূলত আশাহীন?


12

সাম্প্রতিক একটি কাগজে নর্টন এট আল। (2018) [ 1 ] এটি উল্লেখ করুন[1]

বৈষম্য অনুপাতের প্রাক্কলনের পরিসংখ্যানগুলির ফলাফল হিসাবে পরিসংখ্যানগত মডেলগুলির পৃথক পৃথক ব্যাখ্যাযোগ্য ভেরিয়েবল থাকে যখন একই স্টাডি থেকে ভিন্ন ভিন্ন অনুপাতের সাথে তুলনা করা যায় না কারণ প্রতিটি মডেলের একটি পৃথক নির্বিচারে স্কেলিং ফ্যাক্টর থাকে। তেমনি একটি গবেষণা থেকে বৈষম্যের অনুপাতের মাত্রা অন্য গবেষণার বৈষম্যের অনুপাতের মাত্রার সাথে তুলনা করা যায় না, কারণ বিভিন্ন নমুনা এবং বিভিন্ন মডেলের স্পেসিফিকেশনগুলিতে বিভিন্ন স্বেচ্ছাসেবী স্কেলিং উপাদান থাকবে। আরও জড়িত বিষয় হ'ল একাধিক স্টাডিতে প্রদত্ত সমিতির প্রতিকূলতার অনুপাতের মাত্রাকে মেটা-বিশ্লেষণে সংশ্লেষ করা যায় না।

একটি ছোট সিমুলেশন এটি চিত্রিত করে (আর কোডটি প্রশ্নের নীচে রয়েছে)। ধরুন আসল মডেলটি হল:

logit(yi)=1+log(2)x1i+log(2.5)x2i+log(3)x3i+0x4i
আরও কল্পনা করুন যে উপরোক্ত মডেল দ্বারা উত্পন্ন একই তথ্য চারটি গবেষক একটি লজিস্টিক রিগ্রেশন ব্যবহার করে বিশ্লেষণ করেছেন। গবেষক 1-তে কেবল x1 কে কোয়ারিয়েরেট হিসাবে অন্তর্ভুক্ত করা হয় , গবেষক 2 তে x1 এবং x2 এবং আরও উভয়ই অন্তর্ভুক্ত করে। চার গবেষকের x1 এর পক্ষে প্রতিকূল অনুপাতের গড় সিমুলেটেড অনুমানগুলি ছিল:

res_1    res_2    res_3    res_4 
1.679768 1.776200 2.002157 2.004077

2[2][3]

আমার প্রশ্নগুলো:

  1. যদি অজস্র অনুপাতটি মূলত অধ্যয়ন এবং মডেলগুলিতে অপ্রয়োজনীয় হয় তবে আমরা কীভাবে বাইনারি ফলাফলের জন্য বিভিন্ন গবেষণার ফলাফলগুলিকে একত্রিত করতে পারি?
  2. কি অগণিত মেটা-বিশ্লেষণ যে সম্পর্কে বলা যেতে পারে না বিভিন্ন গবেষণা থেকে মতভেদ অনুপাত মেশা যেখানে প্রতিটি অধ্যয়ন সম্ভবত covariates একটি ভিন্ন সেট স্থায়ী? এগুলি কি মূলত অকেজো?

তথ্যসূত্র

[1]: নর্টন ইসি, ডাউড বিই, ম্যাকিয়েজেউস্কি এমএল (2018): অডস অনুপাত - বর্তমানের সেরা অনুশীলন এবং ব্যবহার। জামা 320 (1): 84-85।

[2]: নর্টন ইসি, ডাউড বিই (2017): লগ ওডস এবং লজিট মডেলগুলির ব্যাখ্যা। স্বাস্থ্য সেবা রেস। 53 (2): 859-878।

[3]: হার্নান এমএ, ক্লেটন ডি, কেইডিং এন (২০১১): সিম্পসনের প্যারাডক্সটি মোড়ক ছাড়াই। ইন্ট জে এপিডেমিওল 40: 780-785।

প্রকাশ

প্রশ্ন (রাঃ কোড সহ) একটি প্রশ্ন ব্যবহারকারী দ্বারা যাকে জাহির এর একটি পরিবর্তিত সংস্করণ timdisher উপর datamethods

আর কোড

set.seed(142857)

n_sims <- 1000 # number of simulations

out <- data.frame(
  treat_1 = rep(NA, n_sims)
  , treat_2 = rep(NA, n_sims)
  , treat_3 = rep(NA, n_sims)
  , treat_4 = rep(NA, n_sims)
)

n <- 1000 # number of observations in each simulation

coef_sim <- "x1" # Coefficient of interest

# Coefficients (log-odds)

b0 <- 1
b1 <- log(2)
b2 <- log(2.5)
b3 <- log(3)
b4 <- 0

for(i in 1:n_sims){

  x1 <- rbinom(n, 1, 0.5)
  x2 <- rnorm(n)
  x3 <- rnorm(n) 
  x4 <- rnorm(n) 

  z <-  b0 + b1*x1 + b2*x2 + b3*x3 + b4*x4

  pr <- 1/(1 + exp(-z))  

  y <-  rbinom(n, 1, pr)

  df <-  data.frame(y = y, x1 = x1, x2 = x2, x3 = x3, x4 = x4)
  model1 <- glm(y ~ x1, data = df, family = "binomial")
  model2 <- glm(y ~ x1 + x2, data = df, family = "binomial")
  model3 <- glm(y ~ x1 + x2 + x3, data = df, family = "binomial")
  model4 <- glm(y ~ x1 + x2 + x3 + x4, data = df, family = "binomial")


  out$treat_1[i] <- model1$coefficients[coef_sim]
  out$treat_2[i] <- model2$coefficients[coef_sim]
  out$treat_3[i] <- model3$coefficients[coef_sim]
  out$treat_4[i] <- model4$coefficients[coef_sim]

}

# Coefficients

colMeans(out)
exp(colMeans(out)) # Odds ratios

আপনি কেন বলছেন যে এটি লিনিয়ার রিগ্রেশন সহ ঘটে না। দেখে মনে হচ্ছে আপনি কেবল বাদ দেওয়া পরিবর্তনশীল পক্ষপাতিত্ব বর্ণনা করছেন?
ব্যবহারকারী 2879934

উত্তর:


11

লজিস্টিক রিগ্রেশন মডেল থেকে এই বিকল্পটি ভোগ করে না এমন একাধিক বিকল্প প্রভাব রয়েছে। সবচেয়ে সহজতম একটি হল ভেরিয়েবলের গড় প্রান্তিক প্রভাব। নিম্নলিখিত লজিস্টিক রিগ্রেশন মডেল ধরে নিন:

ln[p1p]=Xβ+γd

Xnkβkdγ

d

1ni=1n[(1+e(Xβ+γ))1(1+eXβ)1]

এই প্রভাবটি হ'ল চিকিত্সা এবং নিয়ন্ত্রণ গোষ্ঠীর মধ্যে ফলাফলের মধ্যে সম্ভাব্যতার পার্থক্য হবে যাঁরা অন্যান্য ভবিষ্যদ্বাণীকের উপর একই মান রাখেন (দেখুন গেলম্যান অ্যান্ড হিল, 2007, পৃষ্ঠা 101)।

ওপি-র দেওয়া উদাহরণটি সম্পর্কিত আর সিনট্যাক্সটি হ'ল:

dydx_bin <- function(fit, coef) {
  mod.mat <- model.matrix(fit) # Obtain model matrix
  coefs <- coef(fit)
  oth_coefs <- coefs[!(names(coefs) == coef)] # Coefs bar focal predictor
  # Get model matrix excluding focal predictor
  X_nb <- as.matrix(mod.mat[, names(oth_coefs)])
  # Predictions for all data ignoring focal predictor
  Xb_nb <- X_nb %*% oth_coefs
  mean(plogis(Xb_nb + coefs[coef]) - plogis(Xb_nb))
}

আমি ওপির সিনট্যাক্সটি পরিবর্তন করে দেখিয়েছি যে মডেলটিতে কোন ভেরিয়েবল রয়েছে তার দ্বারা এটি প্রভাবিত হয় না, যতক্ষণ না ভবিষ্যদ্বাণীকারীর আগ্রহের পরিবর্তনশীল অন্যান্য ভবিষ্যদ্বাণীকের সাথে সম্পর্কিত না থাকে।

আমি ফলাফল ডেটা ফ্রেমটি এভাবে পরিবর্তন করেছি:

out <- data.frame(
  treat_1 = rep(NA, n_sims), treat_2 = rep(NA, n_sims),
  treat_3 = rep(NA, n_sims), treat_4 = rep(NA, n_sims),
  treat_11 = rep(NA, n_sims), treat_21 = rep(NA, n_sims),
  treat_31 = rep(NA, n_sims), treat_41 = rep(NA, n_sims)
)

এবং সিমুলেশনের মধ্যে, আমি গণিত গড় সম্ভাবনার পার্থক্যটি সংরক্ষণ করেছি:

out$treat_11[i] <- dydx_bin(model1, coef_sim)
out$treat_21[i] <- dydx_bin(model2, coef_sim)
out$treat_31[i] <- dydx_bin(model3, coef_sim)
out$treat_41[i] <- dydx_bin(model4, coef_sim)

এবং নতুন ফলাফল:

colMeans(out)[5:8]
 treat_11  treat_21  treat_31  treat_41 
0.1019574 0.1018248 0.1018544 0.1018642 

মডেল স্পেসিফিকেশন নির্বিশেষে আনুমানিক প্রভাবটি সুসংগত ছিল। লিনিয়ার রিগ্রেশন মডেল হিসাবে কোভেরিয়েটস উন্নত দক্ষতা যুক্ত:

apply(out[, 5:8], 2, sd)
  treat_11   treat_21   treat_31   treat_41 
0.02896480 0.02722519 0.02492078 0.02493236 

দুটি অতিরিক্ত গ্রুপের মধ্যে ওপিতে গড় সম্ভাবনা অনুপাতের মতো গণনা করতে পারে এমন আরও প্রভাব রয়েছে। উপরে গণনা করা গড় সম্ভাব্যতা পার্থক্যটি আর এর মার্জিন প্যাকেজ এবং স্টাটাতে মার্জিন কমান্ড থেকে পাওয়া যায়। গড় সম্ভাব্যতা অনুপাত কেবল স্টাটাতে উপলব্ধ।

মেটা-বিশ্লেষণের ফলাফলগুলিকে বিশ্বাস করা সম্পর্কে অন্য প্রশ্নের মধ্যে। একের জন্য, প্রভাবটির দিকটি অকেজো হওয়া উচিত নয়। বৈষম্য অনুপাতের সমস্যা সহগের চিহ্নকে প্রভাবিত করে না। সুতরাং যদি বেশিরভাগ অধ্যয়নের মধ্যে একটির চেয়ে বেশি পরিমাণের অনুপাত থাকে তবে এই বিশেষ সমস্যাটির কারণে এই প্রভাবটিকে সন্দেহ করার কোনও কারণ নেই।

সঠিক অনুমান হিসাবে, এটি বিশ্বাস করার কোনও কারণ নেই। সুন্দর জিনিস হ'ল যদি উপাদান অধ্যয়নগুলি এলোমেলোভাবে নিয়ন্ত্রিত পরীক্ষাগুলি হয় তবে প্রতিকূল অনুপাতগুলি রক্ষণশীল অনুমান এবং প্রকৃত ফলাফলগুলি আরও বড়। এটি কারণ ওপি প্রদর্শিত প্রভাবটি প্রতিক্রিয়া অনুপাতটিকে একের দিকে সঙ্কুচিত করে। সুতরাং, যদি বেশিরভাগ অধ্যয়নের মধ্যে 1 এর ওপরে বৈষম্যের অনুপাত থাকে এবং মেটা-বিশ্লেষণ এই দিকে নির্দেশ করে, তবে প্রকৃত বা একবার সমস্ত প্রাসঙ্গিক কোভেরিয়েটগুলি সামঞ্জস্য করা হলে আরও বড় হয়। সুতরাং এই মেটা-বিশ্লেষণগুলি সম্পূর্ণ অকেজো নয়।

তবে আমি বরং অন্যান্য প্রভাবের প্রাক্কলন মেটা-বিশ্লেষণে ব্যবহার করতে চাই। গড় সম্ভাবনার পার্থক্যটি একটি পদ্ধতির এবং অন্যগুলি রয়েছে।


গেলম্যান, এ।, এবং হিল, জে। (2007) রিগ্রেশন এবং মাল্টিলেভেল / শ্রেণিবদ্ধ মডেলগুলি ব্যবহার করে ডেটা বিশ্লেষণ। ক্যামব্রিজ ইউনিভার্সিটি প্রেস.


1
@ কোলসারড্যাশ ধন্যবাদ এখানে অন্বেষণ করার মতো আরও অনেক কিছু রয়েছে। প্রতিকূল অনুপাতটি যখন অবিচ্ছিন্ন পরিবর্তনশীল থেকে আসে তখন এটি আরও আকর্ষণীয় হয়, বিশেষত যদি মূল সম্পর্কের ক্ষেত্রে ভিন্ন ভিন্ন বৈশিষ্ট্য থাকে। এই প্রশ্নের উত্তরে আছিম জেইলিস উত্তরটি দেখুন - stats.stackexchange.com/questions/370876/…
হেটেরোস্কেস্টিক জিম

লিঙ্কের জন্য ধন্যবাদ। আমার অবশ্যই স্বীকার করতে হবে যে অন্তর্নিহিত সুপ্ত অবিচ্ছিন্ন পরিবর্তনশীল ব্যবহার করে লজিস্টিক মডেলটির বিকাশ আমার কাছে নতুন। আমি বায়োস্ট্যাটিস্টিক্স থেকে এসেছি এবং এই ক্ষেত্রের চূড়ান্ত উত্সগুলি এই সমস্যার উল্লেখ করে বলে মনে হচ্ছে না (যেমন লেমেশো এবং হোসমারের "অ্যাপ্লাইড লজিস্টিক রিগ্রেশন" বইটি)। আমি (কাল) যত তাড়াতাড়ি পারব ততক্ষণে আপনাকে এই অনুদান প্রদান করব।
COOLSerdash

আমি মনে করি আপনি যদি লজিস্টিক ত্রুটিগুলি ধরে নেন তবে অন্তর্নিহিত ক্রমাগত পরিবর্তনশীলের অধীন ডেরিভেশন অদ্ভুত। আপনি যদি সাধারণ ত্রুটিগুলি ধরে নেন তবে এটি সিএলটিকে আরও ন্যায়সঙ্গত ধন্যবাদ। তাই প্রোনিট রিগ্রেশন ইকোনোমেট্রিক্সে প্রচুর পরিমাণে ব্যবহৃত হয়েছে, এটি একটি সাধারণ ব্যয়। তবে আপনি যদি অবিচ্ছিন্ন পরিবর্তনশীলটিকে দ্বিধায়িত করতে থাকেন তবে ত্রুটির অধীনে ডাইরিভেশনটি খুব সহায়ক। তদুপরি, এই ডাইরিভিশনটি একজনকে সাধারণভাবে মডেলটি আরও ভালভাবে আবিষ্কার করতে এবং নির্দিষ্ট স্পর্শগুলি আবিষ্কার করতে দেয়। এবং পূর্ববর্তী অনুগ্রহের জন্য ধন্যবাদ।
হেটেরোস্কেস্টিক জিম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.