মাল্টিলেভেল লজিস্টিক রিগ্রেশন মডেলগুলি অনুমান করা


9

স্তর 1 (স্বতন্ত্র স্তর) এবং একটি স্তর 2 (গোষ্ঠী স্তর) এর একটি ব্যাখ্যামূলক পরিবর্তনশীল সহ নিম্নলিখিত মাল্টিলেভেল লজিস্টিক মডেল:

logit(pij)=π0j+π1jxij(1)
π0j=γ00+γ01zj+u0j(2)
π1j=γ10+γ11zj+u1j(3)

যেখানে, গ্রুপ-স্তরের অবশিষ্টাংশগুলি__ এবং প্রত্যাশা শূন্যের সাথে একটি বহুবিধ সাধারণ বিতরণ বলে ধরে নেওয়া হচ্ছে। অবশিষ্ট অবশিষ্ট ত্রুটির বৈকল্পিকতা হিসাবে সুনির্দিষ্ট করা হয়েছে , এবং অবশিষ্ট ত্রুটিগুলি হিসাবে নির্দিষ্ট করা হয়েছে ।u0ju1ju0jσ02u1jσ12

আমি মডেলের পরামিতিটি অনুমান করতে চাই এবং আমি Rকমান্ডটি ব্যবহার করতে চাই glmmPQL

সমীকরণ (2) এবং (3) সমীকরণ (1) ফলন প্রতিস্থাপন,

logit(pij)=γ00+γ10xij+γ01zj+γ11xijzj+u0j+u1jxij(4)

প্রতিটি গ্রুপে 30 টি গ্রুপ এবং 5 জন পৃথক রয়েছে।(j=1,...,30)

আর কোড:

   #Simulating data from multilevel logistic distribution 
   library(mvtnorm)
   set.seed(1234)

   J <- 30             ## number of groups
   n_j <- rep(5,J)     ## number of individuals in jth group
   N <- sum(n_j)

   g_00 <- -1
   g_01 <- 0.3
   g_10 <- 0.3
   g_11 <- 0.3

   s2_0 <- 0.13  ##variance corresponding to specific ICC
   s2_1 <- 1     ##variance standardized to 1
   s01  <- 0     ##covariance assumed zero

   z <- rnorm(J)
   x <- rnorm(N)

   #Generate (u_0j,u_1j) from a bivariate normal .
   mu <- c(0,0)
  sig <- matrix(c(s2_0,s01,s01,s2_1),ncol=2)
  u <- rmvnorm(J,mean=mu,sigma=sig,method="chol")

  pi_0 <- g_00 +g_01*z + as.vector(u[,1])
  pi_1 <- g_10 + g_11*z + as.vector(u[,2])
  eta <- rep(pi_0,n_j)+rep(pi_1,n_j)*x
  p <- exp(eta)/(1+exp(eta))

  y <- rbinom(N,1,p)

এখন প্যারামিটার অনুমান।

  #### estimating parameters 
  library(MASS)
  library(nlme)

  sim_data_mat <- matrix(c(y,x,rep(z,n_j),rep(1:30,n_j)),ncol=4)
  sim_data <- data.frame(sim_data_mat)
  colnames(sim_data) <- c("Y","X","Z","cluster")
  summary(glmmPQL(Y~X*Z,random=~1|cluster,family=binomial,data=sim_data,,niter=200))

আউটপুট:

      iteration 1
      Linear mixed-effects model fit by maximum likelihood
      Data: sim_data 

      Random effects:
      Formula: ~1 | cluster
              (Intercept)  Residual
      StdDev: 0.0001541031 0.9982503

      Variance function:
      Structure: fixed weights
      Formula: ~invwt 
      Fixed effects: Y ~ X * Z 
                      Value Std.Error  DF   t-value p-value
      (Intercept) -0.8968692 0.2018882 118 -4.442404  0.0000
      X            0.5803201 0.2216070 118  2.618691  0.0100
      Z            0.2535626 0.2258860  28  1.122525  0.2712
      X:Z          0.3375088 0.2691334 118  1.254057  0.2123
      Correlation: 
           (Intr) X      Z     
      X   -0.072              
      Z    0.315  0.157       
      X:Z  0.095  0.489  0.269

      Number of Observations: 150
      Number of Groups: 30 
  • আমি যুক্তি দ্বারা ফাংশনটির ভিতরে পুনরাবৃত্তি নেওয়ার কথা উল্লেখ করে কেন এটি কেবল পুনরাবৃত্তি গ্রহণ করে ?1200glmmPQLniter=200

  • এছাড়াও গ্রুপ-স্তর ভেরিয়েবল এবং ক্রস-লেভেল ইন্টারঅ্যাকশন পি-মান দেখায় যে তারা উল্লেখযোগ্য নয়। তবুও কেন এই নিবন্ধে , তারা আরও বিশ্লেষণের জন্য গ্রুপ-স্তরের ভেরিয়েবল এবং ক্রস-লেভেল ইন্টারঅ্যাকশন রাখছেন?(Z)(X:Z)(Z)(X:Z)

  • এছাড়াও কীভাবে স্বাধীনতার ডিগ্রি DFগণনা করা হচ্ছে?

  • এটি টেবিলের বিভিন্ন অনুমানের তুলনামূলক পক্ষপাতের সাথে মেলে না । আমি আপেক্ষিক পক্ষপাত গণনা করার চেষ্টা করেছি:

     #Estimated Fixed Effect parameters :
    
     hat_g_00 <- -0.8968692 #overall intercept
     hat_g_10 <- 0.5803201  # X
     hat_g_01 <-0.2535626   # Z
     hat_g_11 <-0.3375088   #X*Z
    
    fixed <-c(g_00,g_10,g_01,g_11)
    hat_fixed <-c(hat_g_00,hat_g_10,hat_g_01,hat_g_11)
    
    
    #Estimated Random Effect parameters :
    
    hat_s_0 <-0.0001541031  ##Estimated Standard deviation of random intercept 
    hat_s_1 <-  0.9982503 
    
    std  <- c(sqrt(0.13),1) 
    hat_std  <- c(0.0001541031,0.9982503) 
    
    ##Relative bias of Fixed Effect :
    rel_bias_fixed <- ((hat_fixed-fixed)/fixed)*100
    [1] -10.31308  93.44003 -15.47913  12.50293
    
    ##Relative bias of Random Effect :
    rel_bias_Random <- ((hat_std-std)/std)*100
    [1] -99.95726  -0.17497
    
  • কেন টেবিলের সাথে আপেক্ষিক পক্ষপাতিত্ব মেলে না?

উত্তর:


7

এখানে সম্ভবত অনেকগুলি প্রশ্ন রয়েছে। কিছু মন্তব্য:

  • আপনি প্যাকেজ ( ) glmerথেকে ব্যবহার বিবেচনা করতে পারেন ; এটি ল্যাপ্লেস আনুমানিকতা বা গাউস-হার্মাইট চতুর্ভুজ ব্যবহার করে, যা সাধারণত পিকিউএল এর চেয়ে বেশি নির্ভুল (যদিও উত্তরগুলি এই ক্ষেত্রে খুব একই রকম)।lme4glmer(Y~X*Z+(1|cluster),family=binomial,data=sim_data)
  • niterযুক্তি নির্দিষ্ট করে সর্বোচ্চ পুনরাবৃত্তিও সংখ্যা; শুধুমাত্র একটি পুনরাবৃত্তি আসলে প্রয়োজনীয় ছিল
  • ইন্টারঅ্যাকশন শব্দটি সম্পর্কে আপনার প্রশ্নটি কী তা আমি নিশ্চিত নই। আপনার অ-তাৎপর্যপূর্ণ মিথস্ক্রিয়া শর্তগুলি ছেড়ে দেওয়া উচিত বা না কিছুটা কৃমি হতে পারে এবং এটি আপনার পরিসংখ্যান দর্শনের উপর এবং আপনার বিশ্লেষণের লক্ষ্যগুলির উপর নির্ভর করে (যেমন এই প্রশ্নটি দেখুন )
  • গুগল বুকে পাওয়া যায়, পিনহেরো এবং বেটস (2000) এর পৃষ্ঠা 91 তে বর্ণিত একটি সাধারণ 'অভ্যন্তরীণ-বহিরাগত' হিউরিস্টিক অনুসারে স্বাধীনতার ডিনোমিনেটর ডিগ্রি গণনা করা হচ্ছে ... এটি সাধারণত একটি যুক্তিসঙ্গত আনুমানিকতা তবে স্বাধীনতার ডিগ্রির গণনা জটিল, বিশেষত জিএলএমএমগুলির জন্য
  • যদি আপনি মইনেদদ্দিন এট আল দ্বারা "মাল্টিলেভেল লজিস্টিক রিগ্রেশন মডেলগুলির জন্য নমুনা আকারের একটি সিমুলেশন অধ্যয়ন" প্রতিলিপি দেওয়ার চেষ্টা করছেন (ডিওআই: 10.1186 / 1471-2288-7-34), আপনাকে কেবল একটি রানের তুলনা না করে প্রচুর পরিমাণে সিমুলেশন এবং গণনা গড় চালানো দরকার। তদতিরিক্ত, আপনার সম্ভবত তাদের পদ্ধতিগুলির আরও কাছাকাছি যাওয়ার চেষ্টা করা উচিত (আমার প্রথম বিন্দুতে ফিরে এসে তারা বলেছেন যে তারা অভিযোজক গাউস-হার্মাইট চতুষ্পদ সহ এস.এস.সি.সি.সি. এন.এল.মি.সেক্সড ব্যবহার করে, সুতরাং আপনি উদাহরণস্বরূপ আরও ভাল হবেন glmer(...,nAGQ=10); এটি এখনও হবে না হুবহু মিল, তবে এটি সম্ভবত এর চেয়ে কাছাকাছি হবে glmmPQL

আপনি এটি একটি সামান্য বিট যে প্রতিলিপি নির্মাণ করতে দয়া করে ব্যাখ্যা করুন গেল ncbi.nlm.nih.gov/pmc/articles/PMC1955447/table/T1 , I need to run a large number of simulations and compute averages। এর অর্থ কি, বলুন, আমাকে মাল্টিলেভেল লজিস্টিক বিতরণ থেকে বার ডেটা সিমুলেট করতে হবে এবং প্রতিবার তাদের পরামিতিগুলি অনুমান করতে হবে এবং অনুমানের গড় নিতে হবে? তবে আমি যদি বলি, অনুমানিত প্যারামিটারের মানটি ? অনুসারে প্যারামিটারের সত্য মানের সাথে সমান হয় না ? 300E[θ^]=θ
এবিসি

glmer() এলোমেলো ইন্টারসেপ্টের অনুমান করে । তবে আমি অন্যান্য ভেরিয়েন্স উপাদান (রেসিডুয়াল ভেরিয়েন্স উপাদান), এর ফলাফল থেকে কোন ফলাফল অনুমান করছি নাσ02σ12summary(glmer(Y~X*Z+(1|cluster),family=binomial,data=sim_data,nAGQ=10))
এবিসি

2
আপনি ধরে নিচ্ছেন যে আমরা জিএলএমএম অনুমানের জন্য ব্যবহার করা অনুমানগুলি নিরপেক্ষ are এটি সম্ভবত সত্য নয়; ভাল অনুমান (না PQL) অধিকাংশ হয় এসিম্পটোটিকভাবে পক্ষপাতিত্বহীন, কিন্তু তারা এখনও সসীম আকার নমুনার জন্য পক্ষপাতমূলক করছি।
বেন বলকার

1
@ এ বি সি: হ্যাঁ, এই লিঙ্কগুলির মধ্যে উভয়ই একাধিকবার কোডের একটি অংশের প্রতিলিপি তৈরির উদাহরণ রয়েছে। কোনও ফাংশনে আপনার কোডটি মোড়ানো এবং প্রতিলিপি কমান্ড চালানো সহজ হওয়া উচিত, উদাহরণস্বরূপ।
রায়ান সিমন্স

1
@ এ বি সি: আপনার প্রশ্নের অন্যান্য অংশ হিসাবে, আপনাকে কী বিরক্ত করছে তা সম্পর্কে আমি কিছুটা বিভ্রান্ত। আপনি এলোমেলো সংখ্যা তৈরি করছেন; বৃত্তাকার বা অসীম সংখ্যক অনুলিপি ব্যতীত আপনি কখনই পক্ষপাতিত্বের সাথে ঠিক 0 পেতে যাবেন না (বা, প্রকৃতপক্ষে, কোনও প্যারামিটারের একটি নির্ভুল অনুমান)। তবে, প্রচুর পরিমাণে প্রতিলিপিগুলির সাথে (বলুন, 1000), আপনি খুব ছোট (0 এর কাছাকাছি) পক্ষপাতিত্ব পেতে পারেন। আপনি যে কাগজটি উদ্ধৃত করার চেষ্টা করছেন তা এটি প্রদর্শন করে।
রায়ান সিমন্স
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.