Lme4 গ্লিমার এবং গ্লমার.এনবি ব্যবহার করে গণনা ডেটা জিএলএমএম-কে ব্যাখ্যা করতে সহায়তা করুন - পয়েসন বনাম নেতিবাচক দ্বিপদী


9

জিএলএমএমগুলির স্পেসিফিকেশন এবং ব্যাখ্যা সম্পর্কিত আমার কিছু প্রশ্ন রয়েছে। 3 টি প্রশ্ন অবশ্যই পরিসংখ্যানগত এবং 2 টি আর সম্পর্কে আরও সুনির্দিষ্ট I আমি এখানে পোস্ট করছি কারণ শেষ পর্যন্ত আমি মনে করি বিষয়টি জিএলএমএম ফলাফলের ব্যাখ্যা।

আমি বর্তমানে একটি জিএলএমএম ফিট করার চেষ্টা করছি। আমি লম্বিটুডিনাল ট্র্যাক্ট ডাটাবেস থেকে মার্কিন আদমশুমারির তথ্য ব্যবহার করছি । আমার পর্যবেক্ষণগুলি সেন্সাস ট্র্যাক্টস। আমার নির্ভরশীল ভেরিয়েবলটি শূন্য আবাসন ইউনিটের সংখ্যা এবং আমি শূন্যস্থান এবং আর্থ-সামাজিক পরিবর্তনশীলগুলির মধ্যে সম্পর্কের বিষয়ে আগ্রহী। এখানে উদাহরণটি সহজ, মাত্র দুটি স্থির প্রতিক্রিয়া ব্যবহার করে: শতাংশ অ-শ্বেত জনগোষ্ঠী (জাতি) এবং মধ্যম পরিবারের আয় (শ্রেণি), এবং তাদের মিথস্ক্রিয়া। আমি দুটি নেস্টেড এলোমেলো প্রভাবগুলি অন্তর্ভুক্ত করতে চাই: দশক এবং দশকের মধ্যে ট্র্যাক্টস, (দশক / ট্র্যাক্ট)। স্থানিক (অর্থাত্ ট্র্যাক্টের মধ্যে) এবং অস্থায়ী (অর্থাত্ দশকের মধ্যে) স্বতঃসংশোধনের জন্য নিয়ন্ত্রণ করার প্রয়াসে আমি এ এলোমেলো বিবেচনা করছি। তবে, আমি স্থির প্রভাব হিসাবে দশকে আগ্রহী, তাই আমি এটিও একটি স্থির কারণ হিসাবে অন্তর্ভুক্ত করছি।

যেহেতু আমার স্বাধীন পরিবর্তনশীলটি একটি অ-নেতিবাচক পূর্ণসংখ্যার গণনা পরিবর্তনযোগ্য, তাই আমি পয়েসন এবং নেতিবাচক দ্বিপদী জিএলএমএম ফিট করার চেষ্টা করছি been আমি মোট হাউজিং ইউনিটগুলির অফসেট হিসাবে ব্যবহার করছি। এর অর্থ গুণফলগুলি খালি হারের উপর প্রভাব হিসাবে ব্যাখ্যা করা হয়, খালি খালি মোট সংখ্যা নয়।

আমার কাছে বর্তমানে পাইসন এবং lme4 থেকে গ্লোমার এবং গ্ল্মার.এনবি ব্যবহার করে অনুমানিত নেতিবাচক দ্বিপদী জিএলএমএম-এর ফলাফল রয়েছে । সহগগুলির ব্যাখ্যা আমার কাছে ডেটা এবং অধ্যয়নের ক্ষেত্র সম্পর্কে আমার জ্ঞানের উপর নির্ভর করে sense

আপনি যদি ডেটা এবং স্ক্রিপ্ট চান তবে সেগুলি আমার গিতুবে রয়েছে । মডেলগুলি তৈরির আগে স্ক্রিপ্টটিতে বর্ণনামূলক তদন্তের আরও কিছু রয়েছে।

আমার ফলাফলগুলি এখানে:

পয়সন মডেল

Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) ['glmerMod']
 Family: poisson  ( log )
Formula: R_VAC ~ decade + P_NONWHT + a_hinc + P_NONWHT * a_hinc + offset(HU_ln) +      (1 | decade/TRTID10)
   Data: scaled.mydata

     AIC      BIC   logLik deviance df.resid 
 34520.1  34580.6 -17250.1  34500.1     3132 

Scaled residuals: 
     Min       1Q   Median       3Q      Max 
-2.24211 -0.10799 -0.00722  0.06898  0.68129 

Random effects:
 Groups         Name        Variance Std.Dev.
 TRTID10:decade (Intercept) 0.4635   0.6808  
 decade         (Intercept) 0.0000   0.0000  
Number of obs: 3142, groups:  TRTID10:decade, 3142; decade, 5

Fixed effects:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)     -3.612242   0.028904 -124.98  < 2e-16 ***
decade1980       0.302868   0.040351    7.51  6.1e-14 ***
decade1990       1.088176   0.039931   27.25  < 2e-16 ***
decade2000       1.036382   0.039846   26.01  < 2e-16 ***
decade2010       1.345184   0.039485   34.07  < 2e-16 ***
P_NONWHT         0.175207   0.012982   13.50  < 2e-16 ***
a_hinc          -0.235266   0.013291  -17.70  < 2e-16 ***
P_NONWHT:a_hinc  0.093417   0.009876    9.46  < 2e-16 ***
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
            (Intr) dc1980 dc1990 dc2000 dc2010 P_NONWHT a_hinc
decade1980  -0.693                                            
decade1990  -0.727  0.501                                     
decade2000  -0.728  0.502  0.530                              
decade2010  -0.714  0.511  0.517  0.518                       
P_NONWHT     0.016  0.007 -0.016 -0.015  0.006                
a_hinc      -0.023 -0.011  0.023  0.022 -0.009  0.221         
P_NONWHT:_h  0.155  0.035 -0.134 -0.129  0.003  0.155   -0.233
convergence code: 0
Model failed to converge with max|grad| = 0.00181132 (tol = 0.001, component 1)

নেতিবাচক দ্বিপদী মডেল

Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) ['glmerMod']
 Family: Negative Binomial(25181.5)  ( log )
Formula: R_VAC ~ decade + P_NONWHT + a_hinc + P_NONWHT * a_hinc + offset(HU_ln) +      (1 | decade/TRTID10)
   Data: scaled.mydata

     AIC      BIC   logLik deviance df.resid 
 34522.1  34588.7 -17250.1  34500.1     3131 

Scaled residuals: 
     Min       1Q   Median       3Q      Max 
-2.24213 -0.10816 -0.00724  0.06928  0.68145 

Random effects:
 Groups         Name        Variance  Std.Dev. 
 TRTID10:decade (Intercept) 4.635e-01 6.808e-01
 decade         (Intercept) 1.532e-11 3.914e-06
Number of obs: 3142, groups:  TRTID10:decade, 3142; decade, 5

Fixed effects:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)     -3.612279   0.028946 -124.79  < 2e-16 ***
decade1980       0.302897   0.040392    7.50 6.43e-14 ***
decade1990       1.088211   0.039963   27.23  < 2e-16 ***
decade2000       1.036437   0.039884   25.99  < 2e-16 ***
decade2010       1.345227   0.039518   34.04  < 2e-16 ***
P_NONWHT         0.175216   0.012985   13.49  < 2e-16 ***
a_hinc          -0.235274   0.013298  -17.69  < 2e-16 ***
P_NONWHT:a_hinc  0.093417   0.009879    9.46  < 2e-16 ***
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
            (Intr) dc1980 dc1990 dc2000 dc2010 P_NONWHT a_hinc
decade1980  -0.693                                            
decade1990  -0.728  0.501                                     
decade2000  -0.728  0.502  0.530                              
decade2010  -0.715  0.512  0.517  0.518                       
P_NONWHT     0.016  0.007 -0.016 -0.015  0.006                
a_hinc      -0.023 -0.011  0.023  0.022 -0.009  0.221         
P_NONWHT:_h  0.154  0.035 -0.134 -0.129  0.003  0.155   -0.233

পোয়েসন DHARMa পরীক্ষা করে

    One-sample Kolmogorov-Smirnov test

data:  simulationOutput$scaledResiduals
D = 0.044451, p-value = 8.104e-06
alternative hypothesis: two-sided

    DHARMa zero-inflation test via comparison to expected zeros with simulation under H0 = fitted model

data:  simulationOutput
ratioObsExp = 1.3666, p-value = 0.159
alternative hypothesis: more

নেতিবাচক দ্বিপদী DHARMa পরীক্ষা

    One-sample Kolmogorov-Smirnov test

data:  simulationOutput$scaledResiduals
D = 0.04263, p-value = 2.195e-05
alternative hypothesis: two-sided

    DHARMa zero-inflation test via comparison to expected zeros with simulation under H0 = fitted model

data:  simulationOutput2
ratioObsExp = 1.376, p-value = 0.174
alternative hypothesis: more

ধর্মা প্লট

পইসন

পোয়েসন মডেল DHARMa প্লট

নেতিবাচক দ্বিপদী

নেতিবাচক দ্বিপদী মডেল DHARMa প্লট

পরিসংখ্যান প্রশ্ন

যেহেতু আমি এখনও জিএলএমএমগুলি সন্ধান করছি আমি স্পেসিফিকেশন এবং ব্যাখ্যা সম্পর্কে নিরাপদ বোধ করছি। আমার কিছু প্রশ্ন আছে:

  1. আমার ডেটা পোইসন মডেল ব্যবহার করে সমর্থন করে না বলে মনে হয় এবং তাই আমি নেতিবাচক দ্বিপদী হিসাবে ভাল। তবে, আমি ধারাবাহিকভাবে সতর্কতা পাই যে আমার নেতিবাচক দ্বিপদী মডেলগুলি সর্বাধিক সীমা বৃদ্ধি করার পরেও তাদের পুনরাবৃত্তির সীমাতে পৌঁছে যায়। "Theta.ML এ (ওয়াই, মিউ, ওজন = অবজেক্ট @ রেস $ ওজন, সীমা = সীমা, পুনরাবৃত্তির সীমাটি পৌঁছেছে" "বেশ কয়েকটি আলাদা স্পেসিফিকেশন ব্যবহার করে এটি ঘটে (অর্থাত্ সংক্ষিপ্ত এবং এলোমেলো প্রভাব উভয়ের জন্য ন্যূনতম এবং সর্বাধিক মডেল))। আমি আমার নির্ভরশীল (স্থূল, আমি জানি!) আউটলিয়ারগুলি অপসারণের চেষ্টাও করেছি, যেহেতু শীর্ষের 1% মানের খুব বেশি বহিরাগত (নীচে 99% পরিসীমা 0-1012 থেকে 1010-55213 এর শীর্ষ 1%) রয়েছে That ' পুনরাবৃত্তির উপর টির কোনও প্রভাব নেই এবং হয় সহগের উপর খুব কম প্রভাব ফেলবে I আমি এখানে এই বিবরণগুলি অন্তর্ভুক্ত করি না। পোইসন এবং নেতিবাচক দ্বিপদীগুলির মধ্যে সহগগুলিও বেশ মিল। এই অভিভাবকের অভাব কি একটি সমস্যা? নেতিবাচক দ্বিপদী মডেল কি ভাল ফিট? আমি ব্যবহার করে নেতিবাচক দ্বিপদী মডেল চালিয়েছিঅলফিট এবং সমস্ত অপ্টিমাইজার এই সতর্কতাটি ফেলে দেয় না (ববাইকা, নেল্ডার মিড, এবং নলমিনিডাব্লু করেনি)।

  2. আমার দশকের স্থির প্রভাবের বৈকল্পিকতা ধারাবাহিকভাবে খুব কম বা 0 হয় I আমি বুঝতে পারি এটির অর্থ মডেলটি অতিরিক্ত পোশাক। স্থির প্রভাবগুলির দশক গ্রহণের ফলে দশকের এলোমেলো প্রভাবের পার্থক্য 0.2620-তে বৃদ্ধি পায় এবং স্থির প্রভাব সহগের উপর খুব বেশি প্রভাব থাকে না। এটি রেখে কিছু ভুল আছে? আমি এটিকে পর্যবেক্ষণের বৈকল্পিকের মধ্যে ব্যাখ্যা করার প্রয়োজনের মতো না হয়ে এটিকে ব্যাখ্যা করছি।

  3. এই ফলাফলগুলি কি ইঙ্গিত করে যে আমার শূন্য-স্ফীত মডেলগুলি চেষ্টা করা উচিত? DHARMa মনে হচ্ছে শূন্য-মুদ্রাস্ফীতিটি সমস্যা নাও হতে পারে suggest আপনি যদি মনে করেন আমার যাইহোক চেষ্টা করা উচিত তবে নীচে দেখুন।

প্রশ্নগুলি

  1. আমি শূন্য-স্ফীত মডেলগুলি চেষ্টা করতে আগ্রহী, তবে আমি নিশ্চিত নই যে কোন প্যাকেজ ইমপ্লিমেন্টগুলি শূন্য-স্ফীত পোইসন এবং নেতিবাচক দ্বিপদী জিএলএমএম-এর জন্য এলোমেলো প্রভাবগুলিকে ঘিরে রেখেছে। আমি এআইসিকে শূন্য-স্ফীত মডেলের সাথে তুলনা করতে গ্ল্যামএডিএডিএমবি ব্যবহার করব তবে এটি একটি একক এলোমেলো প্রভাবের মধ্যে সীমাবদ্ধ যাতে এই মডেলটির পক্ষে কাজ হয় না। আমি MCMCglmm চেষ্টা করতে পারি, তবে আমি বায়েশিয়ান পরিসংখ্যান জানি না তাই এটি আকর্ষণীয়ও নয়। অন্য কোন বিকল্প?

  2. আমি কি সংক্ষিপ্তসার (মডেল) এর মধ্যে ক্ষতিকারক সহগগুলি প্রদর্শন করতে পারি, বা আমি এখানে যেমন করেছি সারাংশের বাইরে তা করতে হবে?


1
(2) সহজ: decadeস্থির এবং এলোমেলো উভয় হিসাবে থাকা বোঝা যায় না। হয় এটিকে স্থির হিসাবে নির্দিষ্ট করুন এবং কেবল (1 | decade:TRTID10)এলোমেলোভাবে অন্তর্ভুক্ত করুন (যা (1 | TRTID10)ধরে নেওয়া যায় যে আপনার TRTID10বিভিন্ন দশকের জন্য একই স্তর নেই) বা স্থির প্রভাব থেকে এটিকে সরিয়ে দিন। কেবলমাত্র 4 টি স্তরের সাথে এটি সংশোধন করা আপনার পক্ষে ভাল। সাধারণের সুপারিশটি হ'ল যদি কারও 5 টি স্তর বা তার বেশি থাকে তবে এলোমেলো প্রভাবগুলি মাপসই করা যায়।
অ্যামিবা

1
তা ছাড়া আপনার দুটি প্লট একইরকম প্রদর্শিত হবে।
অ্যামিবা

1
একত্রিতকরণের সতর্কতা সম্পর্কে - আপনি (1) এ বলেছিলেন যে আপনি bobyqaঅপ্টিমাইজার চেষ্টা করেছেন এবং এটি কোনও সতর্কতা দেয়নি। তাহলে সমস্যা কি? শুধু ব্যবহার bobyqa
অ্যামিবা

1
যাইহোক, আপনি কেন বলছেন তা আমি বুঝতে পারছি না "এটি আমার ডেটা কোনও পইসন মডেল ব্যবহার করে সমর্থন করে না"।
অ্যামিবা

1
আমার অভিজ্ঞতাতে bobyqaডিফল্ট অপ্টিমাইজারের চেয়ে ভাল রূপান্তরিত হয় (এবং আমি মনে করি যে আমি কোথাও পড়েছি এটি ভবিষ্যতের সংস্করণগুলিতে ডিফল্ট হয়ে উঠবে lme4)। আমি মনে করি না যে ডিফল্ট অপ্টিমাইজারের সাথে এটি রূপান্তরিত হলে আপনাকে অ-রূপান্তর সম্পর্কে উদ্বিগ্ন হওয়া উচিত bobyqa
অ্যামিবা

উত্তর:


10

আমি বিশ্বাস করি আপনার অনুমানের সাথে সমাধান করার জন্য কিছু গুরুত্বপূর্ণ সমস্যা রয়েছে।

আপনার ডেটা যাচাই করে আমি যা সংগ্রহ করেছি তা থেকে আপনার ইউনিটগুলি ভৌগলিকভাবে গোষ্ঠীযুক্ত নয়, যেমন কাউন্টির মধ্যে সেন্সাস ট্র্যাক্ট। সুতরাং, গ্রুপিং ফ্যাক্টর হিসাবে ট্র্যাক্টগুলি ব্যবহার করা স্থানিক বৈষম্যকে ক্যাপচার করার জন্য উপযুক্ত নয় কারণ এর অর্থ হ'ল আপনার সমান সংখ্যক ব্যক্তি গোষ্ঠী হিসাবে রয়েছে (বা অন্য কোনও উপায়ে বলতে গেলে, আপনার সমস্ত গ্রুপের প্রত্যেকেই একটি পর্যবেক্ষণ রয়েছে)। একাধিক স্তরীয় মডেলিং কৌশল ব্যবহার করে আমাদের স্বতন্ত্র-স্তরের বৈচিত্রগুলি অনুমান করতে দেয়, যখন গ্রুপ-বৈকল্পিকের জন্য নিয়ন্ত্রণ করা হয়। যেহেতু আপনার গোষ্ঠীগুলির প্রত্যেকটিতে একটি করে পৃথক পৃথক পৃথক পৃথক গোষ্ঠী আপনার পৃথক স্তরের বৈচিত্রের সমান, সুতরাং বহুস্তরের পদ্ধতির উদ্দেশ্যকে পরাস্ত করে।

অন্যদিকে, গ্রুপিং ফ্যাক্টর সময়ের সাথে সাথে বার বার পরিমাপের প্রতিনিধিত্ব করতে পারে। উদাহরণস্বরূপ, একটি অনুদৈর্ঘ্য অধ্যয়নের ক্ষেত্রে, কোনও ব্যক্তির "গণিত" স্কোরগুলি বার্ষিক পুনরুত্থিত হতে পারে, সুতরাং আমাদের প্রত্যেক শিক্ষার্থীর জন্য এন বছর ধরে একটি বার্ষিক মান হবে (এই ক্ষেত্রে, গ্রুপিং ফ্যাক্টরটি আমাদের যেমন এন শিক্ষার্থীদের মধ্যে "নেস্টেড" পর্যবেক্ষণের সংখ্যা)। আপনার ক্ষেত্রে, আপনি প্রতিটি আদমশুমারি ট্র্যাক্টের পুনরাবৃত্তি করেছেন decade। সুতরাং, TRTID10"দশকের বৈকল্পিকের মধ্যে" ক্যাপচারের জন্য আপনি নিজের পরিবর্তনশীলকে একটি গ্রুপিং ফ্যাক্টর হিসাবে ব্যবহার করতে পারেন। এটি সেন্সাস ট্র্যাক্টে প্রায় 4 এবং 5 টি পর্যবেক্ষণ সহ 635 টি ট্র্যাক্টে নেস্টেড 3142 পর্যবেক্ষণের দিকে নিয়ে যায়।

একটি মন্তব্যে যেমন উল্লেখ করা হয়েছে, decadeগ্রুপিং ফ্যাক্টর হিসাবে ব্যবহার করা খুব উপযুক্ত নয়, কারণ প্রতিটি শুমারি ট্র্যাক্টের জন্য আপনার কাছে প্রায় 5 দশক রয়েছে এবং তাদের প্রভাবটি decadeকোভারিয়েট হিসাবে পরিচয় করিয়ে আরও ভালভাবে ধরা যেতে পারে ।

দ্বিতীয়ত, আপনার ডেটাটি পোইসন বা নেতিবাচক দ্বিপদী মডেল (বা একটি শূন্য স্ফীত পদ্ধতি) ব্যবহার করে মডেল করা উচিত কিনা তা নির্ধারণ করতে। আপনার ডেটাতে অতিরিক্ত পরিমাণের পরিমাণ বিবেচনা করুন। পইসন বিতরণের মৌলিক বৈশিষ্ট্য হ'ল সমার্থকতা, মানে গড়টি বিতরণের বিভিন্নতার সমান। আপনার ডেটা দেখার জন্য, এটি বেশ স্পষ্ট যে স্পষ্টভাবে বোঝা যাচ্ছে। উপায়গুলির চেয়ে বৈচিত্রগুলি অনেক বেশি greater

library(dplyr)    
 dispersionstats <- scaled.mydata %>%
 + group_by(decade) %>%
 + summarise(
 + means = mean(R_VAC),
 + variances = var(R_VAC),
 + ratio = variances/means)

##   dispersionstats
##   # A tibble: 5 x 5
##   decade     means variances     ratio 
##    <int>     <dbl>     <dbl>     <dbl> 
## 1   1970  45.43513   4110.89  90.47822 
## 2   1980 103.52365  17323.34 167.33707 
## 3   1990 177.68038  62129.65 349.67087 
## 4   2000 190.23150  91059.60 478.67784 
## 5   2010 247.68246 126265.60 509.78821 

তবুও, statণাত্মক দ্বিপদীটি পরিসংখ্যানগতভাবে আরও উপযুক্ত কিনা তা নির্ধারণ করার জন্য, একটি স্ট্যান্ডার্ড পদ্ধতিটি হ'ল পোইসন এবং নেতিবাচক দ্বিপদী মডেলের মধ্যে সম্ভাবনা অনুপাতের পরীক্ষা করা, যা বোঝায় যে নেগবিনটি আরও ভাল ফিট।

library(MASS)
library(lmtest)

modelformula <- formula(R_VAC ~ factor(decade) + P_NONWHT * a_hinc + offset(HU_ln))

poismodel <- glm(modelformula, data = scaled.mydata, family = "poisson")   
nbmodel <- glm.nb(modelformula, data = scaled.mydata)

lrtest(poismodel, nbmodel)

## Likelihood ratio test

##  Model 1: R_VAC ~ factor(decade) + P_NONWHT * a_hinc + offset(HU_ln)  
## Model 2: R_VAC ~ factor(decade) + P_NONWHT * a_hinc + offset(HU_ln)
##   #Df  LogLik Df  Chisq Pr(>Chisq)
## 1   8 -154269
## 2   9  -17452  1 273634  < 2.2e-16 ***
##  ---
## Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

এটি প্রতিষ্ঠার পরে, পরবর্তী পরীক্ষাটি বিবেচনা করতে পারে যে মাল্টিলেভেল (মিশ্র মডেল) পদ্ধতির অনুরূপ পদ্ধতির সাহায্যে পুনরুদ্ধার করা হয়েছে, যা পরামর্শ দেয় যে মাল্টিলেভেল সংস্করণটি আরও ভাল ফিট করে। (একই রকম পরীক্ষা গ্ল্যামার.এনবি অবজেক্টে পোয়েসন বিতরণ ধরে ধরে একটি গ্লમર ফিটের সাথে তুলনা করতে ব্যবহার করা যেতে পারে, যতক্ষণ না অন্যথায় মডেলগুলি একই রকম থাকে))

library(lme4)

glmmformula <- update(modelformula, . ~ . + (1|TRTID10))

nbglmm <- glmer.nb(glmmformula, data = scaled.mydata)

lrtest(nbmodel, nbglmm)

## Model 1: R_VAC ~ factor(decade) + P_NONWHT * a_hinc + offset(HU_ln)
## Model 2: R_VAC ~ factor(decade) + P_NONWHT + a_hinc + (1 | TRTID10) +
##     P_NONWHT:a_hinc + offset(HU_ln)
##   #Df LogLik Df Chisq Pr(>Chisq)
## 1   9 -17452
## 2  10 -17332  1 239.3  < 2.2e-16 ***
## ---
## Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

পোয়েসন এবং এনবি মডেলগুলির অনুমান সম্পর্কে যা তারা প্রকৃতপক্ষে একে অপরের সাথে খুব মিলিত হবে বলে প্রত্যাশা করা হয়, মূল পার্থক্য হ'ল মান ত্রুটি, অর্থাত্ ওভারডিস্পেরিয়ান উপস্থিত থাকলে, পোয়েসন মডেল পক্ষপাতদুষ্ট স্ট্যান্ডার্ড ত্রুটি সরবরাহ করে provide উদাহরণস্বরূপ আপনার ডেটা গ্রহণ করা:

poissonglmm <- glmer(glmmformula, data = scaled.mydata)
summary(poissonglmm)

## Random effects:
##  Groups  Name        Variance Std.Dev.
## TRTID10 (Intercept) 0.2001   0.4473
## Number of obs: 3142, groups:  TRTID10, 635

## Fixed effects:
##                     Estimate Std. Error z value Pr(>|z|)
## (Intercept)        -2.876013   0.020602 -139.60   <2e-16 ***
## factor(decade)1980  0.092597   0.007602   12.18   <2e-16 ***
## factor(decade)1990  0.903543   0.007045  128.26   <2e-16 ***
## factor(decade)2000  0.854821   0.006913  123.65   <2e-16 ***
## factor(decade)2010  0.986126   0.006723  146.67   <2e-16 ***
## P_NONWHT           -0.125500   0.014007   -8.96   <2e-16 ***
## a_hinc             -0.107335   0.001480  -72.52   <2e-16 ***
## P_NONWHT:a_hinc     0.160937   0.003117   51.64   <2e-16 ***
## ---
## Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

summary(nbglmm)
## Random effects:
##  Groups  Name        Variance Std.Dev.
##  TRTID10 (Intercept) 0.09073  0.3012
## Number of obs: 3142, groups:  TRTID10, 635

## Fixed effects:
##                     Estimate Std. Error z value Pr(>|z|)
## (Intercept)        -2.797861   0.056214  -49.77  < 2e-16 ***
## factor(decade)1980  0.118588   0.039589    3.00  0.00274 **
## factor(decade)1990  0.903440   0.038255   23.62  < 2e-16 ***
## factor(decade)2000  0.843949   0.038172   22.11  < 2e-16 ***
## factor(decade)2010  1.068025   0.037376   28.58  < 2e-16 ***
## P_NONWHT            0.020012   0.089224    0.22  0.82253
## a_hinc             -0.129094   0.008109  -15.92  < 2e-16 ***
## P_NONWHT:a_hinc     0.149223   0.018967    7.87 3.61e-15 ***
## ---
## Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

গুণমানের অনুমানগুলি কীভাবে সমস্ত খুব একই রকম হয় তা লক্ষ্য করুন, মূল পার্থক্যটি কেবল আপনার কোভারিয়েটগুলির মধ্যে একটির তাত্পর্য এবং সেই সাথে এলোমেলো প্রভাবের পার্থক্যের পার্থক্য, যা সূচিত করে যে ইউনিট-স্তরের ভেরিয়েন্সটি এনবি-র অতিরিক্ত পরামিতি দ্বারা ক্যাপচার করা হয়েছে মডেল ( thetaglmer.nb অবজেক্টের মান) এলোমেলো প্রভাব দ্বারা ক্যাপচার ট্র্যাক্টের মধ্যে কিছুকে ক্যাপচার করে।

ক্ষতিকারক সহগ (এবং সম্পর্কিত আত্মবিশ্বাসের অন্তর) সম্পর্কে, আপনি নিম্নলিখিত ব্যবহার করতে পারেন:

fixed <- fixef(nbglmm)
confnitfixed <- confint(nbglmm, parm = "beta_", method = "Wald") # Beware: The Wald method is less accurate but much, much faster.

# The exponentiated coefficients are also known as Incidence Rate Ratios (IRR)
IRR <- exp(cbind(fixed, confintfixed)
IRR
##                         fixed      2.5 %     97.5 %
## (Intercept)        0.06094028 0.05458271 0.06803835
## factor(decade)1980 1.12590641 1.04184825 1.21674652
## factor(decade)1990 2.46807856 2.28979339 2.66024515
## factor(decade)2000 2.32553168 2.15789585 2.50619029
## factor(decade)2010 2.90962703 2.70410073 3.13077444
## P_NONWHT           1.02021383 0.85653208 1.21517487
## a_hinc             0.87889172 0.86503341 0.89297205
## P_NONWHT:a_hinc    1.16093170 1.11856742 1.20490048

চূড়ান্ত চিন্তাভাবনা, জিরো মুদ্রাস্ফীতি সম্পর্কে। শূন্য স্ফীত পোইসন বা নেগবিন মডেলটির কোনও মাল্টিলেভেল বাস্তবায়ন নেই (কমপক্ষে আমি সচেতন) যা আপনাকে মিশ্রণের শূন্য স্ফীত উপাদানগুলির জন্য একটি সমীকরণ নির্দিষ্ট করতে দেয়। glmmADMBমডেল আপনি একটি ধ্রুবক শূন্য মুদ্রাস্ফীতি পরামিতি অনুমান করতে দেয়। একটি বিকল্প পদ্ধতির প্যাকেজে zeroinflফাংশনটি ব্যবহার করা হবে pscl, যদিও এটি মাল্টিলেভেল মডেলগুলিকে সমর্থন করে না। সুতরাং, আপনি একক স্তরের নেতিবাচক দ্বিপদী হিসাবে একক স্তরের শূন্য স্ফীত নেতিবাচক দ্বিপদী সঙ্গে তুলনা করতে পারেন। সম্ভাবনাগুলি হ'ল যদি একক স্তরের মডেলগুলির জন্য শূন্য মূল্যস্ফীতিটি উল্লেখযোগ্য না হয় তবে সম্ভবত এটি মাল্টিলেভাল স্পেসিফিকেশনের জন্য তা তাত্পর্যপূর্ণ নয়।

অভিযোজ্য বস্তু

আপনি যদি স্থানিক স্বতঃসংশ্লিষ্টতার বিষয়ে উদ্বিগ্ন হন তবে কিছুটা ভৌগোলিক ভারী রিগ্রেশন ব্যবহার করে আপনি এটি নিয়ন্ত্রণ করতে পারেন (যদিও আমি বিশ্বাস করি এটি ক্ষেত্র নয়, পয়েন্ট ডেটা ব্যবহার করে)। বিকল্পভাবে, আপনি একটি অতিরিক্ত গ্রুপিং ফ্যাক্টর (রাজ্য, কাউন্টি) দ্বারা আপনার আদমশুমারি ট্র্যাক্টগুলি গোষ্ঠীভূত করতে পারেন এবং এটিকে এলোমেলো প্রভাব হিসাবে অন্তর্ভুক্ত করতে পারেন। শেষ অবধি, এবং আমি নিশ্চিত নই যে এটি সম্পূর্ণরূপে সম্ভাব্য কিনা, উদাহরণস্বরূপ, R_VACপ্রথম ক্রমের প্রতিবেশীদেরকে কোভারিয়েট হিসাবে গড় গড় গণনা ব্যবহার করে স্থানিক নির্ভরতা অন্তর্ভুক্ত করা সম্ভব । যাই হোক না কেন, এই ধরণের পদ্ধতির আগে, স্থানিক স্বতঃসংশ্লিষ্টতা সত্যই উপস্থিত রয়েছে কিনা তা নির্ধারণ করা বুদ্ধিমান হবে (গ্লোবাল মুরানের আই, লিসা পরীক্ষা এবং অনুরূপ পন্থা ব্যবহার করে)।


1
brmsএলোমেলো প্রভাব সহ শূন্য-স্ফীত নেতিবাচক দ্বিপদী মডেল ফিট করতে পারে।
অ্যান্ড্রু এম

@ প্রেস্টেভেজ এবং @ অ্যান্ড্রু, এটি অত্যন্ত কার্যকর! এটি আমার অনেক সমস্যার মুখোমুখি হয়েছিল। আমাকে এর মধ্য দিয়ে চলতে সময় দেওয়ার জন্য ধন্যবাদ আমি একটি জিনব মিশ্রিত মডেল থেকে ফিট করার চেষ্টা করতে যাচ্ছি brmsএবং উপরে উল্লিখিত হিসাবে এটি glmer.nb মডেলের সাথে তুলনা করব। আমি জনগণনা-সংজ্ঞায়িত স্থান (মূলত পৌরসভা, 170 ডলার গোষ্ঠী) এলোমেলো প্রভাবগুলির জন্য গ্রুপিং ফ্যাক্টর হিসাবেও অন্তর্ভুক্ত করার চেষ্টা করব (ডেটাতে কেবল 5 টি কাউন্টি, তাই আমি এটি ব্যবহার করব না)। আমি গ্লোবাল মুরানের আই ব্যবহার করে অবশিষ্টাংশের স্থানিক স্ব-সংশ্লেষণের জন্যও পরীক্ষা করব that এটি সম্পন্ন করার পরে আমি আবার রিপোর্ট করব।
স্যামুয়েল ওয়াকার

@ অ্যান্ড্রুএম, তথ্যের জন্য ধন্যবাদ! আমি ব্রামস সম্পর্কে সচেতন ছিলাম না এবং সাধারণভাবে বায়সিয়ান পরিসংখ্যানগুলির সাথে পরিচিত ছিলাম না, যদিও আমি এখন এটি খতিয়ে দেখতে বেশ আগ্রহী।
প্রেসটিভেজ

1
@ সামুয়েলওয়ালার খুশি যে এটি কার্যকর ছিল! পৌরসভাটি একটি ভাল পছন্দ বলে মনে হচ্ছে (আমি মার্কিন আদমশুমারির তথ্যের সাথে পরিচিত নই তাই আমি যথাযথ হবে কিনা তা না জেনে কাউন্টিকে পরামর্শ দিয়েছিলাম)। গ্ল্যামার.এনবি তুলনামূলকভাবে কোনও ব্র্যামসের বস্তুর সাথে মানানসই, যদিও আমি বেয়েশিয়ার পরিসংখ্যানের সাথে পরিচিত নই, তবে নিশ্চিত নই যে সেগুলি তুলনা করার সবচেয়ে ভাল উপায় হবেন। শুভকামনা!
প্রেসটিভেজ

1
স্যামুয়েলওয়াকারকে একটি সম্ভাব্য বিকল্প হতে পারে স্ট্যান্ডার্ড এবং জিরো স্ফীত নাগবিন মডেলগুলি ব্যবহার করে brmsতাদের তুলনা করতে।
প্রেসটিভেজ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.