স্থির বনাম র্যান্ডম প্রভাবসমূহ


10

আমি খুব সম্প্রতি জেনারালাইজড লিনিয়ার মিক্সড মডেলগুলি সম্পর্কে শিখতে শুরু করেছি এবং গ্রুপের সদস্যপদটিকে স্থির বা এলোমেলো প্রভাব হিসাবে গণ্য করার ক্ষেত্রে কী পার্থক্য রয়েছে তা অন্বেষণ করতে আর ব্যবহার করছি। বিশেষত, আমি এখানে আলোচিত উদাহরণস্বরূপ ডেটাসেটটি দেখছি:

http://www.ats.ucla.edu/stat/mult_pkg/glmm.htm

http://www.ats.ucla.edu/stat/r/dae/melogit.htm

এই টিউটোরিয়ালে বর্ণিত হিসাবে, ডক্টর আইডির প্রভাব প্রশংসনীয় এবং আমি আরও ভাল ফলাফল দেওয়ার জন্য একটি এলোমেলো ইন্টারসেপ্ট সহ মিশ্র মডেলটি আশা করছিলাম। তবে দুটি পদ্ধতির জন্য এআইসির মানগুলির তুলনা করলে বোঝা যায় যে এই মডেলটি আরও খারাপ:

> require(lme4) ; hdp = read.csv("http://www.ats.ucla.edu/stat/data/hdp.csv")
> hdp$DID = factor(hdp$DID) ; hdp$Married = factor(hdp$Married)
> GLM = glm(remission~Age+Married+IL6+DID,data=hdp,family=binomial);summary(GLM)

Call:
glm(formula = remission ~ Age + Married + IL6 + DID, family = binomial, 
data = hdp)

Deviance Residuals: 
Min       1Q   Median       3Q      Max  
-2.5265  -0.6278  -0.2272   0.5492   2.7329  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept) -1.560e+01  1.219e+03  -0.013    0.990    
Age         -5.869e-02  5.272e-03 -11.133  < 2e-16 ***
Married1     2.688e-01  6.646e-02   4.044 5.26e-05 ***
IL6         -5.550e-02  1.153e-02  -4.815 1.47e-06 ***
DID2         1.805e+01  1.219e+03   0.015    0.988    
DID3         1.932e+01  1.219e+03   0.016    0.987   

[...]

DID405       1.566e+01  1.219e+03   0.013    0.990    
DID405       1.566e+01  1.219e+03   0.013    0.990    
DID406      -2.885e-01  3.929e+03   0.000    1.000    
DID407       2.012e+01  1.219e+03   0.017    0.987    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 10353  on 8524  degrees of freedom
Residual deviance:  6436  on 8115  degrees of freedom
AIC: 7256

Number of Fisher Scoring iterations: 17


> GLMM = glmer(remission~Age+Married+IL6+(1|DID),data=hdp,family=binomial) ; m

Generalized linear mixed model fit by the Laplace approximation 
Formula: remission ~ Age + Married + IL6 + (1 | DID) 
Data: hdp 
AIC  BIC logLik deviance
7743 7778  -3867     7733
Random effects:
Groups Name        Variance Std.Dev.
DID    (Intercept) 3.8401   1.9596  
Number of obs: 8525, groups: DID, 407

Fixed effects:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept)  1.461438   0.272709   5.359 8.37e-08 ***
Age         -0.055969   0.005038 -11.109  < 2e-16 ***
Married1     0.260065   0.063736   4.080 4.50e-05 ***
IL6         -0.053288   0.011058  -4.819 1.44e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Correlation of Fixed Effects:
         (Intr) Age    Marrd1
Age      -0.898              
Married1  0.070 -0.224       
IL6      -0.162  0.012 -0.033


> extractAIC(GLM) ; extractAIC(GLMM)

[1]  410.000 7255.962
[1]    5.000 7743.188

সুতরাং, আমার প্রশ্নগুলি হ'ল:

(1) দুটি ফাংশন দ্বারা সরবরাহিত AIC মানগুলির তুলনা করা কি উপযুক্ত? যদি তা হয় তবে কেন স্থির প্রভাবের মডেলটি আরও ভাল করে?

(২) স্থির বা এলোমেলো প্রভাব বেশি গুরুত্বপূর্ণ কিনা তা সনাক্ত করার সর্বোত্তম উপায়টি কী (অর্থাত্ চিকিত্সা করার জন্য যে চিকিত্সকের কারণে পরিবর্তনশীল রোগীর বৈশিষ্ট্যের চেয়ে বেশি গুরুত্বপূর্ণ?

উত্তর:


7

ফিক্সড এফেক্টস মডেল এবং এলোমেলো প্রভাবের মডেলগুলি ডেটার বিভিন্ন প্রশ্ন জিজ্ঞাসা করে। গোষ্ঠী-স্তরের ডমি ভেরিয়েবলগুলির একটি সেট নির্দিষ্ট করে গড় জবাবের মধ্যে সমস্ত গ্রুপ-স্তরের অনাবৃত ষড়যন্ত্রের জন্য নিয়ন্ত্রন করে, ইউনিটগুলির মধ্যে কেবলমাত্র তারতম্য প্রতিফলিত করতে আপনার অনুমানকে রেখে leaving র্যান্ডম এফেক্টস মডেলগুলি এই ধারণাটি দিয়ে শুরু হয় যে একটি মেটা-জনসংখ্যা রয়েছে (যাই হোক না কেন প্রভাব) এবং আপনার নমুনাটি সেই জনসংখ্যার থেকে অনেকগুলি প্রতিবিম্বিত করে। সুতরাং ভিন্নতার সাথে আপনার ফলাফলগুলি নোঙ্গর করার পরিবর্তে, আপনার ডেটা সেই (সাধারণত স্বাভাবিক) বন্টনের যে পরামিতিগুলি থেকে আপনার ডেটা অনুমান করা হয়েছিল তা ব্যাখ্যা করার জন্য ব্যবহার করা হবে।

প্রায়শই বলা হয় যে স্থির প্রতিক্রিয়া মডেলগুলি আপনার যে ডেটা রয়েছে তা অনুমান পরিচালনা করার জন্য ভাল এবং এলোমেলো প্রভাবের মডেলগুলি এমন কিছু বৃহত্তর জনগোষ্ঠীর উপর ভিত্তি করে চালনার চেষ্টা করার জন্য ভাল যা থেকে আপনার ডেটা একটি এলোমেলো নমুনা।

আমি যখন ফিক্সড এফেক্টস মডেলগুলি সম্পর্কে জানতে পারি তখন তারা ত্রুটির উপাদান এবং প্যানেল ডেটা ব্যবহার করে উদ্বুদ্ধ হয়েছিল। একটি প্রদত্ত ইউনিট এবং সময়ের সঙ্গে একটি র্যান্ডম চিকিত্সা একাধিক পর্যবেক্ষণ নিন ।t

yit=αi+βTit+ϵit

আপনি নিজের ত্রুটি শব্দটি আপনার ত্রুটি শর্তের সেই উপাদানটিতে বিভক্ত করতে পারেন যা সময়ের সাথে পরিবর্তিত হয়, এবং একটি যা:

yit=αi+βTit+ei+uit

এখন উভয় পক্ষ থেকে গ্রুপভিত্তিক গড় বিয়োগ করুন:

yity¯i=αiα¯i+β(TitT¯i)+eie¯i+uitu¯it

যে বিষয়গুলি দ্বারা সাবস্ক্রিপশন করা হয় না সেগুলি মৌলিক বিয়োগফলের দ্বারা সমীকরণ থেকে বেরিয়ে আসে - যা বলতে হয় যে সময়ের সাথে গড় গড় একই রকম হয় যে কোনও সময় পরিবর্তিত হয় যদি তা কখনই পরিবর্তন হয় না। এটিতে আপনার ত্রুটি শর্তের অ-সময়-পরিবর্তিত উপাদান অন্তর্ভুক্ত। সুতরাং আপনার অনুমান সময়-অবিস্মরণীয় বৈচিত্র্যের দ্বারা অবিস্মরণীয়। t

এটি এলোমেলো প্রভাবগুলির মডেলটির পক্ষে যথেষ্ট কাজ করে না - আপনার অ- ইনডেক্সযুক্ত ভেরিয়েবলগুলি সেই রূপান্তর দ্বারা ("অভ্যন্তরে" রূপান্তর) দ্বারা মুছে দেওয়া হবে না। এই হিসাবে, আপনি যে সমস্ত গ্রুপের মধ্যে আলাদা হয় না তার প্রভাবগুলিতে অনুলিপি আঁকতে পারেন। বাস্তব বিশ্বে এই জাতীয় জিনিসের গুরুত্ব রয়েছে। সুতরাং, "ডেটা মডেলিং" এর জন্য এলোমেলো প্রভাবগুলি ভাল, যখন নির্দিষ্ট প্রভাবগুলির মডেলগুলি নির্দিষ্ট পদগুলির নিরপেক্ষ অনুমানের কাছাকাছি যাওয়ার জন্য ভাল। একটি এলোমেলো প্রভাব মডেল দিয়ে, আপনি যে পুরোপুরি মুছে ফেলা হয়েছে দাবি করতে পারবেন না ।tei

এই উদাহরণস্বরূপ, সময় হল গ্রুপিং ভেরিয়েবল। আপনার উদাহরণে, এটি ছিল D (যেমন: এটি সাধারণীকরণ করে)


1

1) তুলনা করা উপযুক্ত, কেবল সেই দুটি মডেলের সাথে নয়। আপনি তুলনা করতে চান:

GLM <- glm(remission~Age+Married+IL6, data=hdp, family=binomial)

সঙ্গে

GLMM <- glmer(remission~Age+Married+IL6+(1|DID), data=hdp, family=binomial)

এবং আপনি একটি anova সঙ্গে এটি করতে পারেন:

anova(GLM, GLMM)

(না নিশ্চিত এই সঙ্গে কাজ করবে glmএবং glmer, ফলাফল হিসাবে তারা বিভিন্ন আর বস্তু হতে পারে। আপনি দুটি ফাংশন, তুলনীয় আগমন বস্তু আছে মতো ব্যবহার করতে হবে পারে lmeএবং gls, বা anova নিজেকে।)

এলোভা এলোমেলো ডাক্তার প্রভাবের সংযোজন উল্লেখযোগ্য কিনা তা দেখতে একটি লগ-সম্ভাবনা অনুপাতের পরীক্ষা করবে। তাত্পর্যপূর্ণ তাৎপর্য ঘোষণার আগে আপনাকে পি-মানটি 2 দিয়ে বিভক্ত করতে হবে কারণ আপনি নাল অনুমানটি পরীক্ষা করছেন যে এলোমেলো ডাক্তার প্রভাব 0, এবং 0 প্যারামিটার স্পেসের সীমানায় একটি ভেরিয়েন্সের জন্য রয়েছে (আসল বিতরণ আপনি ব্যবহার করছেন) পরীক্ষাটি হ'ল এবং বিতরণের মিশ্রণ - তবে আমি এই সময়ে আমার নিজের অজ্ঞতার সীমানার কাছাকাছি এসেছি)। χ 2 1χ02χ12

আমার জন্য, নেস্টেড মডেল বিল্ডিং এবং হাইপোথিসিস টেস্টিংয়ের প্রক্রিয়া বোঝার জন্য সেরা বইটি ওয়েস্ট, ওয়েলশ এবং গ্যালাক্কি (2007) লিনিয়ার মিশ্রিত মডেল: একটি বাস্তব গাইড । তারা প্রতিটি পদক্ষেপে ধাপে ধাপে যায়।

২) আপনার যদি রোগী প্রতি একাধিক পর্যবেক্ষণ থাকে তবে আপনিও রোগীর জন্য এলোমেলো প্রভাব যুক্ত করবেন। তারপরে ধৈর্য বনাম ডাক্তারের আপেক্ষিক গুরুত্ব পরীক্ষা করতে আপনি রোগীর বনামের ভবিষ্যদ্বাণীপূর্ণ প্রভাবগুলি দেখতে পারেন। প্রত্যেকের জন্য এলোমেলো প্রভাবের শর্তাদি রোগীদের মধ্যে এবং ডাক্তারদের মধ্যে বৈচিত্র্যের পরিমাণের পরিমাণ নির্ধারণ করবে, যদি এটি আপনার আগ্রহী একটি প্রশ্ন হয়।

(আমি ভুল হলে কেউ আমাকে সংশোধন করুন!)


আমি নিশ্চিত নই যে এটি একটি স্থির প্রভাব এবং ২ য় মডেলটিতে একটি এলোমেলোভাবে বিরতি উভয়DID হিসাবেই বোধগম্য হয় । তদ্ব্যতীত, এটি 1 ম মডেলটিতে একটি স্থির প্রভাব হিসাবে থাকা মানে এই যে 2 টি পছন্দ বি / টি এর প্রভাব সম্পর্কে কীভাবে ভাবতে হবে তা অন্তর্ভুক্ত করা দরকার কিনা তা নয়। অন্য একটি নোটে, আমি লক্ষ্য করি আপনার কাছে একটি আইটেম রয়েছে (2); আপনি কি কোনও আইটেম (1) রাখার অর্থ দিয়েছিলেন? DID
গুং - মনিকা পুনরায়

তুমি একেবারেই সঠিক; আমি ওপি'র আসল গ্ল্যামুল সূত্রটি থেকে যাচ্ছিলাম যা 1 ম স্থানে একটি নির্দিষ্ট প্রভাব হিসাবে ডিআইডি হওয়া উচিত ছিল না। এখন পছন্দটি ডিআইডিকে একটি এলোমেলো প্রভাব হিসাবে চিকিত্সা করা মডেলের কোনও মান যুক্ত করে কিনা এর মধ্যে রয়েছে।
ক্রিস্টোফার পোইল

1

মডেলগুলি খুব আলাদা। গ্ল্যাম মডেলটি ডিভ্যান্সের সামগ্রিক হ্রাস (নাল-মডেল থেকে) মোকাবেলা করছে যখন ডক্টরআইডির সমস্ত প্রভাব অনুমান করা হচ্ছে এবং প্যারামিটারের অনুমান নির্ধারণ করা হচ্ছে। আপনি খেয়াল করবেন, অবশ্যই, বয়স, বিবাহিত এবং আইএল 6 এর দুটি মডেলের একই ওয়াল্ডের পরিসংখ্যান আছে, তাই না? আমার বোঝাপড়া (আমি স্বীকার করব এমন একটি অত্যন্ত পরিশ্রুত নয়) হ'ল মিশ্র মডেল ডক্টরআইডিদেরকে উপদ্রব কারণ বা স্তর হিসাবে চিকিত্সা করছে, যথা "প্রভাব" যা কোনও নির্দিষ্ট পিতামাত বিতরণ থেকে আঁকতে পারে না বলে ধরে নেওয়া যায় না। আমি ভেবে দেখার কোনও কারণ দেখছি না যে একটি মিশ্র মডেল ব্যবহার করা আপনার "ডাক্তার-প্রভাব" সম্পর্কে আপনার ধারণাকে উন্নত করবে, বাস্তবে একেবারে বিপরীত।

আপনার আগ্রহ যদি বয়স, বিবাহিত বা আইএল 6 এর প্রভাবগুলিতে থাকে তবে আমি কল্পনা করেছিলাম যে আপনি সেই দুটি মডেলের সাথে এআইসির তুলনা করবেন না বরং একই মডেলিং কাঠামোর মধ্যে আগ্রহের কোভারিয়েট অপসারণের সাথে এআইসির পার্থক্যের বাইরেও রাখবেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.