মিশ্র মডেলগুলিতে একক ফিটের সাথে ডিলিং


16

ধরা যাক আমাদের একটি মডেল আছে

mod <- Y ~ X*Condition + (X*Condition|subject)

# Y = logit variable  
# X = continuous variable  
# Condition = values A and B, dummy coded; the design is repeated 
#             so all participants go through both Conditions  
# subject = random effects for different subjects 

summary(model)
Random effects:
 Groups  Name             Variance Std.Dev. Corr             
 subject (Intercept)      0.85052  0.9222                    
         X                0.08427  0.2903   -1.00            
         ConditionB       0.54367  0.7373   -0.37  0.37      
         X:ConditionB     0.14812  0.3849    0.26 -0.26 -0.56
Number of obs: 39401, groups:  subject, 219

Fixed effects:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)       2.49686    0.06909   36.14  < 2e-16 ***
X                -1.03854    0.03812  -27.24  < 2e-16 ***
ConditionB       -0.19707    0.06382   -3.09  0.00202 ** 
X:ConditionB      0.22809    0.05356    4.26 2.06e-05 ***

এখানে আমরা একটি একক ফিট দেখতে পাই, কারণ ইন্টারসেপ্ট এবং এক্স এলোমেলো প্রভাবগুলির মধ্যে পারস্পরিক সম্পর্ক -1। এখন, এই সহায়ক লিঙ্ক অনুসারে এই মডেলটি মোকাবেলা করার এক উপায় হ'ল উচ্চ-অর্ডার র্যান্ডম এফেক্টগুলি (যেমন, এক্স: কন্ডিশনবি) মুছে ফেলা এবং একাকীত্বের পরীক্ষা করার সময় এটি কোনও তাত্পর্যপূর্ণ কিনা তা দেখুন। অন্যটি হ'ল বায়েশিয়ান পদ্ধতির ব্যবহার করা, উদাহরণস্বরূপ, blmeএককত্ব এড়াতে প্যাকেজটি।

প্রিফার্ড পদ্ধতি কী এবং কেন?

আমি এটি জিজ্ঞাসা করছি কারণ প্রথম বা দ্বিতীয়টি ব্যবহার করা বিভিন্ন ফলাফলের দিকে নিয়ে যায় - প্রথম ক্ষেত্রে, আমি এক্স: কন্ডিশনবি এলোমেলো প্রভাবটি সরিয়ে ফেলব এবং এক্স এবং এক্স এর মধ্যে পারস্পরিক সম্পর্কের অনুমান করতে সক্ষম হবো না: কন্ডিশনবি র‌্যান্ডম এফেক্টস। অন্যদিকে, ব্যবহার করে blmeআমাকে এক্স: কন্ডিশনবি রাখতে এবং প্রদত্ত পারস্পরিক সম্পর্কের অনুমান করতে দেয়। আমি বেইসিয়ান পদ্ধতির সাহায্যে যখন সমস্ত কিছু অনুমান করতে পারি তখন একা একা ফিট হয়ে গেলে আমার এমনকি বে-বেইশিয়ান অনুমানগুলি ব্যবহার করা এবং এলোমেলো প্রভাবগুলি সরিয়ে দেওয়ার কোনও কারণ আমি দেখতে পাই না।

একক একা ফিট ব্যবহারের জন্য কেউ কোনও পদ্ধতি ব্যবহার করে আমাকে কীভাবে সুবিধা এবং সমস্যাগুলি ব্যাখ্যা করতে পারেন?

ধন্যবাদ.


আপনি কি এই করর সম্পর্কে চিন্তিত হন = -1? এটি এলোমেলো প্রভাবগুলির মধ্যে পারস্পরিক সম্পর্ক।
ব্যবহারকারী 158565

সুতরাং প্রতিটি বিষয় আপনাকে Y এর দুটি পরিমাপ দেয়, একটি শর্তের অধীনে এবং একটি শর্তাধীন বি? যদি এটি সত্য হয়, আপনি কি আমাদের এটিও বলতে পারবেন যে শর্ত A এবং B এর মধ্যে কোনও প্রদত্ত বিষয়ের জন্য অবিচ্ছিন্ন ভেরিয়েবল এক্সের মান পরিবর্তন হয় কিনা?
ইসাবেলা ঘেমেন্ট

আপনি এলোমেলো প্রভাবগুলিতে শর্তটি রাখেন কেন? এটি পরীক্ষা করা দরকার?
দিমিত্রিস রিজোপল্লো

@ ব্যবহারকারী 158565 হ্যাঁ তবে এটি সংকেত বোঝায় ...
ব্যবহারকারীর 323268

পছন্দ করুন হ্যাঁ এটি করে, এ এবং বি এর মধ্যে যে কোনও প্রদত্ত সাবজেক্টের জন্য এক্স পরিবর্তন করে তদ্ব্যতীত, এক্সে Y এর রিগ্রেশন প্রতিটি বিষয়ের জন্য আলাদা বলে ধরে নেওয়ার তাত্ত্বিক কারণ রয়েছে
User33268

উত্তর:


21

যখন আপনি একটি একক ফিট পান, এটি প্রায়শই ইঙ্গিত দেয় যে মডেলটি বেশি ছাপিয়ে গেছে - অর্থাত, এলোমেলো প্রভাবগুলির কাঠামোটি ডেটা দ্বারা সমর্থনযোগ্য নয়, যা স্বাভাবিকভাবেই এলোমেলো প্রভাবগুলির সবচেয়ে জটিল অংশটি সরিয়ে দেওয়ার পরামর্শ দেয় to কাঠামো (সাধারণত এলোমেলো opালু)। এই পদ্ধতির সুবিধা হ'ল এটি আরও পার্সিমোনিয়াস মডেলের দিকে নিয়ে যায় যা অতিরিক্ত ফিট করে না।

যাইহোক, কিছু করছেন আগে, আপনি অনুপস্থিত জন্য একটি ভাল কারণ আছে X, Conditionএবং তাদের মিথস্ক্রিয়া, সমস্ত প্রথম স্থানে বিষয় অনুযায়ী আলাদা আলাদা কিভাবে? কীভাবে ডেটা উত্পন্ন হয় তার তত্ত্বটি এটিকে বোঝায়?

আপনি যদি সর্বাধিক র্যান্ডম এফেক্টস স্ট্রাকচারের সাথে মডেলটিকে ফিট করতে চান এবং lme4একক একা ফিট পান, তবে কোনও বয়েশিয়ান কাঠামোয় একই মডেলটি ফিট করা আপনাকে খুব ভালভাবেই জানাতে পারে যে সমস্যাগুলি কেন lme4 ছিল, ট্রেস প্লটগুলি পরিদর্শন করে এবং বিভিন্ন পরামিতির অনুমানগুলি কতটা ভাল রূপান্তরিত করে by । বয়েসিয়ান পদ্ধতির গ্রহণের সুবিধাটি হ'ল এটি করার মাধ্যমে আপনি মূল মডেল সম্পর্কিত সমস্যা উদ্ঘাটন করতে পারেন। সর্বাধিক এলোমেলো প্রভাবগুলির কাঠামোটি ডেটা দ্বারা সমর্থিত না হওয়ার কারণ) বা এটি lme4মডেলটিকে ফিট করতে পারে না কেন তা আবিষ্কার করতে পারে। আমি এমন পরিস্থিতিতে পড়েছি যেখানে কোনও বায়সিয়ান মডেল ভাল রূপান্তরিত করে না, যদি না তথ্যবহুল প্রিয়ার ব্যবহার করা হয় - যা ঠিক আছে বা নাও হতে পারে।

সংক্ষেপে, উভয় পদ্ধতিরই যোগ্যতা রয়েছে।

তবে, আমি সর্বদা এমন জায়গা থেকে শুরু করব যেখানে প্রাথমিক মডেলটি পার্সোনোনিয়াস এবং সর্বাধিক উপযুক্ত এলোমেলো প্রভাবগুলির কাঠামো নির্ধারণের জন্য বিশেষজ্ঞ ডোমেন জ্ঞান দ্বারা অবহিত। গোষ্ঠীবদ্ধ ভেরিয়েবল নির্দিষ্ট করা অপেক্ষাকৃত সহজ, কিন্তু র্যান্ডম ঢালে সাধারণত না আছে অন্তর্ভুক্ত করা হবে। কেবলমাত্র যদি তারা শব্দ তাত্ত্বিক অর্থে তৈরি করে এবং তাদের ডেটা দ্বারা সমর্থন করা হয় তবে তাদের অন্তর্ভুক্ত করুন।

সম্পাদনা: এটি মন্তব্যগুলিতে উল্লেখ করা হয়েছে যে সর্বাধিক এলোমেলো প্রভাব কাঠামোর সাথে মানিয়ে নেওয়ার জন্য তাত্ত্বিক কারণ রয়েছে। সুতরাং, একটি অপেক্ষাকৃত সহজ উপায় একটি সমতুল্য Bayesian মডেল এগিয়ে যেতে কল অদলবদল হয় glmerসঙ্গে stan_glmerথেকে rstanarmপ্যাকেজ - এটা প্লাগ এবং খেলা হতে ডিজাইন করা হয়েছে। এটিতে ডিফল্ট প্রিয়ার রয়েছে, তাই আপনি দ্রুত একটি মডেল লাগিয়ে নিতে পারেন। প্যাকেজটিতে রূপান্তর মূল্যায়ন করার জন্যও অনেক সরঞ্জাম রয়েছে। যদি আপনি দেখতে পান যে সমস্ত পরামিতিগুলির প্লাজেবল মানগুলিতে রূপান্তর আছে তবে আপনি সমস্ত ভাল। তবে এখানে বেশ কয়েকটি সমস্যা থাকতে পারে - উদাহরণস্বরূপ শূন্যের নীচে বা তার নীচে একটি বৈকল্পিক অনুমান করা হচ্ছে বা এমন একটি অনুমান যা প্রবাহ অব্যাহত থাকে। এমসি-ইস্তান.আর. সাইটটিতে প্রচুর তথ্য এবং একটি ব্যবহারকারী ফোরাম রয়েছে।


1
হ্যাঁ, আমার ধরে নেওয়া ভাল তাত্ত্বিক কারণগুলি রয়েছে যে এক্স এবং ওয়াইয়ের প্রতিস্থাপনের বিষয়গুলি A এবং B শর্তের জন্য পৃথকভাবে পৃথক হওয়া উচিত The রিগ্রেশনটি প্রক্রিয়াকরণ শৈলীতে বোঝায়। আপনি কীভাবে আমাকে এককতার জন্য ডায়াগনস্টিক সরঞ্জাম হিসাবে ট্রেস প্লটগুলি ব্যাখ্যা করতে পারেন সে সম্পর্কে আরও কিছু তথ্য দিতে পারেন?
ব্যবহারকারীর 323268

11

এটি একটি আকর্ষণীয় উত্তর এবং মন্তব্য সহ একটি আকর্ষণীয় থ্রেড! যেহেতু এটি এখনও উত্থাপিত হয়নি, আমি এটি উল্লেখ করতে চেয়েছিলাম যে প্রতিটি বিষয়ে আমাদের কাছে খুব অল্প ডেটা রয়েছে (যেমন আমি তা বুঝতে পারি)। প্রকৃতপক্ষে, প্রতিটি বিষয়ের প্রতিটি প্রতিক্রিয়ার ভেরিয়েবল ওয়াইয়ের জন্য কেবল দুটি মান রয়েছে, শ্রেণিবদ্ধ পরিবর্তনশীল কন্ডিশন এবং ক্রমাগত পরিবর্তনশীল এক্স। বিশেষত, আমরা জানি যে কন্ডিশনের দুটি মান হ'ল এ এবং বি are

যদি আমরা মিশ্র প্রভাবগুলির মডেলিংয়ের পরিবর্তে দ্বি-পর্যায়ের রিগ্রেশন মডেলিং অনুসরণ করি, তবে আমরা বিষয়গুলির একটির জন্য নীচের খেলনা উদাহরণে চিত্রিত হিসাবে একটি নির্দিষ্ট বিষয় থেকে উপাত্তগুলিতে লিনিয়ার রিগ্রেশন মডেলটি ফিট করতে পারি না:

y <- c(4, 7)
condition <- c("A", "B")
condition <- factor(condition)
x <- c(0.2, 0.4)

m <- lm(y ~ condition*x)
summary(m)

এই বিষয়-নির্দিষ্ট মডেলের আউটপুট হবে:

Call:
lm(formula = y ~ condition * x)

Residuals:
ALL 2 residuals are 0: no residual degrees of freedom!

Coefficients: (2 not defined because of singularities)
         Estimate Std. Error t value Pr(>|t|)
(Intercept)         4         NA      NA       NA
conditionB          3         NA      NA       NA
x                  NA         NA      NA       NA
conditionB:x       NA         NA      NA       NA

Residual standard error: NaN on 0 degrees of freedom
Multiple R-squared:      1,     Adjusted R-squared:    NaN 
F-statistic:   NaN on 1 and 0 DF,  p-value: NA

লক্ষ্য করুন যে মডেল ফিটটি একচেটিয়াতায় ভুগছে, কারণ আমরা মাত্র 2 টি পর্যবেক্ষণ ব্যবহার করে 4 টি রিগ্রেশন সহগ এবং ত্রুটি স্ট্যান্ডার্ড বিচ্যুতি অনুমান করার চেষ্টা করছি।

আমরা প্রতিটি শর্তে একবারের চেয়ে - একবার নয় বরং এই বিষয়টিকে দু'বার পর্যবেক্ষণ করলেও এককথায় অবিচলিত থাকবে। তবে, যদি আমরা প্রতিটি শর্তে এই বিষয়টি 3 বার পর্যবেক্ষণ করি, তবে আমরা এককৃতিত্ব থেকে মুক্তি পাব:

y <- c(4, 7, 3, 5, 1, 2)
condition <- c("A", "B", "A","B","A","B")
condition <- factor(condition)
x <- c(0.2, 0.4, 0.1, 0.3, 0.3, 0.5)

m2 <- lm(y ~ condition*x)
summary(m2)

এই দ্বিতীয় উদাহরণটির সাথে সম্পর্কিত আর আউটপুট এখানে দেওয়া হয়েছে, যেখান থেকে একক অদৃশ্যতা অদৃশ্য হয়ে গেছে:

>     summary(m2)

Call:
lm(formula = y ~ condition * x)

Residuals:
    1       2       3       4       5       6 
1.3333  2.3333 -0.6667 -1.1667 -0.6667 -1.1667 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)
(Intercept)     4.667      3.555   1.313    0.320
conditionB      6.000      7.601   0.789    0.513
x             -10.000     16.457  -0.608    0.605
conditionB:x   -5.000     23.274  -0.215    0.850

Residual standard error: 2.327 on 2 degrees of freedom
Multiple R-squared:  0.5357,    Adjusted R-squared:  -0.1607 
F-statistic: 0.7692 on 3 and 2 DF,  p-value: 0.6079

অবশ্যই, মিশ্র প্রভাবগুলির মডেলটি প্রতিটি বিষয়ের জন্য সম্পর্কিত নয়, পৃথক লিনিয়ার রিগ্রেশন মডেলগুলির সাথে খাপ খায় না - এটি "সম্পর্কিত" মডেলগুলির সাথে খাপ খায় যাগুলির বিরতি এবং / অথবা opালগুলি একটি সাধারণ ইন্টারসেপ্ট এবং / অথবা opeাল সম্পর্কে এলোমেলোভাবে বিভ্রান্ত হয়, যেমন এলোমেলো বিচ্যুতিগুলি থেকে টিপিক্যাল ইন্টারসেপ্ট এবং / অথবা সাধারণ opeাল গড় শূন্য এবং কিছু অজানা স্ট্যান্ডার্ড বিচ্যুতি সহ একটি সাধারণ বিতরণ অনুসরণ করে।

তবুও, আমার অন্তর্নিহিত পরামর্শ দেয় যে মিশ্র প্রভাবগুলির মডেল স্বল্প পরিমাণে পর্যবেক্ষণের সাথে লড়াই করছে - মাত্র 2 - প্রতিটি বিষয়ের জন্য উপলব্ধ subject মডেল যত বেশি এলোমেলো opালু সহ লোড হয়, তত সম্ভবত এটি লড়াই করে। আমি সন্দেহ করি যে, যদি প্রতিটি বিষয় 2 এর পরিবর্তে 6 টি পর্যবেক্ষণের অবদান রাখে (অর্থাৎ শর্ত অনুযায়ী 3), তবে এলোমেলো slালু সমস্তগুলিকে সামঞ্জস্য করার পক্ষে আর লড়াই করতে হবে না।

আমার কাছে মনে হয় এটি (?) এমন একটি ক্ষেত্রে হতে পারে যেখানে বর্তমান অধ্যয়ন নকশা জটিল মডেলিংয়ের উচ্চাকাঙ্ক্ষাকে সমর্থন করে না - এই উচ্চাকাঙ্ক্ষাকে সমর্থন করার জন্য প্রতিটি বিষয়ের জন্য প্রতিটি শর্তে আরও পর্যবেক্ষণের প্রয়োজন হবে (বা কমপক্ষে কিছু ক্ষেত্রে বিষয়?)। এটি কেবলমাত্র আমার স্বজ্ঞাততা তাই আমি আশা করি অন্যরা আমার উপরের পর্যবেক্ষণগুলিতে তাদের অন্তর্দৃষ্টি যুক্ত করতে পারে। তুমাকে অগ্রিম ধন্যবাদ!


আমাকে আপনাকে সংশোধন করতে হবে - প্রতিটি অংশগ্রহণকারীর এক্স এবং ওয়াই উভয় ক্ষেত্রেই এ এবং বি উভয় অবস্থাতেই 30 টি পর্যবেক্ষণ রয়েছে!
ব্যবহারকারীর 323268

2
ওহ, এটি আপনার প্রারম্ভিক উত্তরে নির্দেশিত হয়নি তাই আমার পক্ষে অনুমান করা সম্ভব হত না যে আপনি আসলে কতগুলি পর্যবেক্ষণ এবং শর্ত সাপেক্ষে রেখেছেন gu তখন অন্য কিছু চলছে। আপনি কি আপনার এক্স ভেরিয়েবলকে মানীকরণের চেষ্টা করেছিলেন? এই lme ফিট করতে সাহায্য করে? এছাড়াও, আপনি কন্ডিশন = এ বনাম কন্ডিশন = বি এর প্রতিটি জন্য পৃথকভাবে ওয়াই বনাম এক্স (বা মানকৃত এক্স) এর প্লটগুলি দেখেছেন? এটি আপনাকে কী চলছে তা সম্পর্কে অতিরিক্ত ক্লু দিতে পারে।
ইসাবেলা ঘেমেন্ট

আমি এক্সকে মানসম্মত করিনি কারণ এটি প্রতিক্রিয়া সময় ডেটা এবং এটি রিগ্রেশন সহগের ব্যাখ্যার জন্য গুরুত্বপূর্ণ। যাইহোক, তথ্যগুলি কেন্দ্রিয়ায়িত করা হয়েছিল। আমি স্বতন্ত্র প্লটগুলি সন্ধান করব এবং দেখব ...
ব্যবহারকারীর 323268

2
@ ইউজার 33268 আমি পার্টিতে কিছুটা দেরি করেছি, তবে আপনি এখনও মানক সহগের ব্যাখ্যা করতে পারেন, আপনাকে কেবল স্কেলিংয়ের জন্য ব্যবহৃত মানগুলি সংরক্ষণ করতে হবে এবং তারপরে মডেলটি চালানোর পরে ব্যাকট্রান্সফর্ম করতে হবে।
ফ্রান্সস রোডেনবার্গ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.