কেন এলোমেলো slাল প্রভাবের প্রবর্তনটি opeালের এসই বৃদ্ধি করে?


9

আমি নির্দিষ্ট ব্যক্তির জন্য (আমার 3 টি গ্রুপ আছে) ভেরিয়েবল লগইন্ডে বছরের প্রভাব বিশ্লেষণ করার চেষ্টা করছি। সবচেয়ে সহজ মডেল:

> fix1 = lm(logInd ~ 0 + Group + Year:Group, data = mydata)
> summary(fix1)

Call:
lm(formula = logInd ~ 0 + Group + Year:Group, data = mydata)

Residuals:
    Min      1Q  Median      3Q     Max 
-5.5835 -0.3543 -0.0024  0.3944  4.7294 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
Group1       4.6395740  0.0466217  99.515  < 2e-16 ***
Group2       4.8094268  0.0534118  90.044  < 2e-16 ***
Group3       4.5607287  0.0561066  81.287  < 2e-16 ***
Group1:Year -0.0084165  0.0027144  -3.101  0.00195 ** 
Group2:Year  0.0032369  0.0031098   1.041  0.29802    
Group3:Year  0.0006081  0.0032666   0.186  0.85235    
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 0.7926 on 2981 degrees of freedom
Multiple R-squared: 0.9717,     Adjusted R-squared: 0.9716 
F-statistic: 1.705e+04 on 6 and 2981 DF,  p-value: < 2.2e-16 

আমরা দেখতে পাচ্ছি যে গ্রুপ 1 উল্লেখযোগ্যভাবে হ্রাস পাচ্ছে, গ্রুপ 2 এবং 3 বৃদ্ধি পেয়েছে তবে তা তেমন উল্লেখযোগ্যভাবে নয়।

স্পষ্টত পৃথকটি এলোমেলো প্রভাব হওয়া উচিত, তাই আমি প্রতিটি ব্যক্তির জন্য এলোমেলো ইন্টারসেপ্ট প্রভাবটি প্রবর্তন করি:

> mix1a = lmer(logInd ~ 0 + Group + Year:Group + (1|Individual), data = mydata)
> summary(mix1a)
Linear mixed model fit by REML 
Formula: logInd ~ 0 + Group + Year:Group + (1 | Individual) 
   Data: mydata 
  AIC  BIC logLik deviance REMLdev
 4727 4775  -2356     4671    4711
Random effects:
 Groups     Name        Variance Std.Dev.
 Individual (Intercept) 0.39357  0.62735 
 Residual               0.24532  0.49530 
Number of obs: 2987, groups: Individual, 103

Fixed effects:
              Estimate Std. Error t value
Group1       4.6395740  0.1010868   45.90
Group2       4.8094268  0.1158095   41.53
Group3       4.5607287  0.1216522   37.49
Group1:Year -0.0084165  0.0016963   -4.96
Group2:Year  0.0032369  0.0019433    1.67
Group3:Year  0.0006081  0.0020414    0.30

Correlation of Fixed Effects:
            Group1 Group2 Group3 Grp1:Y Grp2:Y
Group2       0.000                            
Group3       0.000  0.000                     
Group1:Year -0.252  0.000  0.000              
Group2:Year  0.000 -0.252  0.000  0.000       
Group3:Year  0.000  0.000 -0.252  0.000  0.000

এটির একটি প্রত্যাশিত প্রভাব ছিল - opালের এসই (সহগুণ গ্রুপ 1-3: বছর) এখন কম এবং অবশিষ্ট এসইও কম।

ব্যক্তিরাও opeালুতে আলাদা তাই আমি এলোমেলো slাল প্রভাবটিও প্রবর্তন করেছি:

> mix1c = lmer(logInd ~ 0 + Group + Year:Group + (1 + Year|Individual), data = mydata)
> summary(mix1c)
Linear mixed model fit by REML 
Formula: logInd ~ 0 + Group + Year:Group + (1 + Year | Individual) 
   Data: mydata 
  AIC  BIC logLik deviance REMLdev
 2941 3001  -1461     2885    2921
Random effects:
 Groups     Name        Variance  Std.Dev. Corr   
 Individual (Intercept) 0.1054790 0.324775        
            Year        0.0017447 0.041769 -0.246 
 Residual               0.1223920 0.349846        
Number of obs: 2987, groups: Individual, 103

Fixed effects:
              Estimate Std. Error t value
Group1       4.6395740  0.0541746   85.64
Group2       4.8094268  0.0620648   77.49
Group3       4.5607287  0.0651960   69.95
Group1:Year -0.0084165  0.0065557   -1.28
Group2:Year  0.0032369  0.0075105    0.43
Group3:Year  0.0006081  0.0078894    0.08

Correlation of Fixed Effects:
            Group1 Group2 Group3 Grp1:Y Grp2:Y
Group2       0.000                            
Group3       0.000  0.000                     
Group1:Year -0.285  0.000  0.000              
Group2:Year  0.000 -0.285  0.000  0.000       
Group3:Year  0.000  0.000 -0.285  0.000  0.000

কিন্তু এখন, প্রত্যাশার বিপরীতে, !ালুগুলির এসই (সহগুণ গ্রুপ 1-3: বছর) এখন অনেক বেশি, এলোমেলো কোনও প্রভাব ছাড়াই আরও বেশি!

এটা কিভাবে সম্ভব? আমি প্রত্যাশা করব যে এলোমেলো প্রভাব প্রভাবহীন পরিবর্তনশীলতা "খাওয়া" করবে এবং অনুমানের "নিশ্চিততা" বাড়িয়ে দেবে!

তবে, অবশিষ্ট এসই প্রত্যাশা অনুযায়ী আচরণ করে - এটি এলোমেলো ইন্টারসেপ্ট মডেলের চেয়ে কম।

প্রয়োজনে ডেটা এখানে

সম্পাদন করা

আমি এখন অবাক করা ঘটনা বুঝতে পেরেছি। আমি যদি পৃথকভাবে প্রতিটি ব্যক্তির জন্য লিনিয়ার রিগ্রেশন করি এবং তারপরে ফলাফল slালুতে আনোভা চালাই, আমি এলোমেলো opeালু মডেলের ঠিক একই ফলাফল পেয়েছি! তুমি জানবে কেন?

indivSlope = c()
for (indiv in 1:103) {
    mod1 = lm(logInd ~ Year, data = mydata[mydata$Individual == indiv,])
    indivSlope[indiv] = coef(mod1)['Year']
}

indivGroup = unique(mydata[,c("Individual", "Group")])[,"Group"]


anova1 = lm(indivSlope ~ 0 + indivGroup)
summary(anova1)

Call:
lm(formula = indivSlope ~ 0 + indivGroup)

Residuals:
      Min        1Q    Median        3Q       Max 
-0.176288 -0.016502  0.004692  0.020316  0.153086 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)
indivGroup1 -0.0084165  0.0065555  -1.284    0.202
indivGroup2  0.0032369  0.0075103   0.431    0.667
indivGroup3  0.0006081  0.0078892   0.077    0.939

Residual standard error: 0.04248 on 100 degrees of freedom
Multiple R-squared: 0.01807,    Adjusted R-squared: -0.01139 
F-statistic: 0.6133 on 3 and 100 DF,  p-value: 0.6079 

প্রয়োজনে ডেটা এখানে


আপনার যদি এক বছর হতে চলেছে তবে আপনার এক বছরের নির্দিষ্ট প্রভাব প্রয়োজন: গ্রুপ ইন্টারঅ্যাকশন স্থির প্রভাব। সাধারণভাবে, আপনি প্রধান প্রভাবগুলি ছাড়াও একটি মিথস্ক্রিয়া শব্দটি অন্তর্ভুক্ত করতে পারবেন না। আপনি কি সত্যিই ভাবেন যে বছরের প্রভাবের কোনও নির্দিষ্ট উপাদান নেই? এবং, যদি তা হয় তবে সেখানে একটি নির্ধারিত বছর কীভাবে হতে পারে: গ্রুপ ইন্টারঅ্যাকশন?
জন

এবং, কেন কোনও স্থির বাধা নেই? আপনি স্থির এবং এলোমেলো উভয় থাকতে পারে।
জন

@ জন, এই মডেলটি সম্পূর্ণ বৈধ। এটি কেবল শ্রেণিবদ্ধ ভেরিয়েবলের কাঙ্ক্ষিত কোডিংয়ের একটি সমস্যা। এই পথেGroupআমি গ্রুপ এর ইন্টারসেপ্ট হয় আমি, এবং Groupআমি:Year গ্রুপের মধ্যে slাল আমি। যদি বছরের প্রধান প্রভাব এবং ইন্টারসেপ্ট অন্তর্ভুক্ত করা হয়, তবে অনুমানগুলি গ্রুপের ইন্টারসেপ্টের পার্থক্য হবেআমিএবং গ্রুপ 1 এবং একইভাবে slালু সহ with
আনিকো

@ জন, এটি আমার প্রশ্নের মূল বিষয়, তবুও: বিশ্বাস করুন, এটি ঠিক আছে, আমি এটি নিয়ে অনেক পরীক্ষা-নিরীক্ষা করেছি। আমার প্রথম এলএম মডেল সম্পূর্ণরূপে সমতুল্য logInd ~ Year*Group, কেবল সহগগুলি বিভিন্ন আকারে রয়েছে, আরও কিছু নয়। আপনার স্বাদ এবং আপনি সহগের কী আকার পছন্দ করেন, তার উপর নির্ভর করে more আপনি লেখার সাথে সাথে আমার 1 ম মডেলটিতে "ইয়ার মুখ্য প্রভাব" এর কোনও বর্জন logInd ~ Year*Groupনেই ... হুবহু একই রকম হয়, Yearগুণফল তখন মূল প্রভাব নয়, তবে গ্রুপ 1: বছর।
কৌতুহল

ঠিক আছে, ঝরঝরে, 0 টি ইন্টারসেপ্ট এবং গ্রুপ উভয়কে শ্রেণিবদ্ধ হিসাবে বিবেচনা করে নি।
জন 20

উত্তর:


11

আমি মনে করি আপনার প্রত্যাশা :) মনে রাখবেন যে যখন আপনি প্রতিটি ব্যক্তির জন্য একটি র্যান্ডম পথিমধ্যে যোগ আদর্শ ত্রুটি সঙ্গে সমস্যা বিবৃতি বেড়েছে। যেহেতু প্রতিটি ব্যক্তির নিজস্ব ইন্টারসেপ্ট থাকতে পারে, তাই গ্রুপের গড় কম নিশ্চিত। এলোমেলো slালের সাথে একই জিনিসটি ঘটেছিল: আপনি আর একটি সাধারণ (গ্রুপের মধ্যে) opeাল অনুমান করছেন না, তবে গড়ের গড়ের বিভিন্ন .ালু।

সম্পাদনা: আরও ভাল মডেল কেন আরও সুনির্দিষ্ট প্রাক্কলন দেয় না?

আসুন এটি সম্পর্কে অন্যভাবে ভাবুন: প্রাথমিক মডেলটি কেন স্ট্যান্ডার্ড ত্রুটিটিকে অবমূল্যায়ন করে? এটি স্বতন্ত্র নয় এমন পর্যবেক্ষণগুলির স্বাধীনতা গ্রহণ করে। দ্বিতীয় মডেল সেই অনুমানকে শিথিল করে (এমনভাবে যেভাবে বাধাগুলি প্রভাবিত করে), এবং তৃতীয়টি এটিকে আরও শিথিল করে।

সম্পাদনা 2: অনেক রোগী-নির্দিষ্ট মডেলের সাথে সম্পর্ক

আপনার পর্যবেক্ষণটি একটি পরিচিত সম্পত্তি (এবং যদি আপনার মাত্র দু'বছর থাকে, তবে এলোমেলো প্রভাবগুলির মডেলটি জোড়া লাগানো টি-টেস্টের সমতুল্য হবে)। আমি মনে করি না যে আমি প্রকৃত প্রমাণ পরিচালনা করতে পারি, তবে সম্ভবত দুটি মডেলের লেখাই সম্পর্ককে আরও পরিষ্কার করে দেবে। আসুন গ্রুপিং ভেরিয়েবলটিকে উপেক্ষা করুন, কারণ এটি কেবল স্বীকৃতিটিকে জটিল করে তুলবে। আমি এলোমেলো প্রভাবের জন্য গ্রীক অক্ষর এবং স্থির প্রভাবগুলির জন্য লাতিন অক্ষর ব্যবহার করব।

র্যান্ডম এফেক্টস মডেলটি হ'ল (আমি - বিষয়, - বিষয়ের মধ্যে অনুলিপি করুন:

ওয়াইআমি=একটি+ +αআমি+ +(+ +βআমি)এক্সআমি+ +εআমি,
কোথায় (αআমি,βআমি)'~এন(0,Σ) এবং εআমি~এন(0,σ2)

আপনি যখন প্রতিটি বিষয়ের জন্য পৃথক মডেল ফিট করেন, তখন

ওয়াইআমি=একটিআমি+ +আমিএক্সআমি+ +εআমি,
কোথায় εআমি~এন(0,σআমি2)

[দ্রষ্টব্য: নীচেরগুলি হ'ল কেবল হাতবদল:]

এই দুটি মডেলের সাথে আপনি অনেক মিল দেখতে পাচ্ছেন একটিআমি সংশ্লিষ্ট একটি+ +αআমি এবং আমি প্রতি + +βআমি। গড়আমিএর সাথে সম্পর্কিত , কারণ এলোমেলো প্রভাবগুলি গড় 0 পর্যন্ত the আমি নিশ্চিত কিভাবে একা নাσ অনুমানটি বিষয়-নির্দিষ্টের সাথে মিশে যায় σআমিতবে আমি ধরে নিই αআমি পার্থক্য তুলে ধরে


ধন্যবাদ অনিকো। আপনি ঠিক বলেছেন, আমার গণনাগুলি এটি নিশ্চিত করে, তবে আমি কেন তা দেখতে চাই ... এটি বিপরীত-স্বজ্ঞাত বলে মনে হচ্ছে। আমি মডেলগুলি উন্নত করেছি - এলোমেলো প্রভাব প্রবর্তনের মাধ্যমে আমি ত্রুটির কাঠামো আরও ভাল করে বর্ণনা করেছি। অবশিষ্ট ত্রুটি এটি নিশ্চিত করে - কম এবং নিম্নতর। সুতরাং এই আরও ভাল, আরও সুনির্দিষ্ট মডেলগুলির সাথে আমি আরও সুনির্দিষ্ট opeাল আশা করব ... আমি জানি আমি কোথাও ভুল করছি, দয়া করে এটি দেখতে আমাকে সহায়তা করুন।
কৌতূহলী

ধন্যবাদ আনিকো, এটি একটি আকর্ষণীয় দৃষ্টিকোণ! আমি কেবল slালুতে আগ্রহী (গ্রুপ *: বছর), এখানে বাধা নেই .. সুতরাং এলোমেলো ইসেপ্ট ইফেক্টটি উপস্থাপনের আমার প্রথম পদক্ষেপটি সেই স্বাধীনতা অনুমানকে শিথিল করে এবং নিচে এসইয়ের দিকে নিয়ে যায় (opeালের ..) এবং তারপরে পরবর্তী পদক্ষেপ সম্ভবত খুব বেশি (??) ছিল এবং বিপরীতটি করেছে (আরও খারাপ এসই ..) .. সম্ভবত আমাকে এটি সম্পর্কে চিন্তা করা দরকার, ধন্যবাদ।
কৌতূহলী

এখন আমি খুব আকর্ষণীয় সত্য দেখেও অবাক হয়েছি - দয়া করে আমার সম্পাদনা দেখুন। আপনি কি জানেন যে কেন হয়?
কৌতূহলী

আমি মনে করি না স্বাধীনতার ধারণাটি খুব বেশি শিথিল হয়েছিল! এটি দিয়ে শুরু করা ভুল ছিল।
আনিকো

3
টমাস, একটি "সুনির্দিষ্ট" মডেলটির অর্থ এই নয় যে অনুমানগুলি আরও সুনির্দিষ্ট হবে। চরম উদাহরণ হিসাবে, আপনার পছন্দ মতো কোনও ডেটা-মুক্ত মডেল নিন, যেমন এমন একটি যা ভবিষ্যতবাণী করে যে সমস্ত প্রতিক্রিয়া শূন্য। এই মডেলটি শূন্যের অনুমানের মধ্যে একেবারে নিশ্চিত । এটি সম্ভবত যতটা পেতে পারে ঠিক ততটুকু - তবে এটি সম্ভবত যতটা সম্ভব ভুলও। পরামিতিগুলি ফিট করার জন্য একটি মডেলকে আরও বৃহত্তর স্কোপ প্রদান করা সাধারণত এর অর্থ হ'ল সেই পরামিতিগুলি কম নির্ভুলতার সাথে ফিট হয় , বেশি নয়। একটি ভাল মডেল, কারণ এটি কোনও খারাপ মডেল দ্বারা ক্যাপচার না হওয়া অনিশ্চয়তার পরিমাণ নির্ধারণ করতে পারে, প্রায়শই বড় স্ট্যান্ডার্ড ত্রুটি থাকে।
হুঁশিয়ারি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.