কেন এলএম এবং আওভ আর-এ পুনরায় বারবার ব্যবস্থা আনোভা জন্য আলাদা ফলাফল দেয়?


24

আমি বারবার ব্যবস্থা আনোভা (যেমন আমি আশা করি যে আমি এর সাথে কাস্টম বিপরীতে ব্যবহার করতে সক্ষম হব ) এর জন্য ezপ্যাকেজটি ব্যবহার করা থেকে সরানোর চেষ্টা করছি ।lmelme

এই ব্লগ পোস্টের পরামর্শ অনুসরণ করে আমি উভয় aov(যেমন ezঅনুরোধ করা হয় তখন) এবং ব্যবহার করে একই মডেল সেট আপ করতে সক্ষম হয়েছি lme। যাইহোক, দেওয়া উদাহরণে যেহেতু যে পোস্টে এফ -values পুরোপুরি মধ্যে একমত aovএবং lme(আমি এটা চেক করা, এবং তারা না), এই আমার ডেটার জন্য ঘটনা না। যদিও এফ- ভ্যালুগুলি সমান, তবে তারা এক নয়।

aov1.3399 এর একটি এফ-মান প্রদান করে, lme1.36264 প্রদান করে। আমি ফলাফলটিকে aov"সঠিক" হিসাবে গ্রহণ করতে ইচ্ছুক কারণ এসপিএসএসই এটিই দেয় (এবং এটিই আমার ক্ষেত্র / তত্ত্বাবধায়ক হিসাবে গণ্য হয়)।

প্রশ্নাবলী:

  1. যদি কেউ ব্যাখ্যা করতে পারে যে কেন এই পার্থক্যটি বিদ্যমান এবং আমি কীভাবে lmeবিশ্বাসযোগ্য ফলাফল সরবরাহ করতে পারি। (আমি যদি এই ধরণের "সঠিক" ফলাফল দেয় তবে এই ধরণের lmerস্টাফের পরিবর্তে আমিও ব্যবহার করতে রাজি হব lme, তবে, আমি এখনও এটি ব্যবহার করি নি))

  2. এই সমস্যাটি সমাধানের পরে আমি একটি বিপরীতে বিশ্লেষণ চালাতে চাই। বিশেষত আমি প্রথম দুটি স্তরের গুণকের (যেমন, c("MP", "MT")) পুলিংয়ের বিপরীতে আগ্রহী এবং এটিকে তৃতীয় স্তরের ফ্যাক্টরের সাথে (যেমন, "AC") তুলনা করতে চাই । তদ্ব্যতীত, তৃতীয় বনাম চতুর্থ স্তরের (যেমন, "AC"বনাম "DA") এর পরীক্ষা করা vers

ডেটা:

tau.base <- structure(list(id = structure(c(1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 
9L, 10L, 11L, 12L, 13L, 14L, 15L, 16L, 17L, 18L, 19L, 20L, 21L, 
22L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 
14L, 15L, 16L, 17L, 18L, 19L, 20L, 21L, 22L, 1L, 2L, 3L, 4L, 
5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 16L, 17L, 18L, 
19L, 20L, 21L, 22L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 
11L, 12L, 13L, 14L, 15L, 16L, 17L, 18L, 19L, 20L, 21L, 22L), .Label = c("A18K", 
"D21C", "F25E", "G25D", "H05M", "H07A", "H08H", "H25C", "H28E", 
"H30D", "J10G", "J22J", "K20U", "M09M", "P20E", "P26G", "P28G", 
"R03C", "U21S", "W08A", "W15V", "W18R"), class = "factor"), factor = structure(c(1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 
3L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 
4L, 4L, 4L, 4L, 4L, 4L, 4L), .Label = c("MP", "MT", "AC", "DA"
), class = "factor"), value = c(0.9648092876, 0.2128662077, 1, 
0.0607615485, 0.9912814024, 3.22e-08, 0.8073856412, 0.1465590332, 
0.9981672618, 1, 1, 1, 0.9794401938, 0.6102546108, 0.428651501, 
1, 0.1710644881, 1, 0.7639763913, 1, 0.5298989196, 1, 1, 0.7162733447, 
0.7871177434, 1, 1, 1, 0.8560509327, 0.3096989662, 1, 8.51e-08, 
0.3278862311, 0.0953598576, 1, 1.38e-08, 1.07e-08, 0.545290432, 
0.1305621416, 2.61e-08, 1, 0.9834051136, 0.8044114935, 0.7938839461, 
0.9910112678, 2.58e-08, 0.5762677121, 0.4750002288, 1e-08, 0.8584252623, 
1, 1, 0.6020385797, 8.51e-08, 0.7964935271, 0.2238374288, 0.263377904, 
1, 1.07e-08, 0.3160751898, 5.8e-08, 0.3460325565, 0.6842217296, 
1.01e-08, 0.9438301877, 0.5578367224, 2.18e-08, 1, 0.9161424562, 
0.2924856039, 1e-08, 0.8672987992, 0.9266688748, 0.8356425464, 
0.9988463913, 0.2960361777, 0.0285680426, 0.0969063841, 0.6947998266, 
0.0138254805, 1, 0.3494775301, 1, 2.61e-08, 1.52e-08, 0.5393467752, 
1, 0.9069223275)), .Names = c("id", "factor", "value"), class = "data.frame", row.names = c(1L, 
6L, 10L, 13L, 16L, 17L, 18L, 22L, 23L, 24L, 27L, 29L, 31L, 33L, 
42L, 43L, 44L, 45L, 54L, 56L, 58L, 61L, 64L, 69L, 73L, 76L, 79L, 
80L, 81L, 85L, 86L, 87L, 90L, 92L, 94L, 96L, 105L, 106L, 107L, 
108L, 117L, 119L, 121L, 124L, 127L, 132L, 136L, 139L, 142L, 143L, 
144L, 148L, 149L, 150L, 153L, 155L, 157L, 159L, 168L, 169L, 170L, 
171L, 180L, 182L, 184L, 187L, 190L, 195L, 199L, 202L, 205L, 206L, 
207L, 211L, 212L, 213L, 216L, 218L, 220L, 222L, 231L, 232L, 233L, 
234L, 243L, 245L, 247L, 250L))

এবং কোড:

require(nlme)

summary(aov(value ~ factor+Error(id/factor), data = tau.base))

anova(lme(value ~ factor, data = tau.base, random = ~1|id))

দেখে মনে হচ্ছে আপনি এখানে নিজের উত্তরের বিপরীতে নিজের সম্পর্কে অংশটির উত্তর দিয়েছেন ; যদি না হয় তবে দয়া করে এই প্রশ্নটি সম্পাদনা করুন যাতে আমরা জানি কী অসুবিধা রয়ে গেছে।
অ্যারন - মনিকা

2
অ্যারন, যতক্ষণ না lmeপ্রমিত পাঠ্যপুস্তিকা আনোভা (প্রদত্ত aov, এবং যা আমার প্রয়োজন) থেকে ফলাফলগুলির মধ্যে পৃথকতা রয়েছে, এটি আমার পক্ষে বিকল্প নয়। আমার কাগজে আমি আনোভা-র প্রতিবেদন করতে চাই, আনোভার মতো কিছু নয়। মজার বিষয় ভেনেবলস এবং রিপলি (2002, পৃষ্ঠা 285) দেখায় যে উভয় পদ্ধতিরই অভিন্ন অনুমানের দিকে নিয়ে যায়। তবে এফ মানগুলির মধ্যে পার্থক্যগুলি আমাকে খারাপ অনুভূতির সাথে ছেড়ে দেয়। তদ্ব্যতীত, Anova()(থেকে car) lmeঅবজেক্টগুলির জন্য কেবল চি-মান দেয় । সুতরাং আমার জন্য, আমার প্রথম প্রশ্নের উত্তর এখনও দেওয়া হয়নি।
হেনরিক

আমি আপনার সতর্কতা বুঝতে পেরেছি (তবে ভাগ না করি) lme; কিন্তু বৈপরীত্য জন্য, glhtকাজ করে lmখুব শুধু ফিট করে, lmeআছে। (এছাড়াও, lmeফলাফলগুলি স্ট্যান্ডার্ড পাঠ্যপুস্তকের ফলাফলও))
অ্যারন - মনিকা পুনরায় ইনস্টল করুন

দুর্ভাগ্যক্রমে আপনি lmবারবার পরিমাপ বিশ্লেষণের জন্য নির্দিষ্ট করতে পারবেন না । কেবল aovপুনরাবৃত্তিমূলক ব্যবস্থাগুলি মোকাবেলা করতে পারে তবে aovlistদুর্ভাগ্যক্রমে পরিচালিত নয় এমন শ্রেণীর কোনও বস্তু ফিরিয়ে দেবে glht
হেনরিক

3
lmসমস্ত প্রভাবের জন্য ত্রুটি শব্দ হিসাবে অবশিষ্ট ত্রুটি ব্যবহার করে; যখন কোনও প্রভাব রয়েছে যা পৃথক ত্রুটি শব্দ ব্যবহার করা উচিত, তখন aovপ্রয়োজনীয় হয় (বা পরিবর্তে, lmম্যানুয়ালি এফ-পরিসংখ্যানগুলি গণনা করতে ফলাফলগুলি ব্যবহার করে )। আপনার উদাহরণে, জন্য ত্রুটি মেয়াদ factorহয় id:factorমিথষ্ক্রিয়া, যা একটি যুত মডেল অবশিষ্ট ত্রুটি শব্দ। আপনার ফলাফলের সাথে তুলনা করুন anova(lm(value~factor+id))
অ্যারন - মনিকা পুনরায় ইনস্টল করুন

উত্তর:


28

এগুলি পৃথক কারণ lme মডেলটির ভেরিয়েন্স উপাদানটি idশূন্যের চেয়ে বেশি হতে বাধ্য করছে । সমস্ত পদগুলির জন্য কাঁচা আনোভা টেবিলটির দিকে তাকানো, আমরা দেখতে পাচ্ছি যে আইডির জন্য গড় স্কোয়ার ত্রুটিটি অবশিষ্টাংশের চেয়ে কম।

> anova(lm1 <- lm(value~ factor+id, data=tau.base))

          Df  Sum Sq Mean Sq F value Pr(>F)
factor     3  0.6484 0.21614  1.3399 0.2694
id        21  3.1609 0.15052  0.9331 0.5526
Residuals 63 10.1628 0.16131   

যখন আমরা ভেরিয়েন্স উপাদানগুলি গণনা করি, এর অর্থ হ'ল আইডির কারণে বৈচিত্রটি নেতিবাচক হবে। প্রত্যাশিত গড় স্কোয়ারের স্মৃতি আমার স্মৃতি নড়বড়ে, তবে গণনাটি এরকম something

(0.15052-0.16131)/3 = -0.003597.

এটি অদ্ভুত মনে হলেও ঘটতে পারে। এর অর্থ হ'ল প্রতিটি আইডির গড় গড় একে অপরের কাছাকাছি যেহেতু আপনি একে অপরের কাছে প্রত্যাশা করবেন মডেলের অবশিষ্টাংশের পরিমাণের পরিমাণ হিসাবে given

বিপরীতে, lme ব্যবহার করে এই রূপটি শূন্যের চেয়ে বেশি হতে বাধ্য করে।

> summary(lme1 <- lme(value ~ factor, data = tau.base, random = ~1|id))
...
Random effects:
 Formula: ~1 | id
        (Intercept)  Residual
StdDev: 3.09076e-05 0.3982667

এটি স্ট্যান্ডার্ড বিচ্যুতিগুলির প্রতিবেদন করে, 9.553e-10আইডি বৈকল্পিকের 0.1586164জন্য এবং অবশিষ্টাংশের জন্য বৈকল্পিক ফলন পেতে স্কোয়ারিং ।

এখন, আপনার জানা উচিত যে aovপুনরাবৃত্তি ব্যবস্থার জন্য ব্যবহার করা কেবলমাত্র তখনই উপযুক্ত যদি আপনি বিশ্বাস করেন যে পুনরাবৃত্তি ব্যবস্থার সমস্ত জোড়ার মধ্যে পারস্পরিক সম্পর্ক একই রকম; এটিকে যৌগিক প্রতিসাম্য বলা হয়। (প্রযুক্তিগতভাবে, গোলাকৃতির প্রয়োজনীয়তা তবে এটি আপাতত যথেষ্ট)) lmeওভার ব্যবহারের একটি কারণ aovহ'ল এটি বিভিন্ন ধরণের পারস্পরিক সম্পর্ক কাঠামো পরিচালনা করতে পারে।

এই নির্দিষ্ট ডেটা সেটে এই পারস্পরিক সম্পর্কের জন্য অনুমানটি নেতিবাচক; এটি আইডির জন্য গড় স্কোয়ার ত্রুটিটি কীভাবে অবশিষ্ট স্কোয়ার ত্রুটির চেয়ে কম ছিল তা ব্যাখ্যা করতে সহায়তা করে। নেতিবাচক পারস্পরিক সম্পর্কের অর্থ হ'ল যদি কোনও ব্যক্তির প্রথম পরিমাপ গড়ের চেয়ে কম হয়, গড়ে তাদের দ্বিতীয়টি গড়ের উপরে হয়, তবে ব্যক্তিগুলির জন্য মোট গড় কম পরিবর্তিত হয়, যদি আমরা শূন্য সম্পর্ক বা ইতিবাচক পারস্পরিক সম্পর্ক থাকতাম তবে আমাদের প্রত্যাশা করা হত।

lmeএকটি এলোমেলো প্রভাব সহ ব্যবহার করা একটি যৌগিক প্রতিসাম্য মডেল ফিট করার সমতুল্য যেখানে সেই পারস্পরিক সম্পর্ক অ-নেতিবাচক হতে বাধ্য করা হয়; আমরা এমন একটি মডেল ফিট করতে পারি যেখানে ব্যবহার করে পারস্পরিক সম্পর্ককে নেতিবাচক হতে দেওয়া হয় gls:

> anova(gls1 <- gls(value ~ factor, correlation=corCompSymm(form=~1|id),
                    data=tau.base))
Denom. DF: 84 
            numDF   F-value p-value
(Intercept)     1 199.55223  <.0001
factor          3   1.33985   0.267

এই আনোভা টেবিলটি aovফিট এবং ফিট থেকে টেবিলের সাথে একমত lm

ঠিক আছে, তাই কি? ঠিক আছে, যদি আপনি বিশ্বাস করেন যে idপর্যবেক্ষণগুলির মধ্যে বৈকল্পিকতা এবং পারস্পরিক সম্পর্কটি অ-নেতিবাচক হওয়া উচিত lmeতবে ফিটটি ব্যবহারের চেয়ে ফিটের চেয়ে বেশি উপযুক্ত aovবা lmএর অবশিষ্টাংশের অনুমান কিছুটা ভাল better যাইহোক, যদি আপনি বিশ্বাস করেন পর্যবেক্ষণ মধ্যে পারস্পরিক নেতিবাচক হতে পারে, aovবা lmবা glsউত্তম।

আপনি পারস্পরিক সম্পর্ক কাঠামো আরও অন্বেষণে আগ্রহী হতে পারেন; সাধারণ সম্পর্ক সম্পর্কিত কাঠামোটি দেখার জন্য আপনি এমন কিছু করতে চাইবেন

gls2 <- gls(value ~ factor, correlation=corSymm(form=~unclass(factor)|id),
data=tau.base)

এখানে আমি কেবল আউটপুটকে পারস্পরিক সম্পর্ক কাঠামোর মধ্যে সীমাবদ্ধ করি। 1 থেকে 4 এর মানগুলি চার স্তরের প্রতিনিধিত্ব করে factor; আমরা দেখতে পাই যে ফ্যাক্টর 1 এবং ফ্যাক্টর 4 এর মধ্যে যথেষ্ট শক্তিশালী নেতিবাচক সম্পর্ক রয়েছে:

> summary(gls2)
...
Correlation Structure: General
 Formula: ~unclass(factor) | id 
 Parameter estimate(s):
 Correlation: 
  1      2      3     
2  0.049              
3 -0.127  0.208       
4 -0.400  0.146 -0.024

এই মডেলগুলির মধ্যে বেছে নেওয়ার একটি উপায় সম্ভাবনা অনুপাত পরীক্ষার সাথে; এটি দেখায় যে এলোমেলো প্রভাবের মডেল এবং সাধারণ সম্পর্ক সম্পর্কিত কাঠামোর মডেল পরিসংখ্যানগতভাবে উল্লেখযোগ্যভাবে আলাদা নয়; যখন এটি ঘটে তখন সহজ মডেলটি সাধারণত পছন্দ হয়।

> anova(lme1, gls2)
     Model df      AIC      BIC    logLik   Test  L.Ratio p-value
lme1     1  6 108.0794 122.6643 -48.03972                        
gls2     2 11 111.9787 138.7177 -44.98936 1 vs 2 6.100725  0.2965

2
(এবং এর ফলে সমস্ত আনোভা-র জন্য সক্রিয় করা) lmeএকই ফলাফলগুলি পেতে যৌগিক প্রতিসাম্য ব্যবহার করা সম্ভব , নামটিতে কলটিতে পারস্পরিক যুক্তি ব্যবহার করে :aovlmelmeanova(lme(value ~ factor, data = tau.base, random = ~1|id, correlation = corCompSymm(form = ~1|id)))
হেনরিক

1
ভাল লাগছে। কিন্তু সেই ফিটটিতে কোনও অতিরিক্ত পরামিতি নেই? এটিতে তিনটি বৈকল্পিক পরামিতি রয়েছে; আইডি, রেসিডুয়াল ভেরিয়েন্স এবং পারস্পরিক সম্পর্কের জন্য বৈকল্পিক, যখন জিএলএসের কেবল একটি অবশিষ্ট অবকাশ এবং পারস্পরিক সম্পর্ক রয়েছে।
অ্যারন - মনিকা পুনরায় ইনস্টল করুন

1
আপনার যুক্তিটি প্রশংসনীয় মনে হচ্ছে, তবে ফলাফলগুলি সম্মত নয়। সমস্ত আনোভা টেবিলগুলি ( aov, lmeযৌগিক প্রতিসাম্য ছাড়াই, এবং lmeযৌগিক প্রতিসাম্য সহ) ঠিক একই সংখ্যক ডিএফএস রয়েছে।
হেনরিক

1
আপনাকে আমাকে বোঝাতে হবে যে এই তিনটি প্যারামিটারগুলি সত্যই প্রথম দুটিটির একটি ওভারপ্যারমেট্রাইজেশন। তারা কীভাবে সম্পর্কিত তা নিয়ে আপনি কাজ করেছেন?
অ্যারন - মনিকা পুনরায় ইনস্টল করুন 1'11

1
না। আমি আউটপুট বিশ্বাস করছি anova.lme()। আপনার উত্তর থেকে আমি পেয়েছি যে আনোভা এবং মিশ্র মডেলের মধ্যে সম্পর্ক তাদের পারস্পরিক সম্পর্ক কাঠামোর মধ্যে। আমি তখন পড়লাম যে একটি কমপন্ড সিমমেট্রিক পারস্পরিক সম্পর্ক কাঠামো চাপিয়ে দেওয়া উভয় পদ্ধতির মধ্যে সাম্যের দিকে পরিচালিত করে। অতএব আমি এটি আরোপ করেছি। এটি অন্য ডিএফ খায় কিনা আমার কোনও ধারণা নেই। আউটপুট তবে এই ব্যাখ্যার সাথে একমত নয়।
হেনরিক

2

aov()lm()সর্বনিম্ন স্কোয়ার ব্যবহারের মাধ্যমে মডেলটিকে ফিট করে , lmeসর্বাধিক সম্ভাবনার মাধ্যমে ফিট করে। লিনিয়ার মডেলের প্যারামিটারগুলি কীভাবে অনুমান করা হয় তার মধ্যে এই পার্থক্যটি আপনার চ-মানগুলির মধ্যে (খুব ছোট) পার্থক্যের জন্য অ্যাকাউন্ট accounts

অনুশীলনে, (উদাহরণস্বরূপ অনুমানের পরীক্ষার জন্য) এই অনুমানগুলি একই, সুতরাং আমি দেখতে পাচ্ছি না যে কীভাবে একজনকে অন্যের চেয়ে 'বিশ্বাসযোগ্য' হিসাবে বিবেচনা করা যেতে পারে। তারা বিভিন্ন মডেল ফিটিং দৃষ্টান্ত থেকে আসে।

বৈসাদৃশ্যগুলির জন্য, আপনাকে আপনার কারণগুলির জন্য একটি বিপরীতে ম্যাট্রিক্স স্থাপন করতে হবে। ভেনিবলস এবং রিপলি কীভাবে চতুর্থ সংস্করণের পৃষ্ঠা 143, p.146 এবং p.293-294 এ এটি করবেন তা দেখায়।


হুম, তবে তবে কেন কখনও কখনও তফাত হয় এবং কখনও কখনও ফলাফলগুলিও ঠিক সমান হয়? ফার্থহেমর, তারপরে এটি ব্যবহার করা lmeবা আনোভা lmerগণনার পক্ষে (কঠোরভাবে বলা) অসম্ভব বলে মনে হচ্ছে কারণ এটি এমন একটি পদ্ধতি ব্যবহার করে যা অনুরূপ তবে অভিন্ন নয়। তাহলে আর-তে বারবার পরিমাপের ANOVA এর জন্য বিপরীতে গণনা করার কোনও উপায় নেই?
হেনরিক

যদি সিস্টেমটি আপনার মডেলিংয়ের ক্ষেত্রে ন্যূনতম স্কোয়ারের তুলনায় সত্যই রৈখিক হয় এবং এমএলকে একই চ পরিসংখ্যান দেওয়া উচিত। এটি কেবল তখনই যখন ডেটাতে অন্য কাঠামো থাকে যে দুটি পদ্ধতি ভিন্ন ফলাফল দেয়। পিনহিরো এবং বেটস তাদের মিশ্র-প্রভাবগুলির মডেল বইতে এটি কভার করে। এছাড়াও সম্ভবত তারা 'ঠিক' সমান নয়, আপনি যদি সিগ অঙ্কগুলিতে যথেষ্ট পরিমাণে যেতে চান তবে আমি নিশ্চিত যে আপনি কিছু পার্থক্য খুঁজে পেয়েছেন find তবে সমস্ত ব্যবহারিক উদ্দেশ্যে তারা একই।
ক্রিস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.