স্প্লিট-প্লট আনোভা: আর-তে মডেল তুলনা পরীক্ষা


12

আর এর যুক্তি Xএবং Mযুক্তিগুলির সাথে উপযুক্ত মডেল তুলনা ব্যবহার করে আমি কীভাবে একটি স্প্লিট-প্লট আনোভাতে প্রভাবগুলি পরীক্ষা করতে পারি anova.mlm()? আমি ?anova.mlmএবং ডালগার্ড (2007) এর সাথে পরিচিত [1]। দুর্ভাগ্যক্রমে এটি কেবল স্প্লিট-প্লট ডিজাইনের ব্রাশ করে। বিষয়গুলির মধ্যে দুটি বিষয়গুলির সাথে সম্পূর্ণ এলোমেলো নকশায় এটি করা:

N  <- 20  # 20 subjects total
P  <- 3   # levels within-factor 1
Q  <- 3   # levels within-factor 2
DV <- matrix(rnorm(N* P*Q), ncol=P*Q)           # random data in wide format
id <- expand.grid(IVw1=gl(P, 1), IVw2=gl(Q, 1)) # intra-subjects layout of data matrix

library(car)        # for Anova()
fitA <- lm(DV ~ 1)  # between-subjects design: here no between factor
resA <- Anova(fitA, idata=id, idesign=~IVw1*IVw2)
summary(resA, multivariate=FALSE, univariate=TRUE)  # all tests ...

নিম্নলিখিত মডেলের তুলনাগুলি একই ফলাফলের দিকে পরিচালিত করে। সীমাবদ্ধ মডেলটিতে প্রভাবটি অন্তর্ভুক্ত নয় তবে একই আদেশ বা নিম্নের সমস্ত অন্যান্য প্রভাব অন্তর্ভুক্ত করে, সম্পূর্ণ মডেল প্রশ্নটিতে প্রভাব যুক্ত করে।

anova(fitA, idata=id, M=~IVw1 + IVw2, X=~IVw2, test="Spherical") # IVw1
anova(fitA, idata=id, M=~IVw1 + IVw2, X=~IVw1, test="Spherical") # IVw2
anova(fitA, idata=id, M=~IVw1 + IVw2 + IVw1:IVw2,
                      X=~IVw1 + IVw2, test="Spherical")          # IVw1:IVw2

এর মধ্যে একটি এবং সাবজেক্ট ফ্যাক্টরের মধ্যে একটি সহ একটি স্প্লিট-স্প্লট নকশা:

idB  <- subset(id, IVw2==1, select="IVw1")          # use only first within factor
IVb  <- gl(2, 10, labels=c("A", "B"))               # between-subjects factor
fitB <- lm(DV[ , 1:P] ~ IVb)                        # between-subjects design
resB <- Anova(fitB, idata=idB, idesign=~IVw1)
summary(resB, multivariate=FALSE, univariate=TRUE)  # all tests ...

এই anova()পরীক্ষাগুলির প্রতিলিপি তৈরির আদেশগুলি, তবে তারা কেন কাজ করে তা আমি জানি না। নিম্নলিখিত মডেলের তুলনাগুলির পরীক্ষাগুলি কেন একই ফলাফলের দিকে পরিচালিত করে?

anova(fitB, idata=idB, X=~1, test="Spherical") # IVw1, IVw1:IVb
anova(fitB, idata=idB, M=~1, test="Spherical") # IVb

দুটি বিষয়গুলির মধ্যে এবং একটি বিষয়গুলির মধ্যে:

fitC <- lm(DV ~ IVb)  # between-subjects design
resC <- Anova(fitC, idata=id, idesign=~IVw1*IVw2)
summary(resC, multivariate=FALSE, univariate=TRUE)  # all tests ...

উপরোক্ত ফলাফলগুলি কীভাবে সম্পর্কিত মডেলের তুলনা Xএবং Mযুক্তির সাথে যুক্ত করার জন্য তুলনা করব anova.mlm()? এই মডেল তুলনা পিছনে যুক্তি কি?

সম্পাদনা: সানকুলসু উল্লেখ করেছেন যে সমস্ত ব্যবহারিক উদ্দেশ্যে, এই নকশাগুলির ডেটা মিক্সড মডেলগুলি ব্যবহার করে বিশ্লেষণ করা উচিত। যাইহোক, আমি এখনো বুঝতে ফলাফল প্রতিলিপি নির্মাণ কিভাবে চাই summary(Anova())সঙ্গে anova.mlm(..., X=?, M=?)

[1]: ডালগার্ড, পি। 2007. মাল্টিভারিয়েট বিশ্লেষণের জন্য নতুন কার্যাদি। আর নিউজ, 7 (2), 2-7।


আরে @ কারাকাল, আমি মনে করি আপনি যেভাবে "স্প্লিট-প্লট ডিজাইন" ব্যবহার করছেন সেটি কেসেলার মতো নয়, জর্জ তার স্ট্যাটিস্টিকাল ডিজাইনে এটি সংজ্ঞায়িত করেছেন। স্প্লিট প্লট অবশ্যই বাসা বাঁধার কথা বলে তবে এটি পারস্পরিক সম্পর্ককে আরোপ করার একটি বিশেষ উপায়। এবং বেশিরভাগ সময় আপনি lme4প্যাকেজটি ব্যবহার করে মডেলটি ফিট করবেন এবং না lm। তবে এটি একটি খুব নির্দিষ্ট বই-ভিত্তিক ভিউ হতে পারে। আমি এটি সম্পর্কে অন্যের মন্তব্য করতে হবে। আমি কীভাবে এটি ব্যাখ্যা করব তার ভিত্তিতে একটি উদাহরণ দিতে পারি যা আপনার থেকে পৃথক।
সানকুলসু

2
@ সানকুলসু সামাজিক বিজ্ঞানের পরিভাষা আলাদা হতে পারে তবে কर्क (1995, p512) এবং ম্যাক্সওয়েল অ্যান্ড ডেলানি (2004, পি 592) উভয়ই মডেলগুলিতে কল-মডেল এবং একটির মধ্যে "স্প্লিট-প্লট" এর মধ্যে কল করে। এর মধ্যে ফ্যাক্টর "প্লট" সরবরাহ করে (কৃষি উত্সের সাথে সাদৃশ্যপূর্ণ)।
কারাকাল

এই মুহুর্তে আমার প্লেটে প্রচুর জিনিস রয়েছে। আমি আপনার প্রশ্নের আরো নির্দিষ্ট হতে আমার উত্তর প্রসারিত করব। আমি দেখতে পাচ্ছি যে আপনি আপনার প্রশ্ন গঠনের ক্ষেত্রে অনেক প্রচেষ্টা বিনিয়োগ করেছেন। তার জন্য ধন্যবাদ.
সানকুলসু

উত্তর:


10

Xএবং Mমূলত দুটি মডেল আপনি তুলনা করতে চান তা নির্দিষ্ট, কিন্তু শুধুমাত্র মধ্যে-বিষয় প্রভাব পরিপ্রেক্ষিতে; তাহলে মধ্যে-বিষয় প্রভাব সঙ্গে এতদুভয়ের মধ্যবর্তী সব কিছুর-বিষয় প্রভাব (পথিমধ্যে সহ) ইন্টারেকশনের জন্য ফলাফল মধ্যে পরিবর্তিত দেখায় Xএবং M

এর জন্য আপনার উদাহরণগুলি fitBবুঝতে সহজ হয় যদি আমরা এর জন্য ডিফল্ট যুক্ত করি Xএবং M:

anova(fitB, idata=idB, M=~1, X=~0, test="Spherical") # IVb
anova(fitB, idata=idB, M=diag(3), X=~1, test="Spherical") # IVw1, IVw1:IVb

প্রথম মডেলটি হ'ল সাবজেক্ট ইফেক্টের মধ্যে না থেকে পরিবর্তিত হওয়া (সকলের একই অর্থ হয়) প্রত্যেকটির জন্য আলাদা অর্থ হয়, তাই আমরা idএলোমেলো প্রভাবটি যুক্ত করেছি , যা সামগ্রিক ইন্টারসেপ্ট এবং সামগ্রিক বিষয়ের মধ্যে সামগ্রিকভাবে পরীক্ষা করার জন্য সঠিক জিনিস চালু.

দ্বিতীয় মডেলটি id:IVw1ইন্টারঅ্যাকশনটিকে বিজ্ঞাপন দেয় , যা পরীক্ষা করার জন্য সঠিক জিনিস IVw1এবং IVw1:IVbশর্তগুলির বিরুদ্ধে। যেহেতু কেবলমাত্র সাবজেক্টের মধ্যে একটি মাত্র প্রভাব রয়েছে (তিনটি স্তর সহ) diag(3)দ্বিতীয় মডেলের ডিফল্ট এটির জন্য অ্যাকাউন্ট করবে; এটি রান সমতুল্য হবে

anova(fitB, idata=idB, M=~IVw1, X=~1, test="Spherical") # IVw1, IVw1:IVb

আপনার জন্য fitC, আমি বিশ্বাস করি এই আদেশগুলি Anovaসারাংশ পুনরায় তৈরি করবে ate

anova(fitC, idata=id, M=~1, X=~0, test="Spherical") #IVb
anova(fitC, idata=id, M=~IVw1 + IVw2, X=~IVw2, test="Spherical") # IVw1
anova(fitC, idata=id, M=~IVw1 + IVw2, X=~IVw1, test="Spherical") # IVw2
anova(fitC, idata=id, M=~IVw1 + IVw2 + IVw1:IVw2,
                  X=~IVw1 + IVw2, test="Spherical")          # IVw1:IVw2

এখন, আপনি আবিষ্কার করেছেন যে এই আদেশগুলি সত্যই জটিল। ধন্যবাদ, এগুলি আর ব্যবহার করার খুব বেশি কারণ নেই। আপনি যদি গোলকত্ব অনুমান করতে ইচ্ছুক হন তবে আপনার কেবলমাত্র সঠিক এফ-টেস্টগুলি নিজেই সঠিক aovব্যবহার করতে lmএবং গণনা করা উচিত easier আপনি যদি গোলকত্ব অনুমান করতে রাজি lmeনা হন তবে জিজি এবং এইচএফ সংশোধনগুলির তুলনায় আপনি অনেক বেশি নমনীয়তা অর্জন করার কারণে ব্যবহার করা সত্যিই উপায়।

উদাহরণস্বরূপ, আপনার জন্য এখানে কোড aovএবং lmকোড রয়েছে fitA। আপনার প্রথমে লম্বা ফর্ম্যাটে ডেটা থাকা দরকার; এটি করার একটি উপায় এখানে:

library(reshape)
d0 <- data.frame(id=1:nrow(DV), DV)
d0$IVb <- IVb
d0 <- melt(d0, id.vars=c(1,11), measure.vars=2:10)
id0 <- id
id0$variable <- factor(levels(d0$variable), levels=levels(d0$variable))
d <- merge(d0, id0)
d$id <- factor(d$id)

এবং এখানে lm andaov` কোড:

anova(lm(value ~ IVw1*IVw2*id, data=d))
summary(aov(value ~ IVw1*IVw2 + Error(id/(IVw1*IVw2)), data=d))

আপনাকে অনেক ধন্যবাদ, আমি ঠিক তাই খুঁজছিলাম! এখানে বর্ণিত anova()সমস্যার কারণে আমি এখনও আগ্রহী ছিলাম । তবে আপনার শেষ পরামর্শটি ঠিক পাশাপাশি কাজ করে এবং সহজ। (গৌণ বিষয়: আমার মনে হয় শেষ 2 টি লাইনগুলি প্রতিটি 1 টি বন্ধ হওয়া প্রথম বন্ধনী, এবং এটি পড়া উচিত )Anova()Error(id/(IVw1*IVw2))
ক্যারাকাল

8

স্প্লিট-প্লট ডিজাইনের উৎপত্তি কৃষিতে, সুতরাং নাম the তবে এগুলি প্রায়শই ঘটে এবং আমি বলব - বেশিরভাগ ক্লিনিকাল ট্রায়ালের ওয়ার্কহর্স। মূল প্লটটি একটি ফ্যাক্টরের স্তরের সাথে চিকিত্সা করা হয় যখন অন্য কিছু ফ্যাক্টরের মাত্রা সাবপ্লটগুলির সাথে পরিবর্তিত হওয়ার অনুমতি দেওয়া হয়। সম্পূর্ণ র্যান্ডমাইজেশনের উপর বিধিনিষেধের ফলে নকশা তৈরি হয়। উদাহরণস্বরূপ: একটি ক্ষেত্র চারটি সাবপ্লোটে বিভক্ত হতে পারে। সাবপ্লটগুলিতে বিভিন্ন জাতের রোপণ করা সম্ভব হতে পারে তবে পুরো ক্ষেত্রের জন্য কেবল এক ধরণের সেচ ব্যবহার করা যেতে পারে। বিভাজন এবং ব্লক মধ্যে পার্থক্য নয়। ব্লকগুলি পরীক্ষামূলক ইউনিটগুলির বৈশিষ্ট্য যা পরীক্ষামূলক নকশায় আমাদের সুবিধা নেওয়ার বিকল্প রয়েছে, কারণ আমরা জানি তারা সেখানে রয়েছে। অন্যদিকে বিভাজনগুলি কী কী কারণে কার্যভারগুলি সম্ভব তা নিয়ে সীমাবদ্ধতা আরোপ করে। তারা ডিজাইনের উপর এমন প্রয়োজনীয়তা আরোপ করে যা সম্পূর্ণ র্যান্ডমাইজেশন প্রতিরোধ করে।

এগুলি ক্লিনিকাল ট্রায়ালগুলিতে প্রচুর ব্যবহৃত হয় যেখানে যখন একটি ফ্যাক্টর পরিবর্তন করা সহজ হয় এবং অন্য ফ্যাক্টরটি পরিবর্তিত হতে আরও অনেক বেশি সময় নেয়। যদি পরীক্ষককে অবশ্যই পর্যায়ক্রমে হার্ড-টু-চেঞ্জ-ফ্যাক্টরের প্রতিটি স্তরের জন্য সমস্ত রান করতে হয় তবে একটি বিভক্ত প্লট ডিজাইনের ফলাফল পুরো প্লট ফ্যাক্টরের প্রতিনিধিত্ব করে এমন হার্ড-টু-চেঞ্জ ফ্যাক্টরের ফলাফল দেয়।

এখানে একটি উদাহরণ রয়েছে: একটি কৃষিক্ষেত্রের পরীক্ষায়, উদ্দেশ্য ছিল দুটি ফসলের জাত এবং চারটি পৃথক সেচ পদ্ধতির প্রভাব নির্ধারণ করা। আটটি ক্ষেত্র উপলব্ধ ছিল, তবে প্রতিটি জমিতে কেবলমাত্র এক ধরণের সেচ প্রয়োগ করা যেতে পারে। ক্ষেত্রগুলি প্রতিটি অংশে পৃথক পৃথক দুটি অংশে বিভক্ত হতে পারে। পুরো প্লট ফ্যাক্টরটি সেচ, যা এলোমেলোভাবে ক্ষেতগুলিতে বরাদ্দ করা উচিত। প্রতিটি ক্ষেত্রের মধ্যে, বিভিন্ন বরাদ্দ করা হয়।

আপনি এখানে এটি এইভাবে করুন R:

install.packages("faraway")
data(irrigation)
summary(irrigation)

library(lme4)

R> (lmer(yield ~ irrigation * variety + (1|field), data = irrigation))
Linear mixed model fit by REML 
Formula: yield ~ irrigation * variety + (1 | field) 
   Data: irrigation 
  AIC  BIC logLik deviance REMLdev
 65.4 73.1  -22.7     68.6    45.4
Random effects:
 Groups   Name        Variance Std.Dev.
 field    (Intercept) 16.20    4.02    
 Residual              2.11    1.45    
Number of obs: 16, groups: field, 8

Fixed effects:
                       Estimate Std. Error t value
(Intercept)               38.50       3.02   12.73
irrigationi2               1.20       4.28    0.28
irrigationi3               0.70       4.28    0.16
irrigationi4               3.50       4.28    0.82
varietyv2                  0.60       1.45    0.41
irrigationi2:varietyv2    -0.40       2.05   -0.19
irrigationi3:varietyv2    -0.20       2.05   -0.10
irrigationi4:varietyv2     1.20       2.05    0.58

Correlation of Fixed Effects:
            (Intr) irrgt2 irrgt3 irrgt4 vrtyv2 irr2:2 irr3:2
irrigation2 -0.707                                          
irrigation3 -0.707  0.500                                   
irrigation4 -0.707  0.500  0.500                            
varietyv2   -0.240  0.170  0.170  0.170                     
irrgtn2:vr2  0.170 -0.240 -0.120 -0.120 -0.707              
irrgtn3:vr2  0.170 -0.120 -0.240 -0.120 -0.707  0.500       
irrgtn4:vr2  0.170 -0.120 -0.120 -0.240 -0.707  0.500  0.500

মূলত, এই মডেলটি যা বলে তা হ'ল, সেচ এবং বিভিন্নগুলি স্থির প্রতিক্রিয়া এবং বিভিন্নতা সেচের মধ্যে বাসা বাঁধে। ক্ষেত্রগুলি এলোমেলো প্রভাব এবং চিত্রের মতো কিছু হবে

আই_1 | আই 3 | আই_3 | I_4

ভি_1 ভি 3 | ভি_1 ভি 3 | ভি_1 ভি 3 | ভি_1 ভি 3 _2

তবে এটি স্থির পুরো প্লট প্রভাব এবং সাবপ্লট প্রভাব সহ একটি বিশেষ বৈকল্পিক ছিল। একাধিক বা এলোমেলোভাবে বিভিন্ন রূপ থাকতে পারে। বিভক্ত-বিভক্ত .. প্লটের ডিজাইনের মতো আরও জটিল ডিজাইন থাকতে পারে। মূলত, আপনি বন্য এবং ক্রেজি যেতে পারেন । তবে অন্তর্নিহিত কাঠামো এবং বিতরণ দেওয়া (যেমন স্থির বা এলোমেলো, নেস্টেড বা ক্রসড ..) স্পষ্টভাবে বোঝা গেছে, lmer-Ninjaমডেলিংয়ে কোনও অসুবিধা হবে না। ব্যাখ্যা হতে পারে একটি জগাখিচুড়ি হতে পারে।

তুলনা সম্পর্কে, বলুন যে আপনার আছে lmer1এবং lmer2:

anova(lmer1, lmer2)

প্যারামিটারের পার্থক্যের সমান স্বাধীনতার ডিগ্রি সহ চি-বর্গ পরীক্ষার পরিসংখ্যানের ভিত্তিতে আপনাকে উপযুক্ত পরীক্ষা দেবে ।

সিএফ: ফারাওয়ে, জে।, আর সহ লিনিয়ার মডেলগুলি প্রসারিত করছে।

কেসেলা, জি।, পরিসংখ্যান ডিজাইন


আমি মিশ্র-প্রভাবগুলির মডেল এবং আরও পটভূমি তথ্যের সাথে স্প্লিট-স্প্লট ডিজাইন বিশ্লেষণের ভূমিকাটির প্রশংসা করি! এটি অবশ্যই বিশ্লেষণ চালিয়ে যাওয়ার পছন্দের উপায়। আমি জোর দিয়ে আমার প্রশ্নটি আপডেট করেছি যে আমি কীভাবে এটি "পুরানো উপায়" করতে হয় তা জানতে চাই।
কারাকাল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.