যদি আপনি একটি "পারিবারিক প্রভাব" এবং একটি "আইটেম এফেক্ট" পেতে চাইছেন তবে আমরা ভাবতে পারি যে এই দুটিয়ের জন্য এলোমেলো ইন্টারসেপ্ট রয়েছে এবং তারপরে এটি 'lme4' প্যাকেজের সাহায্যে মডেল করতে পারি।
কিন্তু, প্রথম আমরা একে সহোদর একটি অদ্বিতীয় আইডি বদলে একটি অদ্বিতীয় আইডি দিতে হবে মধ্যে পরিবার।
তারপরে " বিভিন্ন আইটেমের জন্য একই পরিবারের মধ্যে ভাইবোনদের উপর নেওয়া পরিমাপের মধ্যে সম্পর্ক" এর জন্য আমরা এরকম কিছু নির্দিষ্ট করতে পারি:
mod<-lmer(value ~ (1|family)+(1|item), data=family)
এটি আমাদের পরিবার এবং আইটেমের জন্য সমস্ত ভাইবোনদের জন্য একটি স্থির প্রভাব এবং তারপরে দুটি এলোমেলো প্রভাবের বিরতি (বৈকল্পিক সহ) দেবে।
তারপরে, " একই আইটেমটির জন্য একই পরিবারের মধ্যে ভাইবোনদের নিয়ে নেওয়া পরিমাপের মধ্যে সম্পর্ক ", আমরা একই জিনিসটি করতে পারি তবে কেবল আমাদের ডেটা সাবসেট করতে পারি, সুতরাং আমাদের মতো কিছু রয়েছে:
mod2<-lmer(value ~ (1|family), data=subset(family,item=="1"))
আমি মনে করি এটি আপনার প্রশ্নের সহজতর পদ্ধতি হতে পারে। তবে, যদি আপনি কেবল আইটেম বা পরিবারের জন্য আইসিসি চান তবে 'সাইক' প্যাকেজের একটি আইসিসি () ফাংশন রয়েছে - আপনার উদাহরণের ডেটাতে কীভাবে আইটেম এবং মান গলে যায় সে সম্পর্কে সতর্ক থাকুন।
হালনাগাদ
নীচের কিছু আমার কাছে নতুন, তবে আমি এটির কাজটি উপভোগ করেছি। আমি নেতিবাচক ইন্ট্রাক্লাস পারস্পরিক সম্পর্কের ধারণার সাথে সত্যই পরিচিত নই। যদিও আমি উইকিপিডিয়ায় দেখতে পাচ্ছি যে "আইসিসির প্রথম দিকের সংজ্ঞা" জোড়যুক্ত ডেটার সাথে নেতিবাচক সম্পর্কের জন্য মঞ্জুরি দেয়। তবে এখন এটি সর্বাধিক ব্যবহৃত হওয়ার কারণে, আইসিসি-গ্রুপ-বৈকল্পিকের মধ্যে মোট বৈকল্পিকের অনুপাত হিসাবে বোঝা যায়। এবং এই মান সর্বদা ইতিবাচক। যদিও উইকিপিডিয়া সর্বাধিক অনুমোদনযোগ্য রেফারেন্স নাও হতে পারে, এই সংক্ষিপ্তসারটি আমি কীভাবে সর্বদা আইসিসি ব্যবহার করতে দেখেছি তার সাথে মিল রাখে:
এই আনোভা কাঠামোর একটি সুবিধা হ'ল বিভিন্ন গোষ্ঠীতে বিভিন্ন ধরণের ডেটা মান থাকতে পারে, যা পূর্ববর্তী আইসিসির পরিসংখ্যানগুলি ব্যবহার করে পরিচালনা করা কঠিন। এটিও নোট করুন যে এই আইসিসি সর্বদা অ-নেতিবাচক থাকে, এটি "গোষ্ঠীগুলির মধ্যে" মোট বৈকল্পিকের অনুপাত হিসাবে ব্যাখ্যা করার অনুমতি দেয়। এই আইসিসিকে কোভারিয়েট ইফেক্টের অনুমতি দেওয়ার জন্য সাধারণীকরণ করা যেতে পারে, এক্ষেত্রে আইসিসি কোভারিয়েট-অ্যাডজাস্টেড ডেটা মানগুলির অভ্যন্তরীণ শ্রেণির মিল খুঁজে পাওয়া হিসাবে ব্যাখ্যা করা হয়।
এটি বলেছিল যে আপনি এখানে দিয়েছেন এমন ডেটা দিয়ে, 1, 2 এবং 3 আইটেমের মধ্যে আন্তঃ শ্রেণীর সম্পর্ক খুব ভাল নেতিবাচক হতে পারে। এবং আমরা এটির মডেল করতে পারি, তবে গ্রুপগুলির মধ্যে ব্যাখ্যা করা বৈকল্পিকের অনুপাত এখনও ইতিবাচক থাকবে।
# load our data and lme4
library(lme4)
## Loading required package: Matrix
dat<-read.table("http://www.wvbauer.com/fam_sib_item.dat", header=TRUE)
সুতরাং পরিবারের মধ্যে পার্থক্য কত শতাংশ, আইটেম-গোষ্ঠী মধ্যে গ্রুপ বৈকল্পিক জন্য নিয়ন্ত্রণ? আপনার পরামর্শ মতো আমরা একটি র্যান্ডম ইন্টারসেপ্ট মডেল ব্যবহার করতে পারি:
mod<-lmer(yijk ~ (1|family)+(1|item), data=dat)
summary(mod)
## Linear mixed model fit by REML ['lmerMod']
## Formula: yijk ~ (1 | family) + (1 | item)
## Data: dat
##
## REML criterion at convergence: 4392.3
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -3.6832 -0.6316 0.0015 0.6038 3.9801
##
## Random effects:
## Groups Name Variance Std.Dev.
## family (Intercept) 0.3415 0.5843
## item (Intercept) 0.8767 0.9363
## Residual 4.2730 2.0671
## Number of obs: 1008, groups: family, 100; item, 3
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 2.927 0.548 5.342
দুটি র্যান্ডম এফেক্টস ইন্টারসেপ্ট এবং অবশিষ্টাংশ থেকে পৃথক হয়ে আমরা আইসিসি গণনা করি। তারপরে আমরা সমস্ত বৈকল্পিকের স্কোয়ারের যোগফলের সাথে পারিবারিক প্রকরণের বর্গক্ষেত্র গণনা করি।
temp<-as.data.frame(VarCorr(mod))$vcov
temp.family<-(temp[1]^2)/(temp[1]^2+temp[2]^2+temp[3]^2)
temp.family
## [1] 0.006090281
অন্য দুটি বৈকল্পিক অনুমানের জন্য আমরা তখন একই কাজ করতে পারি:
# variance between item-groups
temp.items<-(temp[2]^2)/(temp[1]^2+temp[2]^2+temp[3]^2)
temp.items
## [1] 0.04015039
# variance unexplained by groups
temp.resid<-(temp[3]^2)/(temp[1]^2+temp[2]^2+temp[3]^2)
temp.resid
## [1] 0.9537593
# clearly then, these will sum to 1
temp.family+temp.items+temp.resid
## [1] 1
এই ফলাফলগুলি দেখায় যে মোট বৈকল্পিকের খুব সামান্যই পরিবারগুলির মধ্যে বা আইটেম-গোষ্ঠীর মধ্যে বৈচিত্র দ্বারা ব্যাখ্যা করা হয়েছে। তবে, উপরে উল্লিখিত হিসাবে, আইটেমগুলির মধ্যে আন্তঃ-শ্রেণীর সম্পর্ক এখনও নেতিবাচক হতে পারে। প্রথমে আমাদের ডেটা আরও বৃহত্তর ফর্ম্যাটে পাওয়া যাক:
# not elegant but does the trick
dat2<-cbind(subset(dat,item==1),subset(dat,item==2)[,1],subset(dat,item==3)[,1])
names(dat2)<-c("item1","family","sibling","item","item2","item3")
এখন আমরা পূর্বের মতো পরিবারের জন্য একটি এলোমেলো ইন্টারসেপ্ট সহ আইটেম 1 এবং আইটেম 3 এর মধ্যে পারস্পরিক সম্পর্ককে মডেল করতে পারি। তবে প্রথমত, সম্ভবত একটি স্মরণীয় রৈখিক প্রতিরোধের জন্য, মডেলটির আর-স্কোয়ারের বর্গমূল আইটেম 1 এবং আইটেম 2 এর জন্য আন্তঃ-শ্রেণীর সম্পর্কযুক্ত সহগ (পার্সোনস আর) এর সমান।
# a simple linear regression
mod2<-lm(item1~item3,data=dat2)
# extract pearson's r
sqrt(summary(mod2)$r.squared)
## [1] 0.6819125
# check this
cor(dat2$item1,dat2$item3)
## [1] 0.6819125
# yep, equal
# now, add random intercept to the model
mod3<-lmer(item1 ~ item3 + (1|family), data=dat2)
summary(mod3)
## Linear mixed model fit by REML ['lmerMod']
## Formula: item1 ~ item3 + (1 | family)
## Data: dat2
##
## REML criterion at convergence: 1188.8
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -2.3148 -0.5348 -0.0136 0.5724 3.2589
##
## Random effects:
## Groups Name Variance Std.Dev.
## family (Intercept) 0.686 0.8283
## Residual 1.519 1.2323
## Number of obs: 336, groups: family, 100
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) -0.07777 0.15277 -0.509
## item3 0.52337 0.02775 18.863
##
## Correlation of Fixed Effects:
## (Intr)
## item3 -0.699
আইটেম 1 এবং আইটেম 3 এর মধ্যে সম্পর্কটি ইতিবাচক। তবে, কেবল এখানে আমরা নেতিবাচক পারস্পরিক সম্পর্ক পেতে পারি তা পরীক্ষা করতে, আসুন আমাদের ডেটাগুলি ম্যানিপুলেট করুন:
# just going to multiply one column by -1
# to force this cor to be negative
dat2$neg.item3<-dat2$item3*-1
cor(dat2$item1, dat2$neg.item3)
## [1] -0.6819125
# now we have a negative relationship
# replace item3 with this manipulated value
mod4<-lmer(item1 ~ neg.item3 + (1|family), data=dat2)
summary(mod4)
## Linear mixed model fit by REML ['lmerMod']
## Formula: item1 ~ neg.item3 + (1 | family)
## Data: dat2
##
## REML criterion at convergence: 1188.8
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -2.3148 -0.5348 -0.0136 0.5724 3.2589
##
## Random effects:
## Groups Name Variance Std.Dev.
## family (Intercept) 0.686 0.8283
## Residual 1.519 1.2323
## Number of obs: 336, groups: family, 100
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) -0.07777 0.15277 -0.509
## neg.item3 -0.52337 0.02775 -18.863
##
## Correlation of Fixed Effects:
## (Intr)
## neg.item3 0.699
হ্যাঁ, আইটেমগুলির মধ্যে সম্পর্ক নেতিবাচক হতে পারে। তবে আমরা যদি এই সম্পর্কের পরিবারগুলির মধ্যে, যেমন আইসিসি (পরিবার) এর মধ্যে যে বৈচিত্রের অনুপাতের দিকে লক্ষ্য করি, তখনও এই সংখ্যাটি ইতিবাচক হবে। পূর্বের মত:
temp2<-as.data.frame(VarCorr(mod4))$vcov
(temp2[1]^2)/(temp2[1]^2+temp2[2]^2)
## [1] 0.1694989
সুতরাং আইটেম 1 এবং আইটেম 3 এর মধ্যে সম্পর্কের জন্য, এই বৈকল্পিকতার প্রায় 17% পরিবারের মধ্যে ভিন্নতার কারণে is এবং আমরা এখনও আইটেমগুলির মধ্যে নেতিবাচক সম্পর্ক স্থাপনের অনুমতি দিয়েছি।