ধরুন আমার 10 জন শিক্ষার্থী রয়েছে, যারা প্রতিটি 20 টি গণিতের সমস্যাগুলি সমাধান করার চেষ্টা করে। সমস্যাগুলি সঠিক বা ভুল (লম্বাডাটাতে) স্কোর করা হয় এবং প্রতিটি শিক্ষার্থীর পারফরম্যান্স একটি নির্ভুলতা পরিমাপ (সাবজডাটা) দ্বারা সংক্ষিপ্ত করা যায়। নীচে 1, 2 এবং 4 টি মডেলগুলি পৃথক পৃথক ফলাফলের উপস্থিতি দেখায় তবে আমি বুঝতে পারি যে তারা একই জিনিস করছে doing কেন তারা বিভিন্ন ফলাফল উত্পাদন করছে? (আমি রেফারেন্সের জন্য মডেল 3 অন্তর্ভুক্ত করেছি))
library(lme4)
set.seed(1)
nsubjs=10
nprobs=20
subjdata = data.frame('subj'=rep(1:nsubjs),'iq'=rep(seq(80,120,10),nsubjs/5))
longdata = subjdata[rep(seq_len(nrow(subjdata)), each=nprobs), ]
longdata$correct = runif(nsubjs*nprobs)<pnorm(longdata$iq/50-1.4)
subjdata$acc = by(longdata$correct,longdata$subj,mean)
model1 = lm(logit(acc)~iq,subjdata)
model2 = glm(acc~iq,subjdata,family=gaussian(link='logit'))
model3 = glm(acc~iq,subjdata,family=binomial(link='logit'))
model4 = lmer(correct~iq+(1|subj),longdata,family=binomial(link='logit'))
library(car)
প্রয়োজনীয়, লগইট ফাংশন জন্য।
library(betareg)
model5 = betareg(acc~scale(iq),subjdata)