নির্বাহী সারসংক্ষেপ
এটি প্রায়শই বলা হয়ে থাকে যে যদি সম্ভাব্য সমস্ত ফ্যাক্টর স্তরগুলি একটি মিশ্র মডেলটিতে অন্তর্ভুক্ত করা হয়, তবে এই ফ্যাক্টরটিকে একটি নির্দিষ্ট প্রভাব হিসাবে বিবেচনা করা উচিত। এটি দুটি ডিসটিন্ট কারণের জন্য অগত্যা সত্য নয়:
(1) মাত্রা সংখ্যা বড় ফেলেন, তাহলে এটি করতে জানার জন্য র্যান্ডম যেমন [অতিক্রম] ফ্যাক্টর চিকিত্সা।
আমি এখানে @ টিম এবং @ রবার্টলং উভয়ের সাথেই একমত: যদি কোনও ফ্যাক্টরটির একটি বিশাল সংখ্যক স্তর থাকে যা সমস্ত মডেলের অন্তর্ভুক্ত থাকে (যেমন বিশ্বের সমস্ত দেশ; বা কোনও দেশের সমস্ত স্কুল; অথবা সম্ভবত পুরো জনসংখ্যার বিষয়গুলি সমীক্ষা করা হয় ইত্যাদি), তবে এটিকে এলোমেলো হিসাবে গণ্য করার ক্ষেত্রে কোনও ভুল নেই --- এটি আরও পার্সোনামিয়াস হতে পারে, কিছু সংকোচনের ব্যবস্থা করতে পারে ইত্যাদি
lmer(size ~ age + subjectID) # fixed effect
lmer(size ~ age + (1|subjectID)) # random effect
(২) যদি ফ্যাক্টরটি অন্য এলোমেলো প্রভাবের মধ্যে বাসা বেধে থাকে তবে এটিকে স্তরের সংখ্যার চেয়ে স্বতন্ত্রভাবে এলোমেলো হিসাবে বিবেচনা করতে হবে।
এই থ্রেডে একটি বিশাল বিভ্রান্তি ছিল (মন্তব্যগুলি দেখুন) কারণ অন্যান্য উত্তরগুলি উপরের # 1 কেস সম্পর্কিত, তবে আপনি যে উদাহরণ দিয়েছেন তা একটি ভিন্ন পরিস্থিতির উদাহরণ , এই মামলা # 2। এখানে মাত্র দুটি স্তর রয়েছে (অর্থাত্ "বৃহত সংখ্যক" নয়!) এবং তারা সমস্ত সম্ভাবনা নিঃশেষ করে দেয় তবে এগুলি অন্য এলোমেলো প্রভাবের ভিতরে নেস্টেড থাকে , এতে নেস্টেড এলোমেলো প্রভাব পাওয়া যায়।
lmer(size ~ age + (1|subject) + (1|subject:side) # side HAS to be random
আপনার উদাহরণ বিশদ আলোচনা
আপনার কাল্পনিক পরীক্ষার পক্ষ এবং বিষয়গুলি প্রমিত শ্রেণিবদ্ধ মডেল উদাহরণে ক্লাস এবং বিদ্যালয়ের মতো সম্পর্কিত। সম্ভবত প্রতিটি স্কুলে (# 1, # 2, # 3 ইত্যাদি) ক্লাস এ এবং ক্লাস বি রয়েছে এবং এই দুটি ক্লাস মোটামুটি একই বলে মনে করা হচ্ছে। আপনি দুটি স্তরের স্থির প্রভাব হিসাবে ক্লাস এ এবং বি মডেল করবেন না; এটি একটি ভুল হবে। তবে আপনি দুটি এবং দুটি স্তরের সাথে এন্ড এবং বি ক্লাসগুলিকে "পৃথক" (অর্থাত্ অতিক্রম করা) এলোমেলো প্রভাব হিসাবে মডেল করবেন না; এটিও একটি ভুল হবে। পরিবর্তে, আপনি স্কুলের অভ্যন্তরীণ এলোমেলো প্রভাব হিসাবে ক্লাসগুলি মডেল করবেন ।
এখানে দেখুন: ক্রসড বনাম নেস্টেড এলোমেলো প্রভাবগুলি: কীভাবে তাদের পার্থক্য রয়েছে এবং কীভাবে তারা lme4 এ সঠিকভাবে নির্দিষ্ট করা হয়?
i = 1 … nঞ = 1 , 2
আয়তনআমিঞ ট= μ + αight উচ্চতাআমিঞ ট+ + β⋅ওজনআমিঞ ট+ + γ⋅বয়সআমি জেট+ +εআমি+ +εআমি জে+ +εআমি ঞ ট
εআমি। এন( 0 , σ)2র U b ঞ ই গ টি গুলি) ,প্রতিটি বিষয়ের জন্য র্যান্ডম ইন্টারসেপ্ট
εআমি জে। এন( 0 , σ)2বিষয়-সাইড) ,এলোমেলো ইনট পক্ষের জন্য বিষয় নেস্টেড
εআমি ঞ ট। এন( 0 , σ)2গোলমাল) ,ত্রুটি শব্দ
যেমন আপনি নিজের লিখেছেন, "বিশ্বাস করার কোনও কারণ নেই যে ডান পা গড়ে গড়ে বাম পায়ের চেয়ে বড় হবে"। সুতরাং ডান বা বাম পায়ের কোনও "গ্লোবাল" প্রভাব (কোনও স্থির বা এলোমেলোভাবে অতিক্রম করা) হওয়া উচিত নয়; পরিবর্তে, প্রতিটি বিষয় "একটি" পা এবং "অন্য" পা রাখার কথা ভাবা যেতে পারে, এবং এই পরিবর্তনশীলতাটি আমাদের মডেলটিতে অন্তর্ভুক্ত করা উচিত। এই "একটি" এবং "অন্য" ফুটগুলি বিষয়গুলির মধ্যে নেস্ট করা হয়, তাই এলোমেলো এলোমেলো প্রভাবগুলি।
মন্তব্যের জবাবে আরও বিশদ। [সেপ্টেম্বর 26]
আমার উপরের মডেলটিতে সাবজেক্টের মধ্যে নেস্টেড এলোমেলো প্রভাব হিসাবে সাইড অন্তর্ভুক্ত রয়েছে। এখানে একটি বিকল্প মডেল, @ রবার্ট দ্বারা প্রস্তাবিত, যেখানে সাইডটি একটি নির্দিষ্ট প্রভাব:
আয়তনআমি ঞ ট= μ + α ight উচ্চতাআমি ঞ ট+ + β। ওজনআমি ঞ ট+ + γ⋅ বয়সআমি ঞ ট+ + δ⋅ পাশঞ+ + εআমি+ + εআমি ঞ ট
আমি জে
এটা হতে পারে না.
ক্রস এলোমেলো প্রভাব হিসাবে সাইড সহ @ গং এর অনুমানমূলক মডেলটির ক্ষেত্রেও এটি একই:
আয়তনআমি ঞ ট= μ + α ight উচ্চতাআমি ঞ ট+ + β। ওজনআমি ঞ ট+ + γ⋅ বয়সআমিঞ ট+ + εআমি+ +εঞ+ +εআমি ঞ ট
এটি নির্ভরতাগুলির জন্য অ্যাকাউন্টে ব্যর্থ হয়।
একটি অনুকরণের মাধ্যমে বিক্ষোভ [২ অক্টোবর]
এখানে আরে সরাসরি প্রদর্শিত হয়
আমি টানা পাঁচ বছর ধরে উভয় পায়ে পরিমাপ করা পাঁচটি বিষয় নিয়ে একটি খেলনা ডেটাসেট তৈরি করি। বয়সের প্রভাব লিনিয়ার is প্রতিটি বিষয় একটি এলোমেলো ইন্টারসেপ্ট আছে। এবং প্রতিটি বিষয়ের একটির পায়ে একটি (বাম বা ডান হয়) অন্যটির চেয়ে বড়।
set.seed(17)
demo = data.frame(expand.grid(age = 1:5,
side=c("Left", "Right"),
subject=c("Subject A", "Subject B", "Subject C", "Subject D", "Subject E")))
demo$size = 10 + demo$age + rnorm(nrow(demo))/3
for (s in unique(demo$subject)){
# adding a random intercept for each subject
demo[demo$subject==s,]$size = demo[demo$subject==s,]$size + rnorm(1)*10
# making the two feet of each subject different
for (l in unique(demo$side)){
demo[demo$subject==s & demo$side==l,]$size = demo[demo$subject==s & demo$side==l,]$size + rnorm(1)*7
}
}
plot(1:50, demo$size)
আমার ভয়ঙ্কর আর দক্ষতার জন্য ক্ষমা চাই। এখানে ডেটা দেখতে কেমন দেখাচ্ছে (প্রতিটি একটানা পাঁচটি বিন্দু কয়েক বছরের মধ্যে পরিমাপ করা এক ব্যক্তির এক ফুট হয়; প্রতিটি টানা দশটি বিন্দু একই ব্যক্তির দুই ফুট হয়):
এখন আমরা একগুচ্ছ মডেল ফিট করতে পারি:
require(lme4)
summary(lmer(size ~ age + side + (1|subject), demo))
summary(lmer(size ~ age + (1|side) + (1|subject), demo))
summary(lmer(size ~ age + (1|subject/side), demo))
সমস্ত মডেলের একটি স্থির প্রভাব age
এবং এর এলোমেলো প্রভাব অন্তর্ভুক্ত থাকে subject
তবে side
আলাদাভাবে চিকিত্সা করে ।
side
age
t = 1.8
side
age
t = 1.4
side
age
t = 37
এটি পরিষ্কারভাবে দেখায় যে side
নেস্টেড এলোমেলো প্রভাব হিসাবে বিবেচনা করা উচিত।
পরিশেষে, মন্তব্যে @ রবার্ট বিশ্বব্যাপী প্রভাবকে side
নিয়ন্ত্রণ ভেরিয়েবল হিসাবে অন্তর্ভুক্ত করার পরামর্শ দিয়েছেন । নেস্টেড এলোমেলো প্রভাব রাখার সময় আমরা এটি করতে পারি:
summary(lmer(size ~ age + side + (1|subject/side), demo))
summary(lmer(size ~ age + (1|side) + (1|subject/side), demo))
side
t = 0.5side