এটি একটি ধারণাগত প্রশ্ন বেশি, তবে আমি ব্যবহার R
করার সাথে সাথে প্যাকেজগুলিকে উল্লেখ করব R
। যদি ভবিষ্যদ্বাণী করার উদ্দেশ্যে লিনিয়ার মডেলটি ফিট করার লক্ষ্য থাকে এবং তারপরে এমন ভবিষ্যদ্বাণী করা যায় যেখানে এলোমেলো প্রভাবগুলি পাওয়া যায় না, তবে কোনও মিশ্র প্রভাবগুলির মডেল ব্যবহারের কোনও সুবিধা আছে কি, বা পরিবর্তে একটি স্থির প্রভাব মডেল ব্যবহার করা উচিত?
উদাহরণস্বরূপ, যদি আমার কাছে আরও কিছু তথ্যের সাথে ওজন বনাম উচ্চতা সম্পর্কিত ডেটা থাকে এবং ব্যবহার করে নীচের মডেলটি তৈরি করি lme4
, যেখানে সাবজেক্টটি লেভেলের ( ) সহ একটি উপাদান :
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
তারপরে আমি নতুন উচ্চতা এবং বয়স ডেটা ব্যবহার করে মডেল থেকে ওজন সম্পর্কে পূর্বাভাস দিতে সক্ষম হতে চাই। স্পষ্টতই মূল ডেটাতে বাই-সাবজেক্টের ভেরিয়েন্সটি মডেলটিতে ধরা পড়েছে, তবে ভবিষ্যদ্বাণীতে কি এই তথ্য ব্যবহার করা সম্ভব? ধরা যাক আমার কাছে কিছু নতুন উচ্চতা এবং বয়সের ডেটা রয়েছে এবং ওজন সম্পর্কে পূর্বাভাস দিতে চাই, আমি নীচের মতো এটি করতে পারি:
predict(mod1,newdata=newdf) # newdf columns for height, age, subject
এটি ব্যবহার করবে predict.merMod
এবং আমি (নতুন) বিষয়গুলির জন্য একটি কলাম অন্তর্ভুক্ত করতে পারি newdf
বা সেট করতে পারি re.form =~0
। প্রথম উদাহরণে, এটি স্পষ্ট নয় যে মডেলটি 'নতুন' বিষয়গুলির সাথে কী করবে এবং দ্বিতীয় উদাহরণে, মডেলটিতে ধারণ করা বাই-সাবজেক্টের বৈকল্পিকটি কী ভবিষ্যদ্বাণীটির জন্য উপেক্ষা করা হবে (গড়পড়তা ধরে)?
উভয় ক্ষেত্রেই এটি আমার কাছে মনে হবে যে একটি নির্দিষ্ট প্রভাব রৈখিক মডেল আরও উপযুক্ত হতে পারে। প্রকৃতপক্ষে, যদি আমার বোধগম্যতা সঠিক হয়, তবে একটি নির্দিষ্ট প্রভাব মডেলের মিশ্র মডেল হিসাবে একই মানগুলির পূর্বাভাস দেওয়া উচিত, যদি পূর্বাভাসে এলোমেলো প্রভাব ব্যবহার না করা হয়। এটা কি হওয়া উচিত? ইন R
না যায়, তা উদাহরণস্বরূপ:
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject
এতে বিভিন্ন ফলাফল দেয়:
mod2 <- lm(weight ~ height + age, data=df)
predict(mod2,newdata=newdf) # newdf columns for height, age