ভবিষ্যদ্বাণীটির জন্য এলোমেলো প্রভাবগুলি বাদ দিয়ে কেন আপনি একটি মিশ্র প্রভাব মডেল থেকে ভবিষ্যদ্বাণী করবেন?


10

এটি একটি ধারণাগত প্রশ্ন বেশি, তবে আমি ব্যবহার Rকরার সাথে সাথে প্যাকেজগুলিকে উল্লেখ করব R। যদি ভবিষ্যদ্বাণী করার উদ্দেশ্যে লিনিয়ার মডেলটি ফিট করার লক্ষ্য থাকে এবং তারপরে এমন ভবিষ্যদ্বাণী করা যায় যেখানে এলোমেলো প্রভাবগুলি পাওয়া যায় না, তবে কোনও মিশ্র প্রভাবগুলির মডেল ব্যবহারের কোনও সুবিধা আছে কি, বা পরিবর্তে একটি স্থির প্রভাব মডেল ব্যবহার করা উচিত?

উদাহরণস্বরূপ, যদি আমার কাছে আরও কিছু তথ্যের সাথে ওজন বনাম উচ্চতা সম্পর্কিত ডেটা থাকে এবং ব্যবহার করে নীচের মডেলটি তৈরি করি lme4, যেখানে সাবজেক্টটি লেভেলের ( ) সহ একটি উপাদান :এনএন=এনগুলিএকটিমিপিগুলি

mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)

তারপরে আমি নতুন উচ্চতা এবং বয়স ডেটা ব্যবহার করে মডেল থেকে ওজন সম্পর্কে পূর্বাভাস দিতে সক্ষম হতে চাই। স্পষ্টতই মূল ডেটাতে বাই-সাবজেক্টের ভেরিয়েন্সটি মডেলটিতে ধরা পড়েছে, তবে ভবিষ্যদ্বাণীতে কি এই তথ্য ব্যবহার করা সম্ভব? ধরা যাক আমার কাছে কিছু নতুন উচ্চতা এবং বয়সের ডেটা রয়েছে এবং ওজন সম্পর্কে পূর্বাভাস দিতে চাই, আমি নীচের মতো এটি করতে পারি:

predict(mod1,newdata=newdf) # newdf columns for height, age, subject

এটি ব্যবহার করবে predict.merModএবং আমি (নতুন) বিষয়গুলির জন্য একটি কলাম অন্তর্ভুক্ত করতে পারি newdfবা সেট করতে পারি re.form =~0। প্রথম উদাহরণে, এটি স্পষ্ট নয় যে মডেলটি 'নতুন' বিষয়গুলির সাথে কী করবে এবং দ্বিতীয় উদাহরণে, মডেলটিতে ধারণ করা বাই-সাবজেক্টের বৈকল্পিকটি কী ভবিষ্যদ্বাণীটির জন্য উপেক্ষা করা হবে (গড়পড়তা ধরে)?

উভয় ক্ষেত্রেই এটি আমার কাছে মনে হবে যে একটি নির্দিষ্ট প্রভাব রৈখিক মডেল আরও উপযুক্ত হতে পারে। প্রকৃতপক্ষে, যদি আমার বোধগম্যতা সঠিক হয়, তবে একটি নির্দিষ্ট প্রভাব মডেলের মিশ্র মডেল হিসাবে একই মানগুলির পূর্বাভাস দেওয়া উচিত, যদি পূর্বাভাসে এলোমেলো প্রভাব ব্যবহার না করা হয়। এটা কি হওয়া উচিত? ইন Rনা যায়, তা উদাহরণস্বরূপ:

mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)

predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject

এতে বিভিন্ন ফলাফল দেয়:

mod2 <- lm(weight ~ height + age, data=df)

predict(mod2,newdata=newdf) # newdf columns for height, age



1
এটি হতে পারে আপনি কোনও নতুন গোষ্ঠীর ভবিষ্যদ্বাণী করতে চান যা অনুমানের অন্তর্ভুক্ত ছিল না
কেজেটিল বি হালওয়ারসেন

হ্যাঁ, তবে সেই পরিস্থিতিতে মিশ্র প্রভাবের মডেলটিকে কেন বিরক্ত করবেন? যদি আপনি পূর্বাভাসে এলোমেলো প্রভাবগুলিকে অগ্রাহ্য করেন তবে এটি আপনাকে কী দেয় যে একটি নির্দিষ্ট প্রভাব মডেল দেয় না?
আদিবাসী

1
ঠিক আছে, এটি আরও ভাল অনুমান দিতে পারে, কারণ আপনার ত্রুটি কাঠামোর আরও ভাল (আরও সঠিক) মডেল রয়েছে
কেজেটিল বি হালওয়ারসেন

উত্তর:


5

সাধারণ চিন্তার পরীক্ষা: আপনি জন্মের পরে 5 টি শিশুর ওজন এবং উচ্চতা পরিমাপ করেছেন। এবং আপনি একই বাচ্চা থেকে এটি দুটি বছর পরে আবার পরিমাপ। ইতিমধ্যে আপনি আপনার বাচ্চার মেয়ের ওজন এবং উচ্চতা প্রায় প্রতি সপ্তাহে পরিমাপ করেছেন যার ফলস্বরূপ তার জন্য 100 টি মূল্য জোড়া হয়। আপনি যদি একটি মিশ্র প্রভাবগুলির মডেল ব্যবহার করেন তবে কোনও সমস্যা নেই। আপনি যদি কোনও স্থির প্রতিক্রিয়া মডেল ব্যবহার করেন তবে আপনি আপনার মেয়ের কাছ থেকে পরিমাপের ক্ষেত্রে অযৌক্তিক ওজন রেখেছেন, এমন একটি বিন্দুতে যেখানে আপনি যদি তার কাছ থেকে কেবলমাত্র ডেটা ব্যবহার করেন তবে আপনি প্রায় একই মডেলটিকে ফিট করতে পারেন। সুতরাং, পুনরুদ্ধারযোগ্য ব্যবস্থাগুলি বা অনিশ্চয়তা কাঠামোগুলি সঠিকভাবে মডেল করার পক্ষে নয়, তবে ভবিষ্যদ্বাণী করার জন্যও এটি গুরুত্বপূর্ণ। সাধারণভাবে, আপনি মিশ্র প্রভাবগুলির মডেল এবং একটি নির্দিষ্ট প্রভাব মডেল (লঙ্ঘিত অনুমান সহ) থেকে একই ভবিষ্যদ্বাণী পান না।

এবং আমি হয় newdf এ (নতুন) বিষয়গুলির জন্য একটি কলাম অন্তর্ভুক্ত করতে পারি

যে বিষয়গুলি মূল (প্রশিক্ষণ) ডেটার অংশ ছিল না তার জন্য আপনি ভবিষ্যদ্বাণী করতে পারবেন না। আবার একটি চিন্তার পরীক্ষা: নতুন বিষয় স্থূল। মডেলটি কীভাবে জানতে পারে যে এটি এলোমেলো প্রভাব বিতরণের উপরের প্রান্তে রয়েছে?

পূর্বাভাসের জন্য মডেলটিতে বন্দী বাই-সাবজেক্টের বৈকল্পিকগুলি কি কেবল উপেক্ষা করা হবে (গড় ধরে)?

আমি যদি আপনাকে সঠিকভাবে বুঝতে পারি তবে হ্যাঁ। মডেল আপনাকে জনসংখ্যার জন্য প্রত্যাশিত মানটির একটি অনুমান দেয় (নোট করুন যে এই অনুমানটি মূল বিষয়গুলিতে এখনও শর্তাধীন)।


1
সুস্পষ্ট ব্যাখ্যা এবং উদাহরণের জন্য আপনাকে ধন্যবাদ, এটি সমস্ত অর্থবোধ করে। তবে, যেখানে আপনি রাষ্ট্র You can't predict for subjects which were not part of the original (training) data; re.form=~0জনসংখ্যার প্রত্যাশিত মানটি সেট করে এবং পূর্বাভাস দিচ্ছে না আমাকে ঠিক তা করতে দেয়? অনুমোদিত, মডেল ভবিষ্যদ্বাণীতে কোনও বিষয়-নির্দিষ্ট তথ্য ব্যবহার করছে না, তবে এটি কি বলা উচিত যে একটি মিশ্র প্রভাবের মডেল থেকে অনুমান যে নির্দিষ্ট-সুনির্দিষ্ট প্রভাবের মডেল যেখানে সাবজেক্ট-নির্দিষ্ট প্রকরণ ছিল তার চেয়ে আরও সঠিক হবে উপেক্ষিত?
আদিবাসী

1
ধারনাগুলি লঙ্ঘিত হওয়ায় স্থির মডেল প্রযোজ্য নয়। আপনাকে অবশ্যই এমন একটি মডেল ব্যবহার করতে হবে যাতে নির্ভরতা কাঠামো অন্তর্ভুক্ত থাকে। re.form=~0আপনাকে জনসংখ্যা স্তরের পূর্বাভাস দেয় যা নতুন বিষয়গুলির জন্য আপনি সবচেয়ে ভাল করতে পারেন।
রোল্যান্ড

glmmLasso আর-তে প্যাকেজটি ব্যবহার করার সময় আমার একই প্রশ্ন ছিল the প্যাকেজের লেখক আন্দ্রেয়াস গ্রোল বলেছেন যে গ্ল্যামলাসো পদ্ধতিটি নতুন বিষয়গুলির জন্য ভবিষ্যদ্বাণী করার জন্য কেবলমাত্র নির্দিষ্ট প্রভাবগুলি এবং পরবর্তী সময়ের জন্য বিদ্যমান বিষয়গুলির জন্য নির্দিষ্ট + এলোমেলো প্রভাব ব্যবহার করে effects
রবার্টএফ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.