মিশ্র-প্রভাব এবং স্থির-প্রতিক্রিয়া মডেলগুলির তুলনা (এলোমেলো প্রভাবগুলির পরীক্ষার তাত্পর্য)


10

তিনটি ভেরিয়েবল দেওয়া, yএবং x, যা ধনাত্মক ধারাবাহিক, এবং zযা স্পষ্টত, আমার কাছে দুটি প্রার্থী মডেল দিয়েছেন:

fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )

এবং

fit.fe <- lm( y ~ 1 + x )

কোন মডেলটি আরও উপযুক্ত তা নির্ধারণ করতে আমি এই মডেলগুলির সাথে তুলনা করব বলে আশা করি। এটি আমার কাছে মনে হয় যে কোনও অর্থে fit.feভিতরে বাসা বেঁধেছে fit.me। সাধারণত, যখন এই সাধারণ পরিস্থিতি ধারণ করে, একটি চি-স্কোয়ার্ড পরীক্ষা করা যায়। ইন R, আমরা নিম্নলিখিত কমান্ড দিয়ে এই পরীক্ষা করতে পারি,

anova(fit.fe,fit.me)

যখন উভয় মডেলটিতে র্যান্ডম-ইফেক্ট থাকে ( প্যাকেজ lmerথেকে উত্পন্ন lme4), anova()কমান্ডটি দুর্দান্ত কাজ করে। সীমানা পরামিতিগুলির কারণে, সাধারণত অনুকরণের মাধ্যমে ফলত চি-স্কয়ার পরিসংখ্যান পরীক্ষা করার পরামর্শ দেওয়া হয়, তবে আমরা সিমুলেশন পদ্ধতিতে এখনও পরিসংখ্যানটি ব্যবহার করতে পারি ।

যখন উভয় মডেলটিতে কেবল স্থির-প্রতিক্রিয়া থাকে তবে এই পদ্ধতির --- এবং, সম্পর্কিত anova()কমান্ড --- ঠিকঠাক কাজ করে।

যাইহোক, যখন কোনও মডেলটিতে র্যান্ডম এফেক্ট থাকে এবং হ্রাস করা মডেলটিতে কেবল স্থির-প্রতিক্রিয়া থাকে, উপরের দৃশ্যের মতো, anova()কমান্ডটি কার্যকর হয় না।

আরও নির্দিষ্টভাবে, আমি নিম্নলিখিত ত্রুটি পেয়েছি:

 > anova(fit.fe, fit.me)
 Error: $ operator not defined for this S4 class

উপরে থেকে সি-স্কয়ার পদ্ধতির (সিমুলেশন সহ) ব্যবহার করে কিছু ভুল আছে? অথবা এটি anova()বিভিন্ন ফাংশন দ্বারা উত্পাদিত লিনিয়ার মডেলগুলি কীভাবে মোকাবেলা করতে হবে তা না জানার সমস্যা ?

অন্য কথায়, মডেলগুলি থেকে প্রাপ্ত চি-স্কয়ারের পরিসংখ্যানটি ম্যানুয়ালি উত্পন্ন করা কি উপযুক্ত হবে? যদি তা হয় তবে এই মডেলগুলির সাথে তুলনা করার জন্য স্বাধীনতার উপযুক্ত ডিগ্রিগুলি কী কী? আমার হিসেব অনুসারে:

এফ=((এসএসRতোমার দর্শন লগ করা-এসএসতোমার দর্শন লগ করা)/(পি-))((এসএসতোমার দর্শন লগ করা)/(এন-পি-1))~এফপি-,এন-পি-1

আমরা মিশ্র-প্রভাবগুলির মডেলটিতে ফিক্সড এফেক্টস মডেল (opeাল এবং ইন্টারসেপ্ট) এবং আরও দুটি পরামিতি (এলোমেলো slাল এবং র্যান্ডম ইন্টারসেপ্টের জন্য ভেরিয়েন্স প্যারামিটার) অনুমান করছি। সাধারণত, ইন্টারসেপ্ট প্যারামিটারটি স্বাধীনতা গণনার ডিগ্রিতে গণনা করা হয় না, যাতে এবং বোঝায় ; বলার পরেও আমি নিশ্চিত নই যে এলোমেলো-প্রভাবের পরামিতিগুলির ভেরিয়েন্স প্যারামিটারগুলি স্বাধীনতা গণনার ডিগ্রিতে অন্তর্ভুক্ত করা উচিত; স্থির-প্রভাবের প্যারামিটারগুলির জন্য বৈকল্পিক অনুমানগুলি বিবেচনা করা হয় না , তবে আমি বিশ্বাস করি যে স্থির প্রভাবগুলির জন্য প্যারামিটারের অনুমানগুলি অজানা স্থায়ী হিসাবে ধরে নেওয়া হয় যখন তারা অজান্তে এলোমেলো ভেরিয়েবল হিসাবে বিবেচিত হয় il=1পি=+ +2=3মিশ্র প্রভাব জন্য। আমি এই বিষয়ে কিছু সহায়তার প্রশংসা করব।

শেষ পর্যন্ত, Rএই মডেলগুলির তুলনা করার জন্য কারও কাছে কি আরও উপযুক্ত ( ভিত্তিক) সমাধান রয়েছে?


4
তোমাদের স্থলাভিষিক্ত তাহলে lm()সঙ্গে gls()থেকে nlmeপ্যাকেজ, এবং lmer()সঙ্গে lme()(আবার থেকে nlmeপ্যাকেজ), সবকিছু ঠিক কাজ করবে। তবে মনে রাখবেন যে আপনি একটি রক্ষণশীল পরীক্ষা (খুব বড় পি- মূল্য) পাবেন, কারণ সহজ মডেলের পরামিতিগুলি প্যারামিটার স্পেসের সীমানায় রয়েছে। এবং সত্যই এলোমেলো প্রভাবগুলি অন্তর্ভুক্ত করবেন কিনা তা বাছাই তত্ত্বের ভিত্তিতে হওয়া উচিত (উদাহরণস্বরূপ, নমুনা পরিকল্পনা), কোনও পরিসংখ্যান পরীক্ষায় নয় on
কার্ল ওভে হুফথামার

1
আপনি মডেলদের সাথে কি করতে চান? একটি মডেল কিছু উদ্দেশ্যে উন্নত হতে পারে এবং অন্য উদ্দেশ্যে অন্য মডেলটি আরও ভাল। সমস্ত মডেল ভুল, তাই কোন মডেলটি সঠিক তা নয়, তবে এটি আপনার নির্দিষ্ট সমস্যার জন্য আরও কার্যকর।
কোডিওলজিস্ট 21 '40

1
@ কোডিওলজিস্ট মূলত, আমি নিশ্চিত করতে চাই যে স্থির প্রভাবগুলির জন্য প্যারামিটারের অনুমান নির্ভরযোগ্য। পর্যবেক্ষণগুলি স্বতন্ত্র বলে ধরে নেওয়া হলে এর মানগত ত্রুটিগুলি অবিশ্বাস্য হতে পারে। তদ্ব্যতীত, এলোমেলো প্রভাবটি কীভাবে পরিবর্তনশীল তা সম্পর্কে কিছু বক্তব্য দেওয়া ভাল হবে তবে আমি অনুমান করি এটি ততটা অত্যাবশ্যক নয়।
ব্যবহারকারী 9171

2
@ ব্যবহারকারী9171 কোনও মডেলের পরামিতি অনুমানগুলিতে স্থায়িত্ব (নির্ভরযোগ্যতা) যাচাই করার একটি ভাল উপায় হ'ল বুটস্ট্র্যাপিং ব্যবহার করা। প্রতিটি প্যারামিটারের জন্য গ্রাফ বুটস্ট্র্যাপ বিতরণ দুটি পরামিতি এবং মডেলের জন্য একটি গ্রাফ দিয়ে দুটি মডেল ভাগ করে। শক্ত বিতরণ উচ্চতর স্থায়িত্ব বোঝায়। আপনি সম্ভবত দেখতে পাবেন যে সহজ মডেলটি আরও স্থিতিশীল অনুমান দেয়, কারণ কম পরামিতি প্রতিটি প্যারামিটারের আরও সুনির্দিষ্ট অনুমানের অনুমতি দেয়।
কোডিওলজিস্ট

উত্তর:


6

প্রযুক্তিগতভাবে, আপনি কেবলমাত্র পরামিতিগুলির ক্রম পরিবর্তন করে এটি কাজ করতে পারেন:

> anova(fit.me, fit.fe) 

ঠিক কাজ করবে। আপনি যদি lmerপ্রথম দ্বারা উত্পন্ন কোনও বস্তুটি পাস করেন anova.merModতবে এর পরিবর্তে কল করা হবে anova.lm(যা কীভাবে lmerঅবজেক্টগুলি পরিচালনা করতে হয় তা জানে না )। দেখা:

?anova.merMod

যদিও, একটি মিশ্র মডেল বা একটি নির্দিষ্ট মডেল নির্বাচন করা একটি মডেলিংয়ের পছন্দ যা পরীক্ষামূলক নকশাকে বিবেচনায় নেওয়া দরকার, কোনও মডেল নির্বাচনের সমস্যা নয়। আরও তথ্যের জন্য @ বেনবোলকারের https://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#testing-significance-of-random- প্রভাবগুলি দেখুন :

এলোমেলো প্রভাবগুলির তাত্পর্য পরীক্ষা না করে বিবেচনা করুন।


+1 টি। আমি @ বেনবোলকারের এফএকিউতে একটি লিঙ্ক toোকানোর জন্য স্বাধীনতা নিয়েছি যাতে আরও কিছু আলোচনা এবং রেফারেন্স রয়েছে।
অ্যামিবা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.