একটি সাধারণ রৈখিক মডেলের সাথে একটি মিশ্র মডেল (এলোমেলো প্রভাব হিসাবে বিষয়) তুলনা করা (একটি স্থির প্রভাব হিসাবে বিষয়)


10

আমি একটি বিশাল সংখ্যক ডেটা বিশ্লেষণ শেষ করছি। আমি কাজের প্রথম অংশে ব্যবহৃত লিনিয়ার মডেলটি নিতে চাই এবং লিনিয়ার মিশ্রিত মডেল (এলএমই) ব্যবহার করে এটি পুনরায় ফিট করতে চাই। মডেলটিতে ব্যবহৃত ভেরিয়েবলগুলির মধ্যে একটি এলোমেলো প্রভাব হিসাবে ব্যবহৃত হবে এমন ব্যতিক্রমের সাথে এলএমই খুব একই রকম হবে। এই ডেটাটি অনেকগুলি পর্যবেক্ষণ (> 1000) থেকে সাবজেক্টের একটি ছোট গ্রুপে (10 ডলার) আসে এবং আমি জানি যে বিষয়টির প্রভাবকে মডেলিং এলোমেলো প্রভাব হিসাবে আরও ভাল করা হয় (এটি আমি পরিবর্তন করতে চাই এটি একটি পরিবর্তনশীল)। আর কোডটি দেখতে এমন হবে:

my_modelB <- lm(formula = A ~ B + C + D)    
lme_model <- lme(fixed=A ~ B + C, random=~1|D, data=my_data, method='REML')

সব কিছু ঠিকঠাক হয় এবং ফলাফলগুলি একই রকম হয়। এই দুটি মডেলের তুলনা করতে এবং কোনটি সবচেয়ে উপযুক্ত তা সিদ্ধান্ত নেওয়ার জন্য আমি যদি আরএলআরসিম বা কোনও এআইসি / বিআইসির মতো কিছু ব্যবহার করতে পারি তবে ভাল লাগবে। আমার সহকর্মীরা এলএমই রিপোর্ট করতে চায় না কারণ বেছে নেওয়ার কোনও সহজেই সহজতর উপায় নেই যা "আরও ভাল", যদিও আমি মনে করি এলএমই আরও উপযুক্ত মডেল। কোন পরামর্শ?

উত্তর:


6

এটি @ অ্যাক্রামের উত্তরে যুক্ত করা কারণ মন্তব্য হিসাবে পোস্ট করা খুব দীর্ঘ। আমি A ~ B + Cআপনার নাল মডেল হিসাবে বিবেচনা করব যাতে আপনি Dনেস্টেড মডেল সেটআপে একটি আস্তে আস্তে র্যান্ডম ইন্টারসেপ্টের পরিসংখ্যানিক তাত্পর্যটি মূল্যায়ন করতে পারেন । হিসাবে ocram নির্দিষ্ট, নিয়মানুবর্তিতা অবস্থার লঙ্ঘিত হয় যখন , এবং সম্ভাবনা অনুপাত পরীক্ষার পরিসংখ্যান (LRT) অগত্যা এসিম্পটোটিকভাবে বিতরণ করা হবে না χ 2 । আমি যে সমাধানটি শিখিয়েছি তা হ'ল এলআরটি (যার বুটস্ট্র্যাপ বিতরণ সম্ভবত χ 2 হবে না ) প্যারাম্যাট্রিকভাবে এবং বুটস্ট্র্যাপের পি-ভ্যালু এর মতো গণনা করা:এইচ0:σ2=0χ2χ2

library(lme4)
my_modelB <- lm(formula = A ~ B + C)
lme_model <- lmer(y ~ B + C + (1|D), data=my_data, REML=F)
lrt.observed <- as.numeric(2*(logLik(lme_model) - logLik(my_modelB)))
nsim <- 999
lrt.sim <- numeric(nsim)
for (i in 1:nsim) {
    y <- unlist(simulate(mymodlB))
    nullmod <- lm(y ~ B + C)
    altmod <- lmer(y ~ B + C + (1|D), data=my_data, REML=F)
    lrt.sim[i] <- as.numeric(2*(logLik(altmod) - logLik(nullmod)))
}
mean(lrt.sim > lrt.observed) #pvalue

বুটস্ট্র্যাপযুক্ত এলআরটিগুলির অনুপাত আরও চরম যে পর্যবেক্ষণ করা এলআরটি হল পি-মান value


আমার উত্তরটি সম্পূর্ণ করার জন্য আপনাকে ধন্যবাদ। এছাড়াও, কখনও কখনও লোকেরা পরীক্ষার পরিসংখ্যানগুলির জন্য চি-স্কোয়ার বিতরণের পরিবর্তে চি-স্কোয়ারের মিশ্রণ ব্যবহার করে।
অক্টোবরে

পরিবর্তনটিকে এলোমেলো হিসাবে বিবেচনা করা হবে বা বিশ্লেষণ থেকে পৃথক করে স্থির করা হবে কিনা সে বিষয়ে আপনার মন্তব্যের জন্য @ ক্রাম +1। @ মুডফুড যদি আপনার পিআই বিষয়টি বুঝতে না পারে এবং পি-ভ্যালুতে জোর দেয় তবে সম্ভবত তাকে এলোমেলো প্রভাবের পরীক্ষার ফলাফলটি দেখান (যা আপনি লেখার ক্ষেত্রে অন্তর্ভুক্ত করবেন)।
লকডঅফ

কোডের জন্য ধন্যবাদ। যখন আমি এটা দৌড়ে ফলাফলের স্থানে বুট-স্ট্র্যাপ LRTs কেউই, পর্যবেক্ষিত তার চেয়ে অনেক বেশী, তাই এর অর্থ এই যে আমি র্যান্ডম প্রভাব বা এমনকি মূল পরিবর্তনশীল নিক্ষিপ্ত ছাড়া LM বিদ্ধ করতে পারেন।
MudPhud

@ মুডফুড: আপনার কোনও ত্রুটি হয়েছে? lrt.simতারা সমস্ত শূন্য নয় তা নিশ্চিত করার জন্য টাইপ করার চেষ্টা করুন , সেক্ষেত্রে সম্ভবত আপনার প্যাকেজ lme4ইনস্টল না হওয়ার সম্ভাবনা সবচেয়ে বেশি অপরাধী হতে পারে ।
লকঅফ অফ

এগুলি 0 টি নয়, পর্যবেক্ষণের তুলনায় খুব ছোট (e 1e-6) (63.95) 95
মুডফুড 21

2

0এইচ0:বনামএকটিRআমিএকটিএন=0এইচ1:বনামএকটিRআমিএকটিএন>0...

সম্পাদনা

বিভ্রান্তি এড়াতে: উপরে বর্ণিত পরীক্ষাটি মাঝে মাঝে এলোমেলো প্রভাবটি তাৎপর্যপূর্ণ কিনা তা সিদ্ধান্ত নিতে ব্যবহৃত হয় ... তবে এটি একটি নির্দিষ্ট প্রভাবের মধ্যে রূপান্তরিত করা উচিত কি না তা সিদ্ধান্ত নিতে নয়।


প্রশ্নটি হল: ভেরিয়েবলটি কোনও মিশ্র প্রভাব বা এলোমেলো প্রভাব হিসাবে মডেল করা উচিত কিনা তা সিদ্ধান্ত নেওয়ার জন্য পরীক্ষা আছে? অন্যথায় আপনি বর্ণিত পরীক্ষাটি করতে পারেন এবং তারপরে এটি একটি চি-স্কোয়ার ডিস্টের সাথে পরীক্ষা করতে পারেন (উপযুক্ত পরীক্ষাটি কী হবে তা আমি নিশ্চিত নই)।
মুডফুড

2
@ মুডফুড: অধ্যয়ন পরিকল্পনা হওয়ার পরে বিশ্লেষণের আগে স্থির হিসাবে বা একটি এলোমেলো প্রভাব হিসাবে একটি পরিবর্তনশীল মডেলিংয়ের সিদ্ধান্ত নেওয়া উচিত। এটি নির্ভর করে আপনার বিশেষত সিদ্ধান্তের ক্ষেত্রের উপর। এলোমেলো প্রভাব আরও সাধারণীকরণের অনুমতি দেয়। এটি কিছু প্রযুক্তিগত অসুবিধাও এড়াতে পারে। উদাহরণস্বরূপ, প্যারামিটারগুলির সংখ্যা যখন বেড়ে যায় তখন অ্যাসিপটোটিকগুলি ভেঙে যেতে পারে, কারণ এটি যখন অনেক স্তরের একটি শ্রেণিবদ্ধ পরিবর্তনশীল একটি স্থির পরিবর্তনশীল হিসাবে বিবেচিত হয়।
অক্টোবরে

আমি সম্মত, কিন্তু যখন আমি আমার পিআইকে এটি ব্যাখ্যা করার চেষ্টা করলাম তখন তিনি কেবল ঘুরে দাঁড়ালেন এবং কোনও ধরণের পি-মান জিজ্ঞাসা করলেন। আমি এই বিশ্লেষণটিকে একটি পাণ্ডুলিপিতে অন্তর্ভুক্ত করতে চাই, তবে যদি এর চেয়ে বেশি দৃ concrete় সমর্থন না হয় তবে তিনি এটিকে রাখবেন না।
মুডফুড

1
@ মুডফুড: আমার জ্ঞানের সর্বোপরি, এই জাতীয় সিদ্ধান্তের কোনও মূল্য নেই। যদি নির্দিষ্ট স্তরের প্রভাবের জন্য আগ্রহী কেন্দ্রগুলি বেছে নেওয়া হয় তবে এটি স্থির হিসাবে বিবেচনা করা উচিত। যদি উপলব্ধ ফ্যাক্টর স্তরগুলি একটি বৃহত জনসংখ্যার থেকে এলোমেলো নমুনা হিসাবে দেখা হয় এবং বৃহত্তর জনসংখ্যার জন্য যে সূত্রগুলি চাওয়া হয়, তবে এফেক্টটি এলোমেলো হওয়া উচিত।
অক্টোবরে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.