প্রসঙ্গ
এই প্রশ্নটি আর ব্যবহার করে তবে সাধারণ পরিসংখ্যানগত সমস্যা সম্পর্কে।
আমি সময়ের সাথে মথ জনসংখ্যা বৃদ্ধির হারের উপর মৃত্যুর কারণগুলির (রোগ ও পরজীবীতার কারণে% মৃত্যুর) প্রভাবগুলি বিশ্লেষণ করছি, যেখানে লার্ভা জনসংখ্যাগুলি 12 টি সাইট থেকে 8 বছরের জন্য একবার একবার নমুনা করা হয়েছিল। জনসংখ্যা বৃদ্ধির হারের ডেটা সময়ের সাথে একটি পরিষ্কার তবে অনিয়মিত চক্রাকার প্রবণতা প্রদর্শন করে।
একটি সাধারণ জেনারেলাইজড লিনিয়ার মডেলের অবশিষ্টাংশগুলি (বৃদ্ধির হার ~% রোগ +% পরজীবিতা + বছর) সময়ের সাথে একইভাবে পরিষ্কার কিন্তু অনিয়মিত চক্রীয় প্রবণতা প্রদর্শন করেছে। অতএব, একই আকারের সাধারণী সর্বনিম্ন স্কোয়ার মডেলগুলিকে অস্থায়ী স্বতঃসংশোধন, উদাহরণস্বরূপ যৌগিক প্রতিসাম্য, স্বতঃসংশোধক প্রক্রিয়া অর্ডার 1 এবং অটোরেগ্রেসিভ মুভিং গড় পারস্পরিক সম্পর্ক সম্পর্কিত কাঠামো মোকাবেলায় উপযুক্ত পারস্পরিক কাঠামোগুলির সাথে ডেটাও লাগানো হয়েছিল।
সমস্ত মডেলগুলিতে একই স্থির প্রভাব রয়েছে, এআইসি ব্যবহার করে তুলনা করা হয়েছিল, এবং আরইএমএল দ্বারা লাগানো হয়েছিল (এআইসি দ্বারা বিভিন্ন পারস্পরিক সম্পর্ক কাঠামোর তুলনা করার জন্য)। আমি আর প্যাকেজ nlme এবং gls ফাংশন ব্যবহার করছি।
প্রশ্ন 1
সময়ের বিপরীতে যখন প্লট করা হয় তখনও জিএলএস মডেলগুলির অবশিষ্টাংশগুলি প্রায় একই রকম চক্রীয় নিদর্শনগুলি প্রদর্শন করে। এমন নিদর্শনগুলি কি সর্বদা থাকবে, এমনকি এমন মডেলগুলিতেও যা স্বতঃসংশ্লিষ্ট কাঠামোর জন্য সঠিকভাবে অ্যাকাউন্ট করে?
আমি আমার দ্বিতীয় প্রশ্নের নীচে আর-তে কিছু সরলীকৃত তবে অনুরূপ ডেটা সিমুলেটেড করেছি, যা মডেল অবশিষ্টাংশগুলিতে অস্থায়ীভাবে স্বতঃসংশ্লিষ্ট প্যাটার্নগুলি মূল্যায়নের জন্য প্রয়োজনীয় পদ্ধতিগুলি সম্পর্কে আমার বর্তমান বোঝার উপর ভিত্তি করে বিষয়টি দেখায় , যা আমি জানি এখন ভুল (উত্তর দেখুন)।
প্রশ্ন 2
আমি আমার ডেটাতে সমস্ত সম্ভাব্য প্রশ্রয়যোগ্য পারস্পরিক সম্পর্ক কাঠামো সহ জিএলএস মডেলগুলি ফিট করেছি, তবে কোনও সম্পর্ক সম্পর্কিত কাঠামো ছাড়া GLM এর তুলনায় আসলে কোনওটিই যথেষ্ট ভাল নয়: কেবলমাত্র একটি জিএলএস মডেল প্রান্তিকভাবে উন্নত (এআইসি স্কোর = 1.8 নিম্ন), বাকি সমস্ত আছে উচ্চতর AIC মান। যাইহোক, এটি কেবল তখনই ঘটে যখন সমস্ত মডেলগুলি আরএমএল দ্বারা লাগানো হয়, এমএল নয় যেখানে জিএলএস মডেলগুলি স্পষ্টভাবে অনেক বেশি ভাল হয় তবে আমি স্ট্যাটাস বই থেকে বুঝতে পারি যে আপনাকে কেবল ভিন্ন সম্পর্কের কাঠামোর সাথে মডেলগুলির তুলনা করতে কেবল আরএমএল ব্যবহার করতে হবে এবং কারণগুলির জন্য একই স্থির প্রভাবগুলি আমি এখানে বিস্তারিত করব না।
ডেটার স্পষ্টভাবে অস্থায়ীভাবে স্ব-সংযুক্তিযুক্ত প্রকৃতি প্রদত্ত, যদি কোনও মডেল সাধারণ জিএলএমের তুলনায় পরিমিতরূপে আরও ভাল না হয় তবে কোন মডেলটি অনুমানের জন্য ব্যবহার করা উচিত তা সিদ্ধান্ত নেওয়ার সবচেয়ে উপযুক্ত উপায় কী, ধরে নিলাম আমি একটি উপযুক্ত পদ্ধতি ব্যবহার করছি (আমি শেষ পর্যন্ত ব্যবহার করতে চাই বিভিন্ন পরিবর্তনশীল সংমিশ্রণের তুলনায় এআইসি)?
Q1 'সিমুলেশন' উপযুক্ত পারস্পরিক কাঠামো সহ এবং ছাড়াই মডেলগুলিতে অবশিষ্ট অবধি অন্বেষণ করে
'সময়' এর একটি চক্রীয় প্রভাব এবং 'x' এর ধনাত্মক রৈখিক প্রভাব সহ সিমুলেটেড প্রতিক্রিয়া পরিবর্তনশীল উত্পন্ন করুন:
time <- 1:50
x <- sample(rep(1:25,each=2),50)
y <- rnorm(50,5,5) + (5 + 15*sin(2*pi*time/25)) + (x/1)
y এর এলোমেলো প্রকরণের সাথে 'সময়ের' উপর একটি চক্রীয় প্রবণতা প্রদর্শন করা উচিত:
plot(time,y)
এবং এলোমেলো পরিবর্তনের সাথে 'x' এর সাথে একটি ইতিবাচক রৈখিক সম্পর্ক:
plot(x,y)
"Y ~ টাইম + এক্স" এর একটি সাধারণ লিনিয়ার অ্যাডিটিভ মডেল তৈরি করুন:
require(nlme)
m1 <- gls(y ~ time + x, method="REML")
প্রত্যাশার মতো 'সময়' র বিরুদ্ধে ষড়যন্ত্র করার সময় এই মডেলটি অবশিষ্টাংশগুলিতে স্পষ্ট চক্রীয় নিদর্শনগুলি প্রদর্শন করে:
plot(time, m1$residuals)
এবং 'এক্স' এর বিরুদ্ধে ষড়যন্ত্র করার সময় অবশিষ্টাংশগুলিতে কোনও ধরণ বা প্রবণতার কোনও সুন্দর, স্পষ্ট অভাব কী হওয়া উচিত:
plot(x, m1$residuals)
"Y ~ টাইম + এক্স" এর একটি সাধারণ মডেল যার সাথে অর্ডার 1 এর একটি অটোরিগ্রেসিভ পারস্পরিক সম্পর্ক রয়েছে A
m2 <- gls(y ~ time + x, correlation = corAR1(form=~time), method="REML")
AIC(m1,m2)
যাইহোক, মডেলটির এখনও প্রায় অভিন্ন 'অস্থায়ী' স্বতঃআরঙ্কিত অবশিষ্টাংশগুলি প্রদর্শন করা উচিত:
plot(time, m2$residuals)
কোন পরামর্শের জন্য আপনাকে অনেক ধন্যবাদ।