এটি আসলে একটি অত্যন্ত পরিশীলিত সমস্যা এবং আপনার প্রভাষকের কাছ থেকে একটি শক্ত জিজ্ঞাসা!
আপনি কীভাবে আপনার ডেটাটি সংগঠিত করেন তার পরিপ্রেক্ষিতে একটি 1070 x 10 আয়তক্ষেত্র ঠিক আছে। উদাহরণস্বরূপ, আর এ:
> conflict.data <- data.frame(
+ confl = sample(0:1, 1070, replace=T),
+ country = factor(rep(1:107,10)),
+ period = factor(rep(1:10, rep(107,10))),
+ landdeg = sample(c("Type1", "Type2"), 1070, replace=T),
+ popincrease = sample(0:1, 1070, replace=T),
+ liveli =sample(0:1, 1070, replace=T),
+ popden = sample(c("Low", "Med", "High"), 1070, replace=T),
+ NDVI = rnorm(1070,100,10),
+ NDVIdecl1 = sample(0:1, 1070, replace=T),
+ NDVIdecl2 = sample(0:1, 1070, replace=T))
> head(conflict.data)
confl country period landdeg popincrease liveli popden NDVI NDVIdecl1 NDVIdecl2
1 1 1 1 Type1 1 0 Low 113.4744 0 1
2 1 2 1 Type2 1 1 High 103.2979 0 0
3 0 3 1 Type2 1 1 Med 109.1200 1 1
4 1 4 1 Type2 0 1 Low 112.1574 1 0
5 0 5 1 Type1 0 0 High 109.9875 0 1
6 1 6 1 Type1 1 0 Low 109.2785 0 0
> summary(conflict.data)
confl country period landdeg popincrease liveli popden NDVI NDVIdecl1 NDVIdecl2
Min. :0.0000 1 : 10 1 :107 Type1:535 Min. :0.0000 Min. :0.0000 High:361 Min. : 68.71 Min. :0.0000 Min. :0.0000
1st Qu.:0.0000 2 : 10 2 :107 Type2:535 1st Qu.:0.0000 1st Qu.:0.0000 Low :340 1st Qu.: 93.25 1st Qu.:0.0000 1st Qu.:0.0000
Median :1.0000 3 : 10 3 :107 Median :1.0000 Median :1.0000 Med :369 Median : 99.65 Median :1.0000 Median :0.0000
Mean :0.5009 4 : 10 4 :107 Mean :0.5028 Mean :0.5056 Mean : 99.84 Mean :0.5121 Mean :0.4888
3rd Qu.:1.0000 5 : 10 5 :107 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:106.99 3rd Qu.:1.0000 3rd Qu.:1.0000
Max. :1.0000 6 : 10 6 :107 Max. :1.0000 Max. :1.0000 Max. :130.13 Max. :1.0000 Max. :1.0000
(Other):1010 (Other):428
> dim(conflict.data)
[1] 1070 10
কোনও মডেল ফিট করার জন্য, @ gui11aume এর প্রস্তাবিত গ্ল্যাম () ফাংশনটি বেসিকগুলি করবে ...
mod <- glm(confl~., family="binomial", data=conflict.data)
anova(mod)
... তবে এতে একটি সমস্যা রয়েছে যা এটি "দেশকে" বিবেচনা করে (আমি ধরে নিচ্ছি যে আপনার দেশটি আপনার 107 ইউনিট হিসাবে রয়েছে) একটি স্থির প্রভাব হিসাবে, যেখানে এলোমেলো প্রভাব বেশি উপযুক্ত। এটি পিরিয়ডকে একটি সাধারণ ফ্যাক্টর হিসাবে বিবেচনা করে, কোনও স্বতঃসংশ্লিষ্টকরণ অনুমোদিত নয়।
আপনি প্রথম সমস্যাটি সমাধান করতে পারবেন যেমন হিসাবে মিশ্র প্রভাব মডেল রৈখিক একটি সাধারণ বেটস এট এর lme4 আর প্যাকেজ এই কিছু দিক একটা চমৎকার ভূমিকা এখানে । কিছুটা এইরকম
library(lme4)
mod2 <- lmer(confl ~ landdeg + popincrease + liveli + popden +
NDVI + NDVIdecl1 + NDVIdecl2 + (1|country) +(1|period), family=binomial,
data=conflict.data)
summary(mod2)
এক ধাপ এগিয়ে হবে।
এখন আপনার শেষ অবশিষ্ট সমস্যাটি আপনার 10 পিরিয়ড জুড়ে স্বতঃসংশ্লিষ্ট। মূলত, প্রতিটি দেশে আপনার 10 ডেটা পয়েন্টগুলি এতটা মূল্যবান নয় যতগুলি সেগুলি এলোমেলোভাবে বেছে নেওয়া হয়েছে স্বাধীন এবং অভিন্ন বিতরণকারী পয়েন্ট। আমি নরমাল প্রতিক্রিয়াযুক্ত বহুস্তরের মডেলের অবশিষ্টাংশগুলিতে স্বতঃসংশ্লিষ্টকরণের জন্য বিস্তৃতভাবে উপলব্ধ সফ্টওয়্যার সমাধান সম্পর্কে সচেতন নই। অবশ্যই এটি lme4 এ প্রয়োগ করা হয়নি। অন্যরা হয়তো আমার চেয়ে বেশি জানেন।