সম্ভবত সমস্ত 15 টি এলএম মডেল দেখে ধাপে ধাপে রিগ্রেশন কীভাবে করা হচ্ছে তা বোঝা সহজ হবে।
সমস্ত 15 টি সংমিশ্রনের জন্য সূত্র উত্পন্ন করার জন্য এখানে একটি কুইকি রয়েছে।
library(leaps)
tmp<-regsubsets(mpg ~ wt + drat + disp + qsec, data=mtcars, nbest=1000, really.big=T, intercept=F)
all.mods <- summary(tmp)[[1]]
all.mods <- lapply(1:nrow(all.mods, function(x)as.formula(paste("mpg~", paste(names(which(all.mods[x,])), collapse="+"))))
head(all.mods)
[[1]]
mpg ~ drat
<environment: 0x0000000013a678d8>
[[2]]
mpg ~ qsec
<environment: 0x0000000013a6b3b0>
[[3]]
mpg ~ wt
<environment: 0x0000000013a6df28>
[[4]]
mpg ~ disp
<environment: 0x0000000013a70aa0>
[[5]]
mpg ~ wt + qsec
<environment: 0x0000000013a74540>
[[6]]
mpg ~ drat + disp
<environment: 0x0000000013a76f68>
প্রতিটি মডেলের জন্য এআইসির মানগুলি এর সাথে বের করা হয়:
all.lm<-lapply(all.mods, lm, mtcars)
sapply(all.lm, extractAIC)[2,]
[1] 97.98786 111.77605 73.21736 77.39732 63.90843 77.92493 74.15591 79.02978 91.24052 71.35572
[11] 63.89108 65.90826 78.68074 72.97352 65.62733
আসুন আপনার স্টেপ-রিগ্রেশনটিতে ফিরে যান। Lm (mpg ~ wt + drat + disp + qsec) এর এক্সট্রাকএইচ মান 65.63 (উপরের তালিকার 15 মডেলের সমতুল্য)।
যদি মডেলটি ডিসপ্লে (-ডিস্প) অপসারণ করে তবে lm (mpg ~ wt + drat + qsec) 63.891 (বা তালিকার মডেল 11)।
যদি মডেলটি কোনও কিছুই অপসারণ না করে (কিছুই না) তবে এআইসি এখনও 65.63 is
যদি মডেলটি qsec (-qsec) অপসারণ করে তবে lm (mpg ~ wt + drat + disp) 65.908 (মডেল 12)।
প্রভৃতি
মূলত সংক্ষিপ্তসারটি আপনার সম্পূর্ণ মডেল থেকে এক-টার্মের সমস্ত ধাপে ধাপে অপসারণের বিষয়টি প্রকাশ করে এবং এক্সট্রাকএইসি মানটিকে আরোহণের ক্রমে তালিকাভুক্ত করে তুলনা করে। যেহেতু ছোট এআইসির মানটি সত্যের মডেলের অনুরূপ হওয়ার সম্ভাবনা বেশি, তাই ধাপে ধাপে (-ডিস্প) মডেলটি ধরে রাখুন।
প্রক্রিয়াটি আবার পুনরাবৃত্তি করা হয়, তবে প্রারম্ভিক পয়েন্ট হিসাবে ধরে রাখা (-ডিস্প) মডেল দিয়ে। শর্তাদি হয় হয় বিয়োগফল ("পিছনে") বা বিয়োগ / যোগ ("উভয়") মডেলের তুলনা করতে অনুমতি দেয়। যেহেতু তুলনায় সর্বনিম্ন এআইসির মান এখনও (-ডিস্প) মডেল, প্রক্রিয়া বন্ধ এবং ফলস্বরূপ মডেলগুলি দেওয়া হয়।
আপনার প্রশ্নের প্রসঙ্গে: "পদক্ষেপের বাছাইয়ে আবার + ডিসপ্লে যোগ করে ফাংশনটি কী অর্জন করার চেষ্টা করছে?", এই ক্ষেত্রে, এটি আসলে কিছুই করে না, সমস্ত 15 মডেলের মধ্যে সেরা মডেল 11 মডেল , অর্থাত্ lm (mpg ~ wt + drat + qsec)।
যাইহোক, জটিল মডেলগুলিতে বিপুল সংখ্যক ভবিষ্যদ্বাণীকারী যাদের সমাধানের জন্য অসংখ্য পদক্ষেপের প্রয়োজন রয়েছে তাদের মধ্যে শর্তগুলির তুলনার সর্বাধিক বিস্তৃত উপায় প্রদানের জন্য প্রাথমিকভাবে মুছে ফেলা একটি পদ যুক্ত করা সমালোচিত।
আশা করি কোনওভাবে এই সহায়তা করবে।