আমি রিজ, লাসো এবং ইলাস্টিক নেট দিয়ে নির্বাচিত মডেলগুলির সাথে তুলনা করতে চাই। চিত্র 3 নীচে সমস্ত 3 পদ্ধতি ব্যবহার করে সহগের পথ দেখায়: রিজ (চিত্র এ, আলফা = 0), লাসো (চিত্র বি; আলফা = 1) এবং ইলাস্টিক নেট (চিত্র সি; আলফা = 0.5)। অনুকূল সমাধান লাম্বদার নির্বাচিত মানের উপর নির্ভর করে, যা ক্রস বৈধতার ভিত্তিতে বেছে নেওয়া হয়।
এই প্লটগুলির দিকে তাকানোর সময়, আমি প্রত্যাশা করব যে ইলাস্টিক নেট (চিত্র সি) একটি গ্রুপিং প্রভাব প্রদর্শন করবে। তবে উপস্থাপিত ক্ষেত্রে এটি পরিষ্কার নয়। লাসো এবং ইলাস্টিক নেট এর সহগের পথটি খুব মিল। এর কারণ কী হতে পারে? এটা কি কেবল কোডিং ভুল? আমি নিম্নলিখিত কোডটি আর-তে ব্যবহার করেছি:
library(glmnet)
X<- as.matrix(mydata[,2:22])
Y<- mydata[,23]
par(mfrow=c(1,3))
ans1<-cv.glmnet(X, Y, alpha=0) # ridge
plot(ans1$glmnet.fit, "lambda", label=FALSE)
text (6, 0.4, "A", cex=1.8, font=1)
ans2<-cv.glmnet(X, Y, alpha=1) # lasso
plot(ans2$glmnet.fit, "lambda", label=FALSE)
text (-0.8, 0.48, "B", cex=1.8, font=1)
ans3<-cv.glmnet(X, Y, alpha=0.5) # elastic net
plot(ans3$glmnet.fit, "lambda", label=FALSE)
text (0, 0.62, "C", cex=1.8, font=1)
ইলাস্টিক নেট কোফিয়েনটিস পাথ প্লট করতে ব্যবহৃত কোডটি রিজ এবং লাসোর মতোই একই। পার্থক্যটি কেবল আলফার মানেই the ইলাস্টিক নেট রিগ্রেশন জন্য আলফা প্যারামিটারটি লাম্বদা মানগুলির সাথে সংশ্লিষ্ট সর্বনিম্ন এমএসই (অর্থাত স্কোয়ার ত্রুটি) এর ভিত্তিতে নির্বাচন করা হয়েছিল।
আপনার সাহায্যের জন্য ধন্যবাদ !