আমার সাধারণ বোঝাপড়াটি হ'ল এআইসি মডেলের ফিটনেসের ধার্মিকতা এবং মডেলের জটিলতার মধ্যে বাণিজ্য বন্ধের বিষয়ে ডিল করে।
মডেলটিতে k = পরামিতির সংখ্যা
= সম্ভাবনা
Bayesian তথ্য নির্ণায়ক সাথে BIC ঘনিষ্ঠভাবে AIC.The এআইসি সঙ্গে সম্পর্কযুক্ত কম দৃঢ়ভাবে চেয়ে BIC দিয়েছেন করে পরামিতি সংখ্যা স্থগিত। আমি দেখতে পাচ্ছি যে এই দুটি তিহাসিকভাবে সর্বত্র ব্যবহৃত হয়। তবে জেনারেলাইজড ক্রস বৈধকরণ (জিসিভি) আমার কাছে নতুন। কীভাবে জিসিভি বিআইসি বা এআইসির সাথে সম্পর্কিত হতে পারে? এই মানদণ্ডগুলি কীভাবে একত্রে বা পৃথকভাবে পেনালাইজড রিগ্রেশনের মতো পেনালাইজ পদে বাছাইয়ের ক্ষেত্রে ব্যবহৃত হয়?
সম্পাদনা: চিন্তা ও আলোচনা করার জন্য এখানে একটি উদাহরণ রয়েছে:
require(lasso2)
data(Prostate)
require(rms)
ridgefits = ols(lpsa~lcavol+lweight+age+lbph+svi+lcp+gleason+pgg45,
method="qr", data=Prostate,se.fit = TRUE, x=TRUE, y=TRUE)
p <- pentrace(ridgefits, seq(0,1,by=.01))
effective.df(ridgefits,p)
out <- p$results.all
par(mfrow=c(3,2))
plot(out$df, out$aic, col = "blue", type = "l", ylab = "AIC", xlab = "df" )
plot(out$df, out$bic, col = "green4", type = "l", ylab = "BIC", xlab = "df" )
plot(out$penalty, out$df, type = "l", col = "red",
xlab = expression(paste(lambda)), ylab = "df" )
plot(out$penalty, out$aic, col = "blue", type = "l",
ylab = "AIC", xlab = expression(paste(lambda)) )
plot(out$penalty, out$bic, col = "green4", type = "l", ylab = "BIC",
xlab= expression(paste(lambda))
require(glmnet)
y <- matrix(Prostate$lpsa, ncol = 1)
x <- as.matrix (Prostate[,- length(Prostate)])
cv <- cv.glmnet(x,y,alpha=1,nfolds=10)
plot(cv$lambda, cv$cvm, col = "red", type = "l",
ylab = "CVM", xlab= expression(paste(lambda))