এই সাইটের অন্য কোথাও একটি প্রশ্নের মধ্যে বেশ কয়েকটি উত্তরে উল্লেখ করা হয়েছে যে এআইসি লেভ-ওয়ান-আউট (এলইউ) ক্রস-বৈধকরণের সমতুল্য এবং বিআইসির কে-ফোল্ড ক্রস বৈধতার সমতুল্য। এটি কি আর-তে অভিজ্ঞতার সাথে দেখানোর কোনও উপায় আছে যে এলইউ এবং কে-ফোল্ডের সাথে জড়িত কৌশলগুলি এআইসি এবং বিআইসির মানগুলির সমতুল্য হিসাবে পরিষ্কার এবং প্রদর্শিত হয়েছে? ভাল মন্তব্য কোড এই ক্ষেত্রে সহায়ক হবে। তদতিরিক্ত, বিআইসি প্রদর্শনের সময় দয়া করে lme4 প্যাকেজটি ব্যবহার করুন। একটি নমুনা ডেটাসেটের জন্য নীচে দেখুন ...
library(lme4) #for the BIC function
generate.data <- function(seed)
{
set.seed(seed) #Set a seed so the results are consistent (I hope)
a <- rnorm(60) #predictor
b <- rnorm(60) #predictor
c <- rnorm(60) #predictor
y <- rnorm(60)*3.5+a+b #the outcome is really a function of predictor a and b but not predictor c
data <- data.frame(y,a,b,c)
return(data)
}
data <- generate.data(76)
good.model <- lm(y ~ a+b,data=data)
bad.model <- lm(y ~ a+b+c,data=data)
AIC(good.model)
BIC(logLik(good.model))
AIC(bad.model)
BIC(logLik(bad.model))
পূর্ববর্তী মন্তব্যগুলি অনুসারে, নীচে আমি 1 থেকে 10000 বীজের একটি তালিকা সরবরাহ করেছি যাতে এআইসি এবং বিআইসি একমত নয়। এটি উপলব্ধ বীজের মাধ্যমে একটি সাধারণ অনুসন্ধানের মাধ্যমে করা হয়েছিল, তবে কেউ যদি তথ্য উপাত্তের জন্য এমন কোনও উপায় সরবরাহ করতে পারে যা এই দুটি তথ্যের মানদণ্ড থেকে বিবিধ উত্তর সরবরাহ করতে পারে তবে এটি বিশেষত তথ্যবহুল হতে পারে।
notable.seeds <- read.csv("http://student.ucr.edu/~rpier001/res.csv")$seed
একদিকে যেমন আমি এআইসি এবং বিআইসির যে পরিমাণে এআইসি এবং বিআইসি এর সাথে দ্বিমত পোষণ করি না কেন এআইসি এবং বিআইসির নিখুঁত পার্থক্যের যোগফল হিসাবে সমান করার চেষ্টা করেছি সেগুলি দিয়ে এই বীজগুলি অর্ডার করার বিষয়ে আমি ভেবেছিলাম। উদাহরণ স্বরূপ,
AICDiff <- AIC(bad.model) - AIC(good.model)
BICDiff <- BIC(logLik(bad.model)) - BIC(logLik(good.model))
disagreement <- sum(abs(c(AICDiff,BICDiff)))
যেখানে আমার মতবিরোধ মেট্রিক কেবলমাত্র পর্যবেক্ষণগুলি উল্লেখযোগ্য হলেই যুক্তিসঙ্গতভাবে প্রযোজ্য। উদাহরণ স্বরূপ,
are.diff <- sum(sign(c(AICDiff,BICDiff)))
notable <- ifelse(are.diff == 0 & AICDiff != 0,TRUE,FALSE)
তবে যে ক্ষেত্রে এআইসি এবং বিআইসি অসম্মতি প্রকাশ করেছে, গণনা করা মতবিরোধের মান সর্বদা সমান (এবং নমুনা আকারের একটি কার্যকারিতা)। কীভাবে এআইসি এবং বিআইসির গণনা করা হচ্ছে তা পিছনে ফিরে তাকালে আমি দেখতে পাচ্ছি যে এটি কেন গণনাগতভাবেই কেস হতে পারে তবে আমি কেন জানি না কেন এটি ধারণাগতভাবে হবে। কেউ যদি সেই সমস্যাটিও ব্যাখ্যা করতে পারে তবে আমি এটির প্রশংসা করব।