কোন মডেলটি "সেরা ফিটিং মডেল" আপনার "সেরা" বলতে যা বোঝায় তার উপর নির্ভর করে। আর এর কাছে সহায়তার জন্য সরঞ্জাম রয়েছে তবে তাদের মধ্যে চয়ন করার জন্য আপনাকে "সেরা" জন্য সংজ্ঞা প্রদান করতে হবে। নিম্নলিখিত উদাহরণস্বরূপ ডেটা এবং কোড বিবেচনা করুন:
x <- 1:10
y <- x + c(-0.5,0.5)
plot(x,y, xlim=c(0,11), ylim=c(-1,12))
fit1 <- lm( y~offset(x) -1 )
fit2 <- lm( y~x )
fit3 <- lm( y~poly(x,3) )
fit4 <- lm( y~poly(x,9) )
library(splines)
fit5 <- lm( y~ns(x, 3) )
fit6 <- lm( y~ns(x, 9) )
fit7 <- lm( y ~ x + cos(x*pi) )
xx <- seq(0,11, length.out=250)
lines(xx, predict(fit1, data.frame(x=xx)), col='blue')
lines(xx, predict(fit2, data.frame(x=xx)), col='green')
lines(xx, predict(fit3, data.frame(x=xx)), col='red')
lines(xx, predict(fit4, data.frame(x=xx)), col='purple')
lines(xx, predict(fit5, data.frame(x=xx)), col='orange')
lines(xx, predict(fit6, data.frame(x=xx)), col='grey')
lines(xx, predict(fit7, data.frame(x=xx)), col='black')
এই মডেলগুলির মধ্যে কোনটি সেরা? তাদের কারও পক্ষে যুক্তি দেওয়া যেতে পারে (তবে আমি একজনের জন্য বেগুনি রঙটি দ্রবণের জন্য ব্যবহার করতে চাই না)।