এর একটি সম্ভাব্য ব্যাখ্যা হ'ল আপনার ফলাফল এবং ভবিষ্যদ্বাণীকের মধ্যে সম্পর্কের ক্ষেত্রে অলংকার্যতা।
এখানে একটি ছোট উদাহরণ। আমরা একটি পূর্বাভাসকারী ব্যবহার করি যা [ - 1 , 1 ] তে অভিন্ন । ফলাফল যাই হোক, না সুসংগত predictor উপর নির্ভর করে, কিন্তু উপর বর্গ 'সত্য' জন্য উভয় সম্ভাবনা বেশি হয়: predictor এর x ≈ - 1 এবং x ≈ 1 জন্য, কিন্তু কম সম্ভবত x ≈ 0 । এই ক্ষেত্রে, একটি রৈখিক মডেল তুচ্ছ হয়ে উঠবে, তবে ভবিষ্যদ্বাণীকে অন্তরগুলিতে কাটা এটি তাৎপর্যপূর্ণ করে তোলে।
> set.seed(1)
> nn <- 1e3
> xx <- runif(nn,-1,1)
> yy <- runif(nn)<1/(1+exp(-xx^2))
>
> library(lmtest)
>
> model_0 <- glm(yy~1,family="binomial")
> model_1 <- glm(yy~xx,family="binomial")
> lrtest(model_1,model_0)
Likelihood ratio test
Model 1: yy ~ xx
Model 2: yy ~ 1
#Df LogLik Df Chisq Pr(>Chisq)
1 2 -676.72
2 1 -677.22 -1 0.9914 0.3194
>
> xx_cut <- cut(xx,c(-1,-0.3,0.3,1))
> model_2 <- glm(yy~xx_cut,family="binomial")
> lrtest(model_2,model_0)
Likelihood ratio test
Model 1: yy ~ xx_cut
Model 2: yy ~ 1
#Df LogLik Df Chisq Pr(>Chisq)
1 3 -673.65
2 1 -677.22 -2 7.1362 0.02821 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
তবে এর অর্থ এই নয় যে ভবিষ্যদ্বাণীকে বিবেচনা করা সেরা পদ্ধতির best (এটি কখনই হয় না)) স্প্লাইনস বা অনুরূপ ব্যবহার করে অরৈখিকতার মডেল করা আরও ভাল ।