র্যান্ডম ফরেস্ট বা এক্সট্রিম গ্রেডিয়েন্ট বুস্টিং (এক্সজিবিস্ট) এর মতো অ্যালগোরিদম ব্যবহার করার সময় প্রতিটি পূর্বাভাসিত মানের জন্য একটি আত্মবিশ্বাসের স্কোর (আমরা এটিকে আত্মবিশ্বাসের মান বা সম্ভাবনাও বলতে পারি) পেতে পারি? আসুন বলি যে এই আত্মবিশ্বাসের স্কোর 0 থেকে 1 অবধি থাকবে এবং একটি নির্দিষ্ট ভবিষ্যদ্বাণী সম্পর্কে আমি কতটা আত্মবিশ্বাসী তা দেখাব ।
আত্মবিশ্বাস সম্পর্কে ইন্টারনেটে আমি যা পেয়েছি তা থেকে সাধারণত এটি অন্তর দ্বারা পরিমাপ করা হয়। এখানে লাইব্রেরি confpred
থেকে ফাংশন সহ গণিত আত্মবিশ্বাসের অন্তরগুলির উদাহরণ রয়েছে lava
:
library(lava)
set.seed(123)
n <- 200
x <- seq(0,6,length.out=n)
delta <- 3
ss <- exp(-1+1.5*cos((x-delta)))
ee <- rnorm(n,sd=ss)
y <- (x-delta)+3*cos(x+4.5-delta)+ee
d <- data.frame(y=y,x=x)
newd <- data.frame(x=seq(0,6,length.out=50))
cc <- confpred(lm(y~poly(x,3),d),data=d,newdata=newd)
if (interactive()) { ##'
plot(y~x,pch=16,col=lava::Col("black"), ylim=c(-10,15),xlab="X",ylab="Y")
with(cc, lava::confband(newd$x, lwr, upr, fit, lwd=3, polygon=T,
col=Col("blue"), border=F))
}
কোড আউটপুট কেবল আত্মবিশ্বাসের অন্তর দেয়:
একটি গ্রন্থাগারও রয়েছে conformal
, তবে আমি এটি প্রতিরোধের আত্মবিশ্বাসের অন্তরগুলির জন্যও ব্যবহার করি: "কনফর্মাল কনফর্মাল প্রেডিকশন ফ্রেমওয়ার্কের পূর্বাভাস ত্রুটির গণনার অনুমতি দেয়: (i) শ্রেণিবিন্যাসের জন্য p.values, এবং (ii) আধিপত্যের জন্য আস্থা অন্তর। "
সুতরাং একটি উপায় আছে:
যে কোনও রিগ্রেশন সমস্যায় প্রতিটি পূর্বাভাসের জন্য আত্মবিশ্বাসের মান পেতে?
যদি কোনও উপায় না থাকে তবে প্রতিটি পর্যবেক্ষণের জন্য এটি একটি আত্মবিশ্বাসের স্কোর হিসাবে ব্যবহার করা কি অর্থবোধক হবে:
আত্মবিশ্বাসের ব্যবধানের উপরের এবং নিম্ন সীমার মধ্যে দূরত্ব (যেমন উপরের উদাহরণের আউটপুটে)। সুতরাং, এই ক্ষেত্রে, বিস্তৃত হ'ল আত্মবিশ্বাসের ব্যবধান, তত বেশি অনিশ্চয়তা রয়েছে (তবে এটি বিরতিতে আসল মান যেখানে এটি বিবেচনা করে না)
randomForestCI
স্টিফান ওয়াজারের প্যাকেজটি দেখুন এবং সুসান অ্যাথির সাথে সম্পর্কিত কাগজটি দেখুন। নোট করুন এটি কেবল সিআই সরবরাহ করে 'তবে আপনি অবশিষ্টাংশের বৈকল্পিক গণনা করে এটি থেকে ভবিষ্যদ্বাণী ব্যবধান তৈরি করতে পারেন।