আর-এর প্রতিটি পূর্বাভাসের জন্য রিগ্রেশন (এলোমেলো বন / এক্সজিবিস্ট সহ) আত্মবিশ্বাসের স্কোরগুলি কীভাবে গণনা করবেন?


11

র্যান্ডম ফরেস্ট বা এক্সট্রিম গ্রেডিয়েন্ট বুস্টিং (এক্সজিবিস্ট) এর মতো অ্যালগোরিদম ব্যবহার করার সময় প্রতিটি পূর্বাভাসিত মানের জন্য একটি আত্মবিশ্বাসের স্কোর (আমরা এটিকে আত্মবিশ্বাসের মান বা সম্ভাবনাও বলতে পারি) পেতে পারি? আসুন বলি যে এই আত্মবিশ্বাসের স্কোর 0 থেকে 1 অবধি থাকবে এবং একটি নির্দিষ্ট ভবিষ্যদ্বাণী সম্পর্কে আমি কতটা আত্মবিশ্বাসী তা দেখাব ।

আত্মবিশ্বাস সম্পর্কে ইন্টারনেটে আমি যা পেয়েছি তা থেকে সাধারণত এটি অন্তর দ্বারা পরিমাপ করা হয়। এখানে লাইব্রেরি confpredথেকে ফাংশন সহ গণিত আত্মবিশ্বাসের অন্তরগুলির উদাহরণ রয়েছে lava:

library(lava)
set.seed(123)
n     <- 200
x     <- seq(0,6,length.out=n)
delta <- 3
ss    <- exp(-1+1.5*cos((x-delta)))
ee    <- rnorm(n,sd=ss)
y     <- (x-delta)+3*cos(x+4.5-delta)+ee
d     <- data.frame(y=y,x=x)
newd  <- data.frame(x=seq(0,6,length.out=50))
cc    <- confpred(lm(y~poly(x,3),d),data=d,newdata=newd)
if (interactive()) { ##'
  plot(y~x,pch=16,col=lava::Col("black"), ylim=c(-10,15),xlab="X",ylab="Y")
  with(cc, lava::confband(newd$x, lwr, upr, fit,  lwd=3, polygon=T, 
                          col=Col("blue"), border=F))
}

কোড আউটপুট কেবল আত্মবিশ্বাসের অন্তর দেয়:

গ্রাফ পয়েন্ট, পূর্বাভাস এবং আত্মবিশ্বাসের ব্যবধান দেখাচ্ছে

একটি গ্রন্থাগারও রয়েছে conformal, তবে আমি এটি প্রতিরোধের আত্মবিশ্বাসের অন্তরগুলির জন্যও ব্যবহার করি: "কনফর্মাল কনফর্মাল প্রেডিকশন ফ্রেমওয়ার্কের পূর্বাভাস ত্রুটির গণনার অনুমতি দেয়: (i) শ্রেণিবিন্যাসের জন্য p.values, এবং (ii) আধিপত্যের জন্য আস্থা অন্তর। "

সুতরাং একটি উপায় আছে:

  1. যে কোনও রিগ্রেশন সমস্যায় প্রতিটি পূর্বাভাসের জন্য আত্মবিশ্বাসের মান পেতে?

  2. যদি কোনও উপায় না থাকে তবে প্রতিটি পর্যবেক্ষণের জন্য এটি একটি আত্মবিশ্বাসের স্কোর হিসাবে ব্যবহার করা কি অর্থবোধক হবে:

    আত্মবিশ্বাসের ব্যবধানের উপরের এবং নিম্ন সীমার মধ্যে দূরত্ব (যেমন উপরের উদাহরণের আউটপুটে)। সুতরাং, এই ক্ষেত্রে, বিস্তৃত হ'ল আত্মবিশ্বাসের ব্যবধান, তত বেশি অনিশ্চয়তা রয়েছে (তবে এটি বিরতিতে আসল মান যেখানে এটি বিবেচনা করে না)


1
randomForestCIস্টিফান ওয়াজারের প্যাকেজটি দেখুন এবং সুসান অ্যাথির সাথে সম্পর্কিত কাগজটি দেখুন। নোট করুন এটি কেবল সিআই সরবরাহ করে 'তবে আপনি অবশিষ্টাংশের বৈকল্পিক গণনা করে এটি থেকে ভবিষ্যদ্বাণী ব্যবধান তৈরি করতে পারেন।
জেনেরিক_উসার

উত্তর:


4

আত্মবিশ্বাসের স্কোর হিসাবে আপনি যা উল্লেখ করছেন তা স্বতন্ত্র ভবিষ্যদ্বাণীগুলির অনিশ্চয়তা থেকে পাওয়া যেতে পারে (উদাহরণস্বরূপ এর বিপরীতটি গ্রহণ করে)।

এই অনিশ্চয়তার পরিমাণ নির্ধারণ ব্যাগিংয়ের মাধ্যমে সর্বদা সম্ভব ছিল এবং এলোমেলো বনাঞ্চলে তুলনামূলকভাবে সহজ - তবে এই অনুমানটি পক্ষপাতদুষ্ট ছিল। বাজি এবং অন্যান্য। (2014) এই অনিশ্চয়তাগুলি আরও দক্ষতার সাথে এবং কম পক্ষপাত সহকারে পাওয়ার জন্য দুটি পদ্ধতি বর্ণনা করেছেন। এটি জ্যাকনিফ-বুটস্ট্র্যাপের পক্ষপাত-সংশোধিত সংস্করণ এবং ইনফিনাইটিমাল জ্যাকনিফের উপর ভিত্তি করে ছিল। আপনি আর প্যাকেজ বাস্তবায়নের জানতে পারেন rangerএবং grf

সাম্প্রতিককালে, শর্তসাপেক্ষ অভ্যাস গাছ দ্বারা নির্মিত এলোমেলো বন ব্যবহার করে এটি উন্নত করা হয়েছে। সিমুলেশন অধ্যয়নের উপর ভিত্তি করে (ব্রোক্যাম্প এট আল। 2018) অনন্য জ্যাকনিফ অনুমানকারী যখন এলোমেলো বন নির্মানের জন্য শর্তসাপেক্ষ অনুমিত গাছ ব্যবহার করা হয় তখন ভবিষ্যদ্বাণীগুলিতে ত্রুটিটি আরও সঠিকভাবে অনুমান করে। এটি প্যাকেজে প্রয়োগ করা হয়েছে RFinfer


বাজিার, এস।, হাসিটি, টি।, এবং ইফ্রন, বি (2014)। এলোমেলো বনের জন্য আত্মবিশ্বাসের বিরতি: জ্যাকনিফ এবং অনন্য জ্যাকনিফ। জার্নাল অফ মেশিন লার্নিং রিসার্চ, 15 (1), 1625-1651।

ব্রোক্যাম্প, সি।, রাও, এমবি, রায়ান, পি।, এবং জান্ডারভ, আর। (2017)। অসীম জ্যাকনিফ ব্যবহার করে অ্যাসিম্পটোটিক বৈকল্পিক অনুমান করার জন্য এলোমেলো বনে পুনরায় মডেলিং এবং পুনরাবৃত্তকারী পার্টিশন পদ্ধতির একটি তুলনা। স্ট্যাটাস, 6 (1), 360-372।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.