আরপিআর্ট (আর তে) ব্যবহার করে কার্ট মডেল (বিশেষত শ্রেণিবদ্ধকরণ গাছ) তৈরি করার সময়, মডেলটির সাথে পরিচিত বিভিন্ন ভেরিয়েবলগুলির গুরুত্ব কী তা জানা প্রায়শই আকর্ষণীয় is
সুতরাং, আমার প্রশ্নটি: একটি কর্ট মডেলটিতে অংশগ্রহণকারী ভেরিয়েবলের পরিবর্তনশীল গুরুত্ব র্যাঙ্কিং / পরিমাপের জন্য কোন সাধারণ ব্যবস্থা বিদ্যমান? আর কীভাবে এটি আর এর সাহায্যে গণনা করা যায় (উদাহরণস্বরূপ, rpart প্যাকেজটি ব্যবহার করার সময়)
উদাহরণস্বরূপ, এখানে কিছু ডামি কোড তৈরি করা হয়েছে, যাতে আপনি এটিতে আপনার সমাধানগুলি প্রদর্শন করতে পারেন। এই উদাহরণটি এমনভাবে গঠন করা হয়েছে যাতে এটি স্পষ্ট হয় যে ভেরিয়েবল x1 এবং x2 "গুরুত্বপূর্ণ", যখন (কিছু দিক থেকে) x1 আরও গুরুত্বপূর্ণ তবে x2 (যেহেতু x1 এর বেশি ক্ষেত্রে প্রয়োগ করা উচিত, সুতরাং ডেটার কাঠামোর উপর আরও প্রভাব ফেলবে, তারপরে x2)।
set.seed(31431)
n <- 400
x1 <- rnorm(n)
x2 <- rnorm(n)
x3 <- rnorm(n)
x4 <- rnorm(n)
x5 <- rnorm(n)
X <- data.frame(x1,x2,x3,x4,x5)
y <- sample(letters[1:4], n, T)
y <- ifelse(X[,2] < -1 , "b", y)
y <- ifelse(X[,1] < 0 , "a", y)
require(rpart)
fit <- rpart(y~., X)
plot(fit); text(fit)
info.gain.rpart(fit) # your function - telling us on each variable how important it is
(তথ্যসূত্র সর্বদা স্বাগত জানানো হয়)