এলোমেলো বনে, আরও বড়% IncMSE আরও ভাল বা খারাপ?


17

একবার আমি আর-এ একটি (রিগ্রেশন) এলোমেলো বন মডেল তৈরি করেছি, কলটি rf$importanceআমাকে প্রতিটি পূর্বাভাসক চলকের জন্য দুটি পদক্ষেপ সরবরাহ করে %IncMSEএবং IncNodePurity। ছোট %IncMSEমূল্যবোধের সাথে পূর্বাভাসকারী ভেরিয়েবলগুলি %IncMSEকী বড় মূল্যবোধের সাথে ভবিষ্যদ্বাণীকারী ভেরিয়েবলের চেয়ে গুরুত্বপূর্ণ ?

কীভাবে IncNodePurity?

উত্তর:


30

% ইনএমএসই হ'ল সর্বাধিক শক্তিশালী এবং তথ্যবহুল পদক্ষেপ। এটি ভেরিয়েবল জে অনুমতিপ্রাপ্ত হওয়ার ফলে (ভবিষ্যতে মানগুলি এলোমেলোভাবে পরিবর্তিত হয়) ফলস্বরূপ (ভবিষ্যতের ব্যাগ-সিভি দিয়ে অনুমান করা) মেসের বৃদ্ধি is

  1. রিগ্রেশন বন বৃদ্ধি। গণনা OOB-mse, এই mse0 নাম।
  2. 1 থেকে j var এর জন্য: কলাম জলের মান নির্ধারণ করুন, তারপরে OOB-mse (j) এর পূর্বাভাস এবং গণনা করুন
  3. J'th এর% IncMSE হ'ল (এমএসই (জে) -mse0) / এমএসি * 100%

উচ্চতর সংখ্যা, আরও গুরুত্বপূর্ণ

ইনকোডপিউরিটি ক্ষতি কর্মের সাথে সম্পর্কিত যা সেরা বিভাজন দ্বারা বেছে নেওয়া হয়। ক্ষতির ক্রিয়াটি শ্রেণিবিন্যাসের জন্য রিগ্রেশন এবং গিনি-অপরিষ্কারের জন্য ম্যাসেজ। নোড পিউরিটিজে আরও কার্যকর ভেরিয়েবল উচ্চতর বৃদ্ধি অর্জন করে, এটি একটি স্প্লিট খুঁজে পাওয়া যায় যার উচ্চ আন্তঃ নোড 'ভেরিয়েন্স' এবং একটি ছোট ইন্ট্রা নোড 'ভেরিয়েন্স' রয়েছে। ইনকোডপিউরিটি পক্ষপাতদুষ্ট এবং কেবলমাত্র% IncMSE গণনা করার অতিরিক্ত গণনার সময় অগ্রহণযোগ্য হলে কেবল ব্যবহার করা উচিত। যেহেতু% IncMSE গণনা করতে এটি কেবল 5-25% অতিরিক্ত সময় নেয়, এটি প্রায় কখনই ঘটে না।

অনুরূপ প্রশ্নোত্তর

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.