আমি একটি মাইক্রোয়ারে ডেটাসেটে শ্রেণিবদ্ধ হিসাবে একটি এলোমেলো বন অ্যালগরিদম প্রয়োগ করছি যা বৈশিষ্ট্যগুলির সংখ্যা সহ দুটি পরিচিত গ্রুপে বিভক্ত। প্রাথমিক রান করার পরে আমি বৈশিষ্ট্যগুলির গুরুত্বের দিকে তাকান এবং 5, 10 এবং 20 সর্বাধিক গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি দিয়ে আবার গাছের অ্যালগোরিদমটি চালিত করি। আমি খুঁজে পেয়েছি যে সমস্ত বৈশিষ্ট্যগুলির জন্য, শীর্ষ 10 এবং 20 টির মধ্যে ত্রুটির হারের OOB অনুমান 1.19% যেখানে শীর্ষ 5 বৈশিষ্ট্যগুলি এটি 0% is এটি আমার কাছে মতবিরোধী বলে মনে হচ্ছে, তাই আমি ভাবছিলাম যে আমি কিছু মিস করছি বা আমি ভুল মেট্রিক ব্যবহার করছি কিনা তা আপনি ব্যাখ্যা করতে পারেন কিনা।
আমি এনটিআর = 1000, নডসাইজ = 1 এবং মিট্রি = স্কয়ার্ট (এন) দিয়ে আর এ র্যান্ডমফোরস্ট প্যাকেজটি ব্যবহার করছি