আমি কীভাবে স্কলারন দিয়ে নির্মিত সিদ্ধান্ত গাছ শ্রেণিবদ্ধকরণের মডেলটির সিদ্ধান্ত প্রক্রিয়াটি পুরোপুরি বুঝতে পারি তা বোঝার চেষ্টা করছি। আমি যে দুটি প্রধান দিকটি দেখছি তা হ'ল গাছের গ্রাফিজ উপস্থাপনা এবং বৈশিষ্ট্য আমদানির তালিকা। আমি যা বুঝতে পারি না তা হল গাছের প্রসঙ্গে কীভাবে বৈশিষ্ট্যটির গুরুত্ব নির্ধারণ করা হয়। উদাহরণস্বরূপ, বৈশিষ্ট্য আমদানির আমার তালিকা এখানে রয়েছে:
বৈশিষ্ট্য র্যাঙ্কিং: 1. বৈশিষ্ট্য (0.300237)
বৈশিষ্ট্যবিবি (0.166800)
ফিচারসি (0.092472)
ফিচারডি (0.075009)
বৈশিষ্ট্য (0.068310)
ফিচারএফ (0.067118)
ফিচারজি (0.066510)
বৈশিষ্ট্য এইচ (0.043502)
ফিচারআই (0.040281)
ফিচারজে (0.039006)
বৈশিষ্ট্য (0.032618)
ফিচারএল (0.008136)
ফিচারএম (0.000000)
যাইহোক, আমি যখন গাছের উপরের দিকে তাকাই, তখন এটির মতো দেখতে:
প্রকৃতপক্ষে, "সর্বাধিক গুরুত্বপূর্ণ" র্যাঙ্কযুক্ত কিছু বৈশিষ্ট্য গাছের নিচে থেকে আরও অবধি উপস্থিত হয় না এবং গাছের শীর্ষটি ফিচারজে রয়েছে যা সর্বনিম্ন র্যাঙ্কড বৈশিষ্ট্যগুলির মধ্যে একটি। আমার নিষ্পাপ অনুমানটি হ'ল সর্বাধিক গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি সর্বাধিক প্রভাব ফেলতে গাছের শীর্ষের কাছে স্থান পাবে। যদি এটি ভুল হয়, তবে এটি এমন কী যা কোনও বৈশিষ্ট্যটিকে "গুরুত্বপূর্ণ" করে তোলে?