আপনার শ্রেণিবদ্ধের জন্য আপনার উপলভ্য বৈশিষ্ট্যগুলির একটি উপসেটটি নির্বাচন করার পদ্ধতিগুলির মধ্যে একটি হ'ল মানদণ্ড (যেমন তথ্য লাভ) এর অনুসারে র্যাঙ্ক করা এবং তারপরে আপনার শ্রেণিবদ্ধ ব্যবহার করে যথাযথতা এবং র্যাঙ্কড বৈশিষ্ট্যগুলির একটি উপসেট গণনা করা।
উদাহরণস্বরূপ, যদি আপনার বৈশিষ্ট্যগুলি হয় A, B, C, D, E
এবং সেগুলি যদি অনুসরণ অনুসারে র্যাঙ্ক করা হয় D,B,C,E,A
তবে আপনি যথার্থতা ব্যবহার করে গণনা করুন D
, D, B
তারপরে D, B, C
, তারপরে D, B, C, E
... যতক্ষণ না আপনার নির্ভুলতা হ্রাস শুরু হয়। এটি হ্রাস শুরু হওয়ার পরে, আপনি বৈশিষ্ট্য যুক্ত করা বন্ধ করুন
উদাহরণস্বরূপ (উপরে) উদাহরণস্বরূপ, আপনি বৈশিষ্ট্যগুলি বেছে নেবেন F, C, D, A
এবং অন্যান্য বৈশিষ্ট্যগুলি আপনার যথার্থতা হ্রাস করার সাথে সাথে বাদ দেবেন drop
এই পদ্ধতিটি ধরে নিয়েছে যে আপনার মডেলটিতে আরও বৈশিষ্ট্য যুক্ত করা আপনার নির্দিষ্টকরণের নির্দিষ্ট সময় পর্যন্ত আপনার শ্রেণিবদ্ধের যথার্থতা বাড়িয়ে তোলে যার পরে অতিরিক্ত বৈশিষ্ট্য যুক্ত করা হলে নির্ভুলতা হ্রাস পায় (উদাহরণস্বরূপ দেখুন 1)
তবে আমার পরিস্থিতি আলাদা। আমি উপরে বর্ণিত পদ্ধতিটি প্রয়োগ করেছি এবং আমি দেখতে পেয়েছি যে আরও বেশি বৈশিষ্ট্য যুক্ত করার ফলে সঠিকতা হ্রাস হয়ে যায় যতক্ষণ না এটি বাড়ার পরে।
এটির মতো একটি দৃশ্যে আপনি কীভাবে আপনার বৈশিষ্ট্যগুলি বেছে নেবেন? আপনি কি F
বাকী বাছাই করে ফেলে দিন? সঠিকতা হ্রাস হবে এবং তারপরে কেন বৃদ্ধি পাবে আপনার কোনও ধারণা আছে?