আমি একটি লজিস্টিক রিগ্রেশন শ্রেণিবদ্ধ তৈরি করেছি যা আমার ডেটাতে খুব সঠিক very এটি এত ভাল কেন কাজ করছে তা এখন আমি আরও ভাল করে বুঝতে চাই। বিশেষত, আমি কোন বৈশিষ্ট্যগুলি সর্বাধিক অবদান রাখছি (কোন বৈশিষ্ট্যগুলি সর্বাধিক গুরুত্বপূর্ণ) র্যাঙ্ক করতে চাই এবং আদর্শভাবে, প্রতিটি বৈশিষ্ট্য সামগ্রিক মডেলের (বা এই শিরাতে কিছু) নির্ভুলতায় কতটুকু অবদান রাখছে তা মাপ দিন। আমি এটা কিভাবে করবো?
আমার প্রথম চিন্তা ছিল তাদের সহগের ভিত্তিতে তাদের র্যাঙ্ক করা, তবে আমার সন্দেহ হয় এটি সঠিক হতে পারে না। যদি আমার কাছে দুটি বৈশিষ্ট্য থাকে যা সমানভাবে কার্যকর হয় তবে প্রথমটির বিস্তারটি দ্বিতীয়টির চেয়ে দশগুণ বেশি হয় তবে আমি প্রথমটির চেয়ে দ্বিতীয়টির চেয়ে কম সহগ পাওয়ার আশা করব। বৈশিষ্ট্যের গুরুত্ব মূল্যায়নের আরও যুক্তিসঙ্গত উপায় আছে কি?
নোট করুন যে আমি বৈশিষ্ট্যটির একটি সামান্য পরিবর্তন ফলাফলের সম্ভাব্যতার উপর কতটা প্রভাব ফেলবে তা বোঝার চেষ্টা করছি না। পরিবর্তে, আমি শ্রেণিবদ্ধকারীকে নির্ভুল করে তোলার ক্ষেত্রে প্রতিটি বৈশিষ্ট্যটি কতটা মূল্যবান তা বোঝার চেষ্টা করছি। এছাড়াও, আমার লক্ষ্যটি বৈশিষ্ট্য নির্বাচন সম্পাদন করা বা কম বৈশিষ্ট্যযুক্ত একটি মডেল তৈরি করা এতটা নয়, তবে শেখা মডেলটির জন্য কিছু "ব্যাখ্যাযোগ্যতা" সরবরাহ করার চেষ্টা করা, সুতরাং শ্রেণিবদ্ধকারী কেবল একটি অস্বচ্ছ কালো বাক্স নয়।