ব্যক্তিগতভাবে, আমি বৈশিষ্ট্য নির্বাচনকে দুটি ভাগে ভাগ করতে চাই:
- নিষ্ক্রিয় বৈশিষ্ট্য নির্বাচন
- তত্ত্বাবধান বৈশিষ্ট্য নির্বাচন
নিরীক্ষণযোগ্য বৈশিষ্ট্য নির্বাচন হ'ল ক্লাস্টারিং বা পিসিএ এর মতো জিনিস যেখানে আপনি বৈশিষ্ট্যগুলির সর্বনিম্ন অপ্রয়োজনীয় পরিসীমা নির্বাচন করেন (বা সামান্য অতিরিক্ত অপ্রয়োজনীয় বৈশিষ্ট্য তৈরি করুন)। তত্ত্বাবধানযুক্ত বৈশিষ্ট্য নির্বাচন লাসোর মতো জিনিস যেখানে আপনি সবচেয়ে ভবিষ্যদ্বাণীপূর্ণ শক্তি সহ বৈশিষ্ট্যগুলি নির্বাচন করেন।
আমি ব্যক্তিগতভাবে সাধারণত আমি যা পছন্দ করি তদারকি বৈশিষ্ট্য নির্বাচন পছন্দ। সুতরাং, লিনিয়ার রিগ্রেশন ব্যবহার করার সময়, আমি লাসোর উপর ভিত্তি করে বৈশিষ্ট্যগুলি নির্বাচন করব। স্নায়বিক নেটওয়ার্কগুলিতে বিরলতা প্ররোচিত করতে অনুরূপ পদ্ধতি বিদ্যমান।
তবে প্রকৃতপক্ষে, আমি দেখতে পাচ্ছি না যে আমি কার্নেলগুলি ব্যবহার করে কোনও পদ্ধতিতে এটি করতে যাচ্ছি, সুতরাং আপনি যেটিকে আমি নিষ্ক্রিয় বৈশিষ্ট্য নির্বাচন বলি তা ব্যবহার করে আপনি সম্ভবত আরও ভাল।
সম্পাদনা: আপনি নিয়মিতকরণ সম্পর্কেও জিজ্ঞাসা করেছিলেন। আমি নিয়মিতকরণকে বেশিরভাগ ক্ষেত্রেই সহায়তা হিসাবে দেখছি কারণ আমরা সীমাবদ্ধ নমুনাগুলি নিয়ে কাজ করি এবং তাই প্রশিক্ষণ এবং পরীক্ষার বিতরণ সবসময় কিছুটা পৃথক হয় এবং আপনি চান যে আপনার মডেলটি অতিরিক্ত সাজে না। আমি নিশ্চিত নই যে এটি বৈশিষ্ট্যগুলি নির্বাচন করা এড়ানোর প্রয়োজনটিকে সরিয়ে দেয় (যদি আপনার সত্যিকারের অনেক বেশি থাকে)। আমি মনে করি যে বৈশিষ্ট্যগুলি নির্বাচন করা (বা সেগুলির একটি ছোট উপসেট তৈরি করা) আপনার করা বৈশিষ্ট্যগুলি আরও দৃust়তর করে তোলে এবং মডেলটিকে বোকামি সম্পর্কিত সম্পর্কগুলি থেকে শিখতে সহায়তা করে helps সুতরাং, নিয়মিতকরণ সহায়তা করে, তবে নিশ্চিত নয় যে এটি একটি সম্পূর্ণ বিকল্প। তবে আমি এ সম্পর্কে পুরোপুরি ভাবিনি।