আমি বৈশিষ্ট্য নির্বাচন সম্পর্কে শিখছি। মডেল তৈরির জন্য কেন এটি গুরুত্বপূর্ণ এবং দরকারী হবে তা আমি দেখতে পাচ্ছি। তবে আসুন তদারকি করা শেখার (শ্রেণিবিন্যাস) কার্যগুলিতে ফোকাস করি। শ্রেণিবদ্ধকরণের জন্য বৈশিষ্ট্য নির্বাচন কেন গুরুত্বপূর্ণ?
আমি বৈশিষ্ট্য নির্বাচন এবং তত্ত্বাবধানে শেখার জন্য এর ব্যবহার সম্পর্কে প্রচুর সাহিত্যের লেখা দেখি, তবে এটি আমার ধাঁধা দেয়। বৈশিষ্ট্য নির্বাচনটি কোন বৈশিষ্ট্যগুলি ফেলে দিতে হবে তা চিহ্নিত করার বিষয়ে। স্বজ্ঞাতভাবে, কিছু বৈশিষ্ট্য ফেলে দেওয়া নিজেকে পরাজিত বলে মনে হচ্ছে: এটি তথ্য ফেলে দিচ্ছে। দেখে মনে হচ্ছে তথ্য ছুঁড়ে ফেলা যাতে সহায়তা করা উচিত নয়।
এমনকি কিছু বৈশিষ্ট্য অপসারণ করা যদি আমাদের উপকার করে, এমনকি যদি আমরা কিছু বৈশিষ্ট্যগুলি ফেলে দিই এবং বাকীগুলিকে তত্ত্বাবধানে শেখার অ্যালগরিদমগুলিতে খাওয়াতাম তবে তদারকির শিখার অ্যালগরিদমকে পরিচালনা করার পরিবর্তে আমাদের কেন তা করা দরকার? কিছু বৈশিষ্ট্য যদি সহায়ক না হয়, তবে কোনও নিরীক্ষিত তত্ত্বাবধানে শেখার অ্যালগরিদমটি কি স্পষ্টভাবে আবিষ্কার করতে এবং সেই বৈশিষ্ট্যটি ব্যবহার করে না এমন একটি মডেল শিখতে হবে না?
এত স্বজ্ঞাতভাবে আমি আশা করতাম যে বৈশিষ্ট্য নির্বাচনটি অর্থহীন অনুশীলন হবে যা কখনও সাহায্য করে না এবং কখনও কখনও আঘাত করতে পারে না। তবে এটি এত ব্যাপকভাবে ব্যবহৃত এবং এর সম্পর্কে লিখিত বিষয়টি আমাকে সন্দেহ করে যে আমার অন্তর্নিহিতটি ত্রুটিযুক্ত। তত্ত্বাবধানে পড়াশোনা করার সময়, বৈশিষ্ট্য নির্বাচন কেন দরকারী এবং গুরুত্বপূর্ণ সে বিষয়ে কোনও অন্তর্দৃষ্টি দিতে পারেন? কেন এটি মেশিন লার্নিংয়ের কর্মক্ষমতা উন্নত করে? এটি আমি কোন শ্রেণিবদ্ধ ব্যবহার করি তার উপর নির্ভর করে?