পরিসংখ্যান শেখার অ্যালগরিদম চালানোর আগে বৈশিষ্ট্য নির্বাচন পদ্ধতিগুলি (এলোমেলো বন বৈশিষ্ট্য গুরুত্বের মান বা ইউনিভারিয়েট বৈশিষ্ট্য নির্বাচন পদ্ধতি ইত্যাদি) ব্যবহার করার জন্য আমার একটি প্রশ্ন রয়েছে।
আমরা ওভারফিটিং এড়াতে জানি যে আমরা ওজন ভেক্টরগুলিতে নিয়মিতকরণ জরিমানা প্রবর্তন করতে পারি।
সুতরাং আমি যদি লিনিয়ার রিগ্রেশন করতে চাই, তবে আমি এল 2 বা এল 1 বা এমনকি ইলাস্টিক নেট নিয়মিতকরণ পরামিতিগুলি প্রবর্তন করতে পারি। অল্প দ্রষ্টব্য সমাধান পেতে, এল 1 জরিমানা বৈশিষ্ট্য নির্বাচনে সহায়তা করে।
তাহলে কী এখনও লসোর মতো এল 1 নিয়মিতকরণের রিগ্রেশন চালানোর আগে বৈশিষ্ট্য নির্বাচন করা প্রয়োজন? প্রযুক্তিগতভাবে লাসো আমাকে এল 1 পেনাল্টি দ্বারা বৈশিষ্ট্যগুলি হ্রাস করতে সহায়তা করছে তবে আলগো চালানোর আগে বৈশিষ্ট্য নির্বাচন কেন প্রয়োজন?
আমি একটি গবেষণা নিবন্ধ পড়ে বলেছিলাম যে আনোভা তখন এসভিএম একা এসভিএম ব্যবহারের চেয়ে ভাল পারফরম্যান্স দেয়। এখন প্রশ্ন হ'ল এসভিএম সহজাতভাবে এল 2 আদর্শ ব্যবহার করে নিয়মিতকরণ করে। মার্জিনটি সর্বাধিক করার জন্য, এটি ওজন ভেক্টরের আদর্শকে হ্রাস করছে। সুতরাং এটি এর উদ্দেশ্যমূলক কার্যটিতে নিয়মিতকরণ করছে। তাহলে প্রযুক্তিগতভাবে অ্যালগরিদম যেমন এসভিএম বৈশিষ্ট্য নির্বাচন পদ্ধতি সম্পর্কে বিরক্ত করা উচিত নয় ?. তবে প্রতিবেদনে এখনও বলা হয়েছে যে সাধারণ এসভিএমের আগে ইউনিভারিটেড ফিচার নির্বাচন করা আরও শক্তিশালী।
চিন্তা আছে কেউ?