(এখন খুব বেশি সময় নেই তাই আমি সংক্ষিপ্তভাবে উত্তর দেব এবং তারপরে পরে প্রসারিত করব)
বলুন যে আমরা একটি বাইনারি শ্রেণিবদ্ধকরণ সমস্যা বিবেচনা করছি এবং ক্লাস 1 নমুনা এবং ক্লাস 2 নমুনার একটি প্রশিক্ষণ পেয়েছি । বৈশিষ্ট্য নির্বাচনের জন্য একটি ক্রমশক্তি পরীক্ষা প্রতিটি বৈশিষ্ট্য পৃথকভাবে দেখায়। একটি পরীক্ষা পরিসংখ্যান , যেমন তথ্য অর্জন বা মাধ্যমের মধ্যে স্বাভাবিক পার্থক্য, বৈশিষ্ট্যের জন্য গণনা করা হয়। বৈশিষ্ট্যের জন্য ডেটাটি এলোমেলোভাবে অনুমতি দেওয়া এবং দুটি সেটে বিভক্ত করা হয়, একটি আকারের এবং একটি আকার । পরীক্ষার পরিসংখ্যান এর পরে এই নতুন পার্টিশন উপর ভিত্তি করে গণনা করা হয়mnθmnθpp। সমস্যার গণনামূলক জটিলতার উপর নির্ভর করে, বৈশিষ্ট্যটির সমস্ত সম্ভাব্য পার্টিশনগুলির পরে এটি দুটি সেট অর্ডার এবং , বা এগুলির একটি এলোমেলো উপসেটে পুনরাবৃত্তি করা হয় ।mn
এখন যে আমরা উপর একটি বিতরণ প্রতিষ্ঠিত , আমরা P-মান পর্যবেক্ষিত পরীক্ষার পরিসংখ্যান নিরূপণ বৈশিষ্ট্যের একটি র্যান্ডম পার্টিশন থেকে পড়েছিল। নাল অনুমানটি হ'ল প্রতিটি শ্রেণীর নমুনা একই অন্তর্নিহিত বিতরণ থেকে আসে (বৈশিষ্ট্যটি অপ্রাসঙ্গিক)।θpθ
এই প্রক্রিয়াটি সমস্ত বৈশিষ্ট্যগুলির উপরে পুনরাবৃত্তি হয় এবং তারপরে শ্রেণিবিন্যাসের জন্য ব্যবহৃত বৈশিষ্ট্যগুলির উপসেটটি দুটি উপায়ে নির্বাচন করা যেতে পারে:
- সর্বনিম্ন P-মান অতিরিক্ত বৈশিষ্ট্যগুলিও উপস্থিত রয়েছেN
- একটি পি-মান সহ সমস্ত বৈশিষ্ট্য<ϵ