আমার কাছে তিনটি বৈশিষ্ট্য রয়েছে যা আমি শ্রেণিবদ্ধকরণ সমস্যা সমাধানের জন্য ব্যবহার করি। মূলত, এই বৈশিষ্ট্যগুলি বুলিয়ান মানগুলি উত্পাদন করে, তাই আমি ইতিবাচক এবং নেতিবাচক শ্রেণিবিন্যাসের সেটগুলি কতটা ওভারল্যাপ করে তা দেখে তাদের অপ্রয়োজনীয়তার মূল্যায়ন করতে পারি। পরিবর্তে প্রকৃত মান (স্কোর) উত্পাদন করার জন্য আমি এখন বৈশিষ্ট্যগুলি প্রসারিত করেছি এবং আমি তাদের অপ্রয়োজনীয়তা আবার বিশ্লেষণ করতে চাই তবে কীভাবে এটি করা যায় তার সম্পূর্ণ ক্ষতি করছি। যে কেউ কীভাবে আমাকে যেতে পারে সে সম্পর্কে কোনও পয়েন্টার বা ধারণা সরবরাহ করতে পারে?
আমি জানি এই প্রশ্নটি খুব অস্পষ্ট, কারণ এটি আমার কাছে পরিসংখ্যানের খুব শক্তিশালী উপলব্ধি নেই। সুতরাং, যদি আপনার আমার কাছে উত্তর না থেকে থাকে তবে আপনার কিছু প্রশ্ন থাকতে পারে যা আমাকে আরও ভালভাবে বুঝতে সাহায্য করতে পারে।
সম্পাদনা: আমি বর্তমানে বিষয়টিতে উইকিপিডিয়া ব্রাউজ করছি, আমার অনুভূতি আছে যে আমি যা চাই তা একটি সম্পর্কযুক্ত সহগ, তবে আমি এখনও নিশ্চিত নই যে এটি সঠিক পন্থা, এবং উপলব্ধ বহুগুণ সহকারীর মধ্যে কোনটি উপযুক্ত?
সম্পাদনা 2: বুলিয়ান ক্ষেত্রে, আমি প্রথম প্রতিটি বৈশিষ্ট্যের জন্য নমুনার সেট তৈরি করেছি যার জন্য এটি সত্য ছিল। তারপরে, দুটি বৈশিষ্ট্যের মধ্যে পারস্পরিক সম্পর্ক ছিল এই সেটগুলির ইউনিয়নের আকারের চেয়ে এই সেটগুলির ছেদ আকার। যদি এই মানটি 1 হয় তবে এগুলি সম্পূর্ণ অপ্রয়োজনীয়, কারণ সর্বদা একই। যদি এটি 0 হয় তবে এগুলি কখনই এক হয় না।