আমার কাছে একটি ডেটাসেট রয়েছে যাতে বাইনারি শ্রেণির বৈশিষ্ট্য রয়েছে। ক্লাস +1 (ক্যান্সার ধনাত্মক) সহ 623 টি উদাহরণ এবং শ্রেণি -1 (ক্যান্সার নেতিবাচক) সহ 101,671 টি দৃষ্টান্ত রয়েছে।
আমি বিভিন্ন অ্যালগরিদম চেষ্টা করেছি (নাইভ বেইস, র্যান্ডম ফরেস্ট, এওডিই, সি 4.5) এবং তাদের সকলের কাছে অগ্রহণযোগ্য মিথ্যা নেতিবাচক অনুপাত রয়েছে। র্যান্ডম ফরেস্টে সর্বাধিক সামগ্রিক পূর্বাভাস নির্ভুলতা (99.5%) এবং সর্বনিম্ন মিথ্যা নেতিবাচক অনুপাত রয়েছে, তবে এখনও positive৯% ধনাত্মক ক্লাস মিস করে (যেমন ম্যালিগন্যান্ট টিউমারগুলির 79৯% সনাক্ত করতে ব্যর্থ হয়)।
কোনও ধারণা কীভাবে আমি এই পরিস্থিতির উন্নতি করতে পারি?
ধন্যবাদ!