প্রশিক্ষণ সেটটিতে প্রায় 1000 ইতিবাচক এবং 10000 নেতিবাচক নমুনাগুলির সাথে আমার একটি শ্রেণিবদ্ধকরণ সমস্যা রয়েছে। সুতরাং এই ডেটা সেটটি বেশ ভারসাম্যহীন। সরল এলোমেলো বন কেবল সমস্ত পরীক্ষার নমুনাকে সংখ্যাগরিষ্ঠ শ্রেণি হিসাবে চিহ্নিত করার চেষ্টা করছে।
সাব-স্যাম্পলিং এবং ওজনযুক্ত এলোমেলো বন সম্পর্কে কিছু ভাল উত্তর এখানে দেওয়া হয়েছে: উচ্চ পক্ষপাতদুষ্ট ডেটাসেটের সাথে একটি ট্রি এনসেম্বল প্রশিক্ষণের জন্য কী বোঝা যায়?
আরএফ ছাড়াও কোন শ্রেণিবিন্যাস পদ্ধতি সমস্যাটিকে সর্বোত্তমভাবে পরিচালনা করতে পারে?