1) স্কলারনে র্যান্ডমফোরেস্টে আমি শ্রেণিবদ্ধের প্রান্তিক (আমার মনে হয় এটি ডিফল্টরূপে 0.5 হয়) কীভাবে পরিবর্তন করতে পারি?
2) আমি কীভাবে স্কলারনে আন্ডার-স্যাম্পল করতে পারি?
3) আমার র্যান্ডমফোরস্ট শ্রেণিবদ্ধের নিম্নলিখিত ফলাফল রয়েছে: [[1635 1297] [520 3624]]
precision recall f1-score support
class 0 0.76 0.56 0.64 2932
class 1 0.74 0.87 0.80 4144
গড় / মোট 0.75 0.74 0.73 7076
প্রথমত, ডেটা ভারসাম্যহীন (শ্রেণি -0 থেকে 30% এবং শ্রেণি -1 থেকে 70%)। সুতরাং, আমি মনে করি শ্রেণিবদ্ধকারী ক্লাস -১ এর পক্ষপাতদুষ্ট হওয়ার বেশি সম্ভাবনা রয়েছে যার অর্থ কিছুটা ক্লাস -০ থেকে শ্রেণি -১ এ স্থানান্তরিত করা হয়েছে (শ্রেণি -১ এর জন্য ১২৯৯ মিসক্লাসিফিকেশন তবে শ্রেণি -১ এর জন্য ৫২০ মিসক্লাসিফিকেশন রয়েছে)। আমি এটা কিভাবে ঠিক করবো? যদি ডাউনসাম্পলিং সাহায্য করতে পারে? বা শ্রেণিবিন্যাসের প্রান্তিক পরিবর্তন?
আপডেট: শ্রেণি -0 এর জনসংখ্যার 40% রয়েছে যখন শ্রেণি -1 60%। তবে, ক্লাস -0 থেকে ক্লাস -1 (1297) এ প্রবাহের পরিমাণ বেশি রয়েছে এবং আমি চাই এটি কম হয়ে যায়।