আমি যে প্রকল্পে কাজ করছি তার জন্য আমি বিভিন্ন শ্রেণিবদ্ধকরণ পদ্ধতিগুলি অন্বেষণ করছি এবং র্যান্ডম অরণ্য চেষ্টা করতে আগ্রহী। আমি পাশাপাশি যাওয়ার সাথে সাথে নিজেকে শিক্ষিত করার চেষ্টা করছি এবং সিভি সম্প্রদায় দ্বারা প্রদত্ত যে কোনও সহায়তার প্রশংসা করব।
আমি আমার ডেটা প্রশিক্ষণ / পরীক্ষা সেটগুলিতে বিভক্ত করেছি। আর এলোমেলো বনাঞ্চল (র্যান্ডমফোরস্ট প্যাকেজ ব্যবহার করে) নিয়ে পরীক্ষা-নিরীক্ষা করা থেকে, আমার ছোট শ্রেণির জন্য আমি উচ্চতর মিসক্যাসিফিকেশন রেট নিয়ে সমস্যায় পড়ছি। ভারসাম্যহীন ডেটাতে এলোমেলো বনগুলির কার্যকারিতা সম্পর্কিত আমি এই কাগজটি পড়েছি এবং এলোমেলো বন ব্যবহার করার সময় লেখকরা শ্রেণি ভারসাম্য নিয়ে কাজ করার দুটি পদ্ধতি উপস্থাপন করেছিলেন।
1. ভারী র্যান্ডম বন
2. ভারসাম্য র্যান্ডম বন
আর প্যাকেজটি ক্লাসের ওজনকে মঞ্জুরি দেয় না (আরআর সহায়তা ফোরামগুলি থেকে, আমি পড়েছি ক্লাসওয়েট প্যারামিটারটি সঠিকভাবে সম্পাদন করছে না এবং ভবিষ্যতের বাগ ফিক্স হিসাবে নির্ধারিত হয়েছে), তাই আমার বিকল্প 2 রয়েছে am আমি নির্দিষ্ট করতে সক্ষম হয়েছি এলোমেলো বনের প্রতিটি পুনরাবৃত্তির জন্য প্রতিটি শ্রেণি থেকে নমুনাযুক্ত বস্তুর সংখ্যা।
আমি এলোমেলো বনাঞ্চলের জন্য সমান নমুনার আকার নির্ধারণ করতে অস্বস্তি বোধ করি, কারণ আমার মনে হয় ভবিষ্যতের ডেটাগুলির সাথে খারাপ পারফরম্যান্সের দিকে বড় শ্রেণীর সম্পর্কে আমি খুব বেশি তথ্য হারাব information বৃহত্তর শ্রেণীর নিম্নগামীকরণের সময় ভুল শোধন করার হারগুলি উন্নতির জন্য দেখিয়েছে, তবে আমি ভাবছিলাম যে এলোমেলো বনাঞ্চলে ভারসাম্যহীন বর্গের আকারগুলি মোকাবেলা করার অন্যান্য উপায় আছে কি?