শ্রেণিবিন্যাসের জন্য মূল ডেটাসেটকে প্রশিক্ষণে এবং পরীক্ষার সেটে বিভক্ত করার সময়, এলোমেলো নমুনার পরিবর্তে স্তরিত নমুনা ব্যবহারের কোনও / কিছু সুবিধা রয়েছে কিনা তা আমি জানতে চাই।
এছাড়াও, স্তরযুক্ত নমুনা কি এলোমেলো নমুনার চেয়ে শ্রেণিবদ্ধে আরও পক্ষপাত প্রবর্তন করে?
অ্যাপ্লিকেশন, যার জন্য আমি ডেটা প্রস্তুতির জন্য স্তরিত নমুনা ব্যবহার করতে চাই, এটি একটি র্যান্ডম অরণ্য শ্রেণিবদ্ধ, 2 এ প্রশিক্ষিতমূল ডেটাসেটের 3 । শ্রেণিবদ্ধের আগে, সিন্থেটিক নমুনা জেনারেশনের একটি পদক্ষেপও রয়েছে (এসএমওটি [1]) যা শ্রেণীর আকারকে ভারসাম্যপূর্ণ করে।
[1] চাওলা, নীতেশ ভি।, ইত্যাদি। " স্মোট: সিন্থেটিক সংখ্যালঘু ওভার স্যাম্পলিং কৌশল technique " কৃত্রিম বুদ্ধিমত্তা গবেষণা জার্নাল 16 (2002): 321-357।