লজিস্টিক রিগ্রেশন , এসভিএম , সিদ্ধান্ত গাছ , ব্যাগিং এবং এই জাতীয় বেশ কয়েকটি অনুরূপ প্রশ্ন ব্যবহার করার সময় ভারসাম্যহীন ডেটা সম্পর্কে আমাদের ইতিমধ্যে একাধিক প্রশ্ন ছিল , এটি কী খুব জনপ্রিয় একটি বিষয় হিসাবে তৈরি করে! দুর্ভাগ্যক্রমে, প্রতিটি প্রশ্নের উত্তর অ্যালগরিদম-নির্দিষ্ট বলে মনে হয়েছে এবং ভারসাম্যহীন ডেটা নিয়ে কাজ করার জন্য আমি কোনও সাধারণ নির্দেশিকা পাইনি।
ভারসাম্যহীন ডেটা নিয়ে কাজ করে মার্ক ক্লেসেনের একটি উত্তর উদ্ধৃত করা
(...) শেখার পদ্ধতির উপর খুব বেশি নির্ভর করে। বেশিরভাগ সাধারণ উদ্দেশ্য পদ্ধতির সাথে এটি মোকাবেলার এক (বা বেশ কয়েকটি) উপায় রয়েছে।
তবে ভারসাম্যহীন ডেটা নিয়ে কখন আমাদের চিন্তা করা উচিত? কোন অ্যালগরিদমগুলি বেশিরভাগর দ্বারা এটি দ্বারা প্রভাবিত হয় এবং কোনটি এটি মোকাবেলা করতে সক্ষম? কোন অ্যালগরিদমে আমাদের ডেটা ভারসাম্য বজায় রাখতে হবে? আমি সচেতন যে প্রতিটি অ্যালগরিদম নিয়ে আলোচনা করা যেমন প্রশ্নোত্তর সাইটে এইভাবে অসম্ভব, আমি কখন এটির সমস্যা হতে পারে সে সম্পর্কে একটি সাধারণ নির্দেশিকা খুঁজছি।