ভারসাম্যহীন ডেটাসেট সমস্ত ক্ষেত্রে একটি সাধারণ সমস্যা এবং বিশেষত কম্পিউটার দৃষ্টি এবং কনভলিউশনাল নিউরাল নেটওয়ার্ক (সিএনএন) দ্বারা পরিচালিত সমস্যাগুলির বিষয়ে উদ্বেগ প্রকাশ করে না।
এই সমস্যাটি মোকাবেলার জন্য আপনার সংখ্যালঘু শ্রেণির অতিরিক্ত নমুনা বা নিম্ন-স্যাম্পলিং সংখ্যাগরিষ্ঠ শ্রেণি (বা উভয়) দ্বারা আপনার ডেটাসেটকে ভারসাম্য করার চেষ্টা করা উচিত। তর্কযুক্তভাবে, একটি ভাল পছন্দ হবে স্মোট (সিনথেটিক মাইনরিটি ওভার-স্যাম্পলিং টেকনিক) এলগোরিদম, উপরে উল্লিখিত হিসাবে। এখানে আপনি বিভিন্ন ওভার-স্যাম্পলিং অ্যালগরিদমের তুলনা খুঁজে পেতে পারেন। আপনি যদি পাইথন ব্যবহারকারী হন তবে ভারসাম্যহীন-শেখা একটি দুর্দান্ত লাইব্রেরি যা ডেটাসেটগুলিকে ভারসাম্যপূর্ণ করার জন্য অনেক দরকারী কৌশল প্রয়োগ করে।
অন্যদিকে, আপনি যদি চিত্রগুলিকে শ্রেণিবদ্ধ করার চেষ্টা করছেন, আপনার ডেটাসেটের আকার বাড়ানোর একটি দুর্দান্ত উপায় হ'ল এটি বৃদ্ধি করা (অর্থাত্ যুক্তিযুক্ত সিন্থেটিক উদাহরণ তৈরি করে, উদাহরণস্বরূপ অনুরূপ চিত্রগুলি কিন্তু মূল চিত্রগুলির সাথে সম্মিলিতভাবে ঘোরানো / স্থানান্তরিত ছোট্ট বিট)। উন্নত ভারসাম্য অর্জনের জন্য আপনি সংখ্যালঘু শ্রেণিগুলিকে বাড়িয়ে তুলতে কখনও কখনও দরকারী হতে পারেন। কেরাস ইমেজডেটা জেনারেটর ক্লাস এই উদ্দেশ্যে একটি ভাল সরঞ্জাম।