(এর সংক্ষিপ্ত উত্তর দিতে :)
ভারসাম্যহীন ডেটাসেট নিয়ে কাজ করার সময় গ্রেডিয়েন্ট বুস্টিং মেশিন অ্যালগরিদম ব্যবহার করা ভাল। দৃ strongly়ভাবে ভারসাম্যহীন ডেটাসেটের সাথে ডিল করার সময় এটি ব্যবহার করা মেট্রিকের উপযুক্ততার প্রশ্নে অনেক বেশি প্রাসঙ্গিক। আমাদের যথাযথ প্রান্তিকতার উপর ভিত্তি করে যথাযথতা বা পুনরুদ্ধারের মতো মেট্রিকগুলি এড়ানো উচিত এবং এটিউসিপিআর বা ব্রায়ার স্কোরিংয়ের মতো মেট্রিকগুলি বেছে নেওয়া উচিত, যা আরও সঠিক চিত্র দেয় - চমৎকার সিভি.এসই থ্রেডটি দেখুন: সঠিকতাটি কেন নয় শ্রেণিবদ্ধকরণ মডেলগুলি মূল্যায়নের জন্য সেরা পরিমাপ? আরো বেশী). একইভাবে, আমরা বিভিন্ন বিবিধ শ্রেণিবদ্ধকরণ ব্যয় বরাদ্দ করে একটি সম্ভাব্য সংবেদনশীল পদ্ধতির নিয়োগ করতে পারি (উদাহরণস্বরূপ মাসনাদি-শিরাজি এবং ভাসকনস্লোস (২০১১) ব্যয়-সংবেদনশীল বুস্টিংসাধারণ ভিউ এবং প্রস্তাবিত বুস্টিং অ্যালগরিদমগুলিতে প্রস্তাবিত পরিবর্তনের জন্য বা একটি সহজ পদ্ধতির সাথে একটি বিশেষ আকর্ষণীয় অ্যাপ্লিকেশনটির জন্য এক্সজিবিস্ট আলগোরিদমের জন্য হিগস বোসন চ্যালেঞ্জ রিপোর্টটি পরীক্ষা করে দেখুন; চেন অ্যান্ড হি (2015) বুস্টড ট্রি সহ হিগস বোসন আবিষ্কার আরও বিশদ সরবরাহ করে)।
এটিও লক্ষণীয় যে আমরা যদি কোনও সম্ভাব্য শ্রেণিবদ্ধ (যেমন জিবিএম) নিযুক্ত করি তবে আমরা সক্রিয়ভাবে প্রত্যাশিত সম্ভাবনাগুলি ক্যালিব্রেট করার জন্য সক্রিয়ভাবে দেখতে পারি (উদাহরণস্বরূপ জাদরোজনি এবং এলকান (২০০২) শ্রেণিবদ্ধ স্কোরগুলি সঠিক মাল্টিক্লাস সম্ভাব্যতা অনুমান বা কুল এট আল-তে রূপান্তরিত করে ) ( 2017) বিটা ক্যালিব্রেশন: বাইনারি শ্রেণিবদ্ধের জন্য লজিস্টিক ক্যালিফিকেশনের উপর একটি সু-প্রতিষ্ঠিত এবং সহজেই উন্নতিসাধন করা হয়েছে ) সম্ভাব্যভাবে আমাদের শিক্ষার্থীদের কর্মক্ষমতা বাড়ানোর জন্য। বিশেষত ভারসাম্যহীন ডেটা নিয়ে কাজ করার সময় প্রবণতা পরিবর্তনগুলি ক্যাপচার করার জন্য কেবল ডেটা লেবেল করার চেয়ে তথ্যমূলক হতে পারে। এই পরিমাণে, কিছু যুক্তিযুক্ত হতে পারে যে ব্যয়-সংবেদনশীল পন্থাগুলি শেষের দিকে তেমন সুবিধাজনক নয় (উদাঃ নিকোলাউ এট আল দেখুন (২০১))ব্যয় সংবেদনশীল বৃদ্ধিকারী অ্যালগরিদম: আমাদের কি সত্যই তাদের প্রয়োজন? )। যদিও মূল বিষয়টির পুনরাবৃত্তি করতে, ভারসাম্যহীন অ্যালগরিদমগুলি ভারসাম্যহীন ডেটার জন্য সহজাত খারাপ নয় এবং কিছু ক্ষেত্রে তারা খুব প্রতিযোগিতামূলক বিকল্প দিতে পারে।