আমি এই আলোচনাটি পড়ে শেষ করেছি । তাদের যুক্তি রয়েছে যে ভারসাম্যহীন ডেটাসেটের ক্ষেত্রে আরওসি এউসি থেকে পিআর এউসি ভাল।
উদাহরণস্বরূপ, আমাদের পরীক্ষার ডেটাসেটে 10 টি নমুনা রয়েছে। 9 টি নমুনা ধনাত্মক এবং 1 টি নেতিবাচক। আমাদের কাছে একটি ভয়াবহ মডেল রয়েছে যা সবকিছুকে ইতিবাচক বলে পূর্বাভাস দেয়। সুতরাং, আমাদের কাছে এমন একটি মেট্রিক থাকবে যা টিপি = 9, এফপি = 1, টিএন = 0, এফএন = 0।
তারপরে, যথার্থতা = 0.9, পুনরায় কল করুন = 1.0। যথার্থতা এবং পুনরুদ্ধার উভয়ই খুব বেশি, তবে আমাদের একটি নিম্ন শ্রেণিবদ্ধ রয়েছে।
অন্যদিকে, টিপিআর = টিপি / (টিপি + এফএন) = 1.0, এফপিআর = এফপি / (এফপি + টিএন) = 1.0। যেহেতু এফপিআর খুব বেশি, আমরা সনাক্ত করতে পারি যে এটি একটি ভাল শ্রেণিবদ্ধ নয়।
স্পষ্টতই, ভারসাম্যহীন ডেটাসেটের ক্ষেত্রে আরওসি PR এর চেয়ে ভাল। কেউ আরও ব্যাখ্যা করতে পারেন কেন পিআর ভাল?