মূল্যায়ন হিসাবে এওসির পরিবর্তে নরমালাইজড গিনি স্কোর কেন ব্যবহার করবেন?


14

কাগল এর প্রতিযোগিতা পোর্তো সেগুরোর নিরাপদ ড্রাইভার ভবিষ্যদ্বাণী মূল্যায়ন মেট্রিক হিসাবে নরমালাইজড গিনি স্কোরকে ব্যবহার করে এবং এটি এই পছন্দের কারণ সম্পর্কে আমাকে কৌতূহলযুক্ত করে তুলেছে । মূল্যায়নের জন্য এটুসির মতো সর্বাধিক মেট্রিকের পরিবর্তে সাধারণ গিনি স্কোর ব্যবহারের সুবিধা কী কী?


1
কেগল ওয়েবসাইটটির এই উত্তরটি ছিল: "একটি নিখুঁত" মডেলটির সর্বাধিক অর্জনযোগ্য ক্ষেত্র রয়েছে কারণ সমস্ত ইতিবাচক উদাহরণগুলি তত্ক্ষণাত্ ঘটে না We আমরা জিনির সহগ দ্বারা আপনার মডেলের গিনি গুণফলকে ভাগ করে সাধারণ গিনি সহগটি ব্যবহার করি We নিখুঁত মডেল। " তবে এটি আর পাওয়া যায় না। webcache.googleusercontent.com/…
Sextus Empiricus

1
সুতরাং, গিনি কেবল বিভিন্ন স্কেলে নিলাম। বা নকল এবং গিনি বিভিন্ন বক্ররেখা প্রয়োগ করা হয়? এটি আমার কাছে মেশিন-লার্নিংয়ের অ-বিশেষজ্ঞ হিসাবে স্পষ্ট নয়। এই সম্পর্কে প্রশ্ন খুব পরিষ্কার নয়।
সেক্সটাস এম্পেরিকাস

উত্তর:


3

gini=2×AUC1

6
গিনি সহগ ব্যবহার করে এলোমেলো শ্রেণিবদ্ধের পারফরম্যান্সকে 0 স্কোর করে দেয় ... সাধারণীকরণ স্কেলের অন্য প্রান্তকে "উন্নত" করে এবং একটি নিখুঁত শ্রেণিবদ্ধকারীর স্কোর সর্বাধিক অর্জনের চেয়ে 1 এর সমান হয় AUC <1। আপনি আরও স্বজ্ঞাত স্কেল ভাল কিনা তা নির্ভর করে কেবল উন্নতি কেবল আপেক্ষিক হয়ে ওঠে। যদিও এই সহজ ব্যাখ্যার বাইরে আপনি যুক্তি দিতে পারেন যে এটি (সাধারণীকরণ) বিভিন্ন তথ্য-সেটের সাধারণীকরণ এবং তুলনাও উন্নত করে।
সেক্সটাস এম্পেরিকাস

কেন ম্যাক্সিমাম প্রাপ্তি এউসি 1 এর চেয়ে কম হওয়া উচিত, এছাড়াও আমি দেখতে পাচ্ছি না যে গিনি কীভাবে এটি 1 এ সেট করছে?
rep_ho

এটি নির্ভর করে যে তারা কী ধরণের বক্ররেখা গণনা সহগকে গণনা করে। হতে পারে তারা একটি আরওসি বক্ররেখার চেয়ে আলাদা কিছু ব্যবহার করে (যার সর্বাধিক এওসি প্রকৃতপক্ষে 1 হবে)। কেগল ওয়েবসাইটে দেওয়া শব্দটি দেওয়া দেখে মনে হয় যে সর্বোচ্চ এওসি 1 নয়:> "আমরা তখন বাম থেকে ডানে সরে
সেক্সটাস এম্পেরিকাস

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.