শ্রেণিবদ্ধের মূল্যায়ন: শেখার বক্ররেখ বনাম আরওসি বক্ররেখা


11

আমি একটি বহুবিধ পাঠ্য শ্রেণীবদ্ধকরণ সমস্যার জন্য 2 টি পৃথক শ্রেণিবদ্ধকে তুলনা করতে চাই যাতে বড় প্রশিক্ষণের ডেটাসেট ব্যবহার করা হয়। 2 শ্রেণিবদ্ধের সাথে তুলনা করার জন্য আমার আরওসি বক্ররেখা বা শিখন বক্র ব্যবহার করা উচিত কিনা তা নিয়ে আমি সন্দেহ করছি।

একদিকে, শেখার বক্ররেখাগুলি প্রশিক্ষণ ডেটাসেটের আকার নির্ধারণের জন্য দরকারী, যেহেতু আপনি যে ডেটাসেটের আকারটি খুঁজে পেতে পারেন যেখানে শ্রেণিবদ্ধ ব্যক্তি শেখা বন্ধ করে দেয় (এবং সম্ভবত অবনতি হয়)। তাই এক্ষেত্রে সেরা শ্রেণিবদ্ধকারী হ'ল ক্ষুদ্রতম ডেটাসেট আকারের সাথে সর্বোচ্চ নির্ভুলতায় পৌঁছানো।

অন্যদিকে, আরওসি বক্ররেখা আপনাকে সংবেদনশীলতা / নির্দিষ্টতার মধ্যে ডান বাণিজ্য-সহ একটি পয়েন্ট খুঁজে দেয়। এই ক্ষেত্রে সেরা শ্রেণিবদ্ধকারী হ'ল উপরের-বাম অংশের একের কাছাকাছি, কোনও এফপিআরের সর্বোচ্চ টিপিআর।

আমি উভয় মূল্যায়ন পদ্ধতি ব্যবহার করা উচিত? আরও ভাল লার্নিং কার্ভ সহ কোনও পদ্ধতির পক্ষে কী আরও খারাপ আরওসি বক্ররেখা এবং বিপরীতে থাকা সম্ভব?


প্রশিক্ষণের সেটটি বড় হওয়ার সাথে সাথে পারফরম্যান্স হ্রাস পেতে পারে এমন কোনও শ্রেণিবদ্ধের উদাহরণ রয়েছে কি?
মোগ্রন

উত্তর:


11

আপনার মডেলটি কীভাবে দ্রুত শিখছে এবং আপনার সম্পূর্ণ বিশ্লেষণ খুব ছোট সেট / খুব ছোট টুকরোয় (যদি প্রয়োগ হয়) একটি অতি স্পর্শকাতর জায়গায় আটকা যায় না বা না তা শিখতে বক্ররেখা কেবলমাত্র একটি নির্ণয়ের সরঞ্জাম tool এই চক্রান্তের একমাত্র অংশ যা মডেল নির্ধারণের জন্য আকর্ষণীয় তা হল এর সমাপ্তি, অর্থাৎ চূড়ান্ত কার্য সম্পাদন - তবে এটির রিপোর্ট করার জন্য কোনও প্লটের প্রয়োজন হয় না।
আপনার প্রশ্নে স্কেচিংয়ের সাথে শেখার কার্ভের উপর ভিত্তি করে একটি মডেল নির্বাচন করা বরং একটি দরিদ্র ধারণা, কারণ আপনি সম্ভবত এমন একটি মডেল নির্বাচন করতে পারেন যা খুব অল্প নমুনা সেটের চেয়ে বেশি উপযুক্ত।

আরওসি সম্পর্কে ... আরওসি বক্ররেখা বাইনারি মডেলগুলি যাচাই করে এমন একটি পদ্ধতি যা একটি আত্মবিশ্বাস স্কোর তৈরি করে যে কোনও বস্তু একটি শ্রেণীর অন্তর্গত; সম্ভবত তাদেরকে সত্যিকারের শ্রেণিবদ্ধে রূপান্তর করার জন্য সর্বোত্তম প্রান্তিক সন্ধান করতে।
আপনি যা বর্ণনা করেছেন তা হ'ল আরওসি স্পেসে টিপিআর / এফপিআর এর স্ক্র্যাটারপ্লট হিসাবে আপনার শ্রেণিবদ্ধের কার্যকারিতাটি কল্পনা করার জন্য এবং এটি নির্বাচন করতে নিকটস্থ থেকে উপরে-বাম-কোণে মানদণ্ড ব্যবহার করুন যা মিথ্যা অ্যালার্ম এবং মিসগুলি তৈরি করার মধ্যে সবচেয়ে ভাল ভারসাম্যপূর্ণ - - এই নির্দিষ্ট লক্ষ্যটি কেবল সর্বোত্তম এফ-স্কোর (নির্ভুলতা এবং পুনরুদ্ধারের সুরেলা গড়) দিয়ে মডেল নির্বাচন করে আরও মার্জিতভাবে অর্জন করা যেতে পারে ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.