উত্তর:
আপনি চয়ন করতে পারেন ত্রুটি মেট্রিকের পুলটি শ্রেণিবদ্ধকরণ এবং রিগ্রেশন এর মধ্যে পৃথক। পরবর্তী সময়ে আপনি একটি অবিচ্ছিন্ন মান পূর্বাভাস দেওয়ার চেষ্টা করেন এবং শ্রেণিবিন্যাসের সাথে আপনি "স্বাস্থ্যকর" বা "স্বাস্থ্যকর নয়" এর মতো বিচ্ছিন্ন শ্রেণির পূর্বাভাস দেন। আপনার উল্লিখিত উদাহরণগুলি থেকে, মূল শ্রেণীর ত্রুটি দুটি শ্রেণীর সাথে শ্রেণিবদ্ধকরণের জন্য রিগ্রেশন এবং এউসি-র জন্য প্রযোজ্য।
শ্রেণিবিন্যাস সম্পর্কে আমি আপনাকে আরও কিছুটা বিশদ দেব। আপনি একটি পরিমাপ হিসাবে AUC উল্লেখ করেছেন, যা আরওসি বক্ররেখার অধীনে অঞ্চল, যা সাধারণত দুটি বর্গ সহ কেবল বাইনারি শ্রেণিবদ্ধকরণ সমস্যায় প্রয়োগ করা হয়। যদিও, আরও দুটি শ্রেণীর জন্য একটি আরওসি বক্ররেখা তৈরি করার উপায় রয়েছে, তারা দুটি শ্রেণীর জন্য আরওসি বক্ররেখা সরলতা .িলা করে। তদতিরিক্ত, আরওসি বক্ররেখা কেবল তখনই নির্মিত হতে পারে যদি পছন্দের শ্রেণিবদ্ধকারী প্রতিটি পূর্বাভাসের সাথে যুক্ত কিছু ধরণের স্কোর আউটপুট করে। উদাহরণস্বরূপ, লজিস্টিক রিগ্রেশন আপনাকে দুটি ক্লাসের প্রতিটিটির জন্য সম্ভাব্যতা দেয়। তাদের সরলতার পাশাপাশি আরওসি বক্ররেখাগুলির সুবিধা রয়েছে যে তারা আপনার ডেটাসেটগুলিতে ইতিবাচক এবং নেতিবাচক লেবেলযুক্ত দৃষ্টান্তগুলির মধ্যে অনুপাতের দ্বারা প্রভাবিত হবে না এবং আপনাকে একটি চৌম্বক পছন্দ করতে বাধ্য করবেন না। তবুও, কেবল আরওসি বক্ররেখাটিই নয় বরং অন্যান্য ভিজ্যুয়ালাইজেশনের দিকেও নজর দেওয়া উচিত। আমি যথার্থ-রিক্যাল রেভেল রেখাঙ্কন এবং মূল্য-বক্ররেখাগুলি একবার দেখার পরামর্শ দিই।একটি সত্য ত্রুটি পরিমাপ, তাদের সকলের শক্তি এবং দুর্বলতা রয়েছে।
এই ক্ষেত্রে আমি যে সাহিত্যগুলি সহায়ক বলে মনে করেছি সেগুলি হ'ল:
যদি আপনার শ্রেণিবদ্ধকারী কোনও ধরণের স্কোর সরবরাহ না করে তবে আপনাকে সেই মৌলিক পদক্ষেপগুলিতে ফিরে যেতে হবে যা সত্য ধনাত্মক, মিথ্যা ধনাত্মক, সত্য নেতিবাচক এবং মিথ্যা নেতিবাচক সংখ্যার সমন্বিত বিভ্রান্তির ম্যাট্রিক্স থেকে প্রাপ্ত হতে পারে । উপরে বর্ণিত ভিজ্যুয়ালাইজেশনগুলি (আরওসি, নির্ভুলতা-পুনর্বিবেচনা, দামের বক্ররেখা) সমস্ত শ্রেণিবদ্ধকারীর স্কোরের পৃথক থ্রোসোল্ড ব্যবহার করে প্রাপ্ত এই টেবিলগুলির উপর ভিত্তি করে। এই ক্ষেত্রে সর্বাধিক জনপ্রিয় পরিমাপটি সম্ভবত এফ 1-পরিমাপ। এছাড়াও, একটি বিভ্রান্তির ম্যাট্রিক্স থেকে আপনি যে পরিমাপগুলি পুনরুদ্ধার করতে পারবেন তার একটি দীর্ঘ তালিকা রয়েছে: সংবেদনশীলতা, নির্দিষ্টতা, ইতিবাচক ভবিষ্যদ্বাণীমূলক মান, নেতিবাচক ভবিষ্যদ্বাণীমূলক মান, যথার্থতা, ম্যাথিউস পারস্পরিক সম্পর্ক সহগ,… আরওসি বক্ররেখার মতো, বিভ্রান্তির ম্যাট্রিকগুলি খুব সহজেই বোঝা যায় বাইনারি শ্রেণিবদ্ধকরণ সমস্যা, তবে একাধিক ক্লাসের সাথে আরও জটিল হয়ে উঠুন, কারণ ক্লাসগুলির জন্য আপনাকে অন্য একটির সাথে ক্লাসের ( ) তুলনা করে প্রতিটি একক টেবিল বা টেবিলকে বিবেচনা করতে হবে ক্লাস (না )।
ইতিমধ্যে বিদ্যমান উত্তরগুলিতে আমাকে আরও কিছু চিন্তা যুক্ত করুন।
আপনার অধ্যয়নের নকশার উপর নির্ভর করে সঠিকভাবে বা ভুল শ্রেণিবদ্ধ নমুনাগুলির সামগ্রিক ভগ্নাংশ একটি উপযুক্ত সংক্ষিপ্তসার হতে পারে বা নাও হতে পারে এবং আপনি যে সিদ্ধান্তগুলি থেকে আঁকতে পারেন তাও অধ্যয়ন নকশার উপর নির্ভর করবে: আপনার পরীক্ষার ডেটা কি পূর্বের সম্ভাবনাগুলি (প্রসার) প্রতিফলিত করে? ক্লাস? যে জনসংখ্যার জন্য আপনার শ্রেণিবদ্ধ ব্যবহার করার কথা রয়েছে? এটি কি স্তরবদ্ধভাবে সংগ্রহ করা হয়েছিল? এটি শ্রেণিবদ্ধের বেশিরভাগ ব্যবহারকারী ভবিষ্যদ্বাণীপূর্ণ মানগুলিতে বেশি আগ্রহী এমনটির সাথে এটি জড়িত, তবে সংবেদনশীলতা এবং নির্দিষ্টতা পরিমাপ করা আরও অনেক সহজ।
আপনি সাধারণ নির্দেশিকা সম্পর্কে জিজ্ঞাসা করুন। একটি সাধারণ নির্দেশিকা হ'ল আপনার জানা দরকার
আমি মনে করি আপনি এই প্রশ্নের উত্তর না দিয়ে আপনি কোনও কার্যকর মেট্রিক খুঁজে পাবেন না able
এটি কিছুটা হলেও শ্রেণিবদ্ধকরণের যাচাইকরণের জন্য নিখরচায় দুপুরের খাবার নেই।
প্রত্যাশিত বিযুক্তি ত্রুটির হার হ'ল আমি যে পদ্ধতিটি ব্যবহার করেছি এবং প্রায়শই দেখি। আরওসি এর এউসি হ'ল শ্রেণিবিন্যাসের নিয়মের একটি সেট। যদি ধারণাটি নির্দিষ্ট শ্রেণিবদ্ধের সাথে অন্যের সাথে তুলনা করা হয় তবে তবে এওসি উপযুক্ত নয়। শ্রেণিবিন্যাস ত্রুটির কিছু ফর্ম সর্বাধিক বোধগম্য করে কারণ এটি শ্রেণিবিন্যাসের বিধিটির প্রত্যক্ষভাবে কার্য সম্পাদন করে।
পুনর্গঠন অনুমানের বৃহত পক্ষপাত এবং ছুটি-ওয়ান-আউটের উচ্চতম বৈচিত্রের কারণে শ্রেণিবিন্যাস ত্রুটির হারের ভাল অনুমানের সন্ধান করতে অনেক কাজ চলে গেছে। বুটস্ট্র্যাপ এবং মসৃণ অনুমানক উদ্বেগিত হয়েছে। উদাহরণস্বরূপ ক্রস বৈধকরণের চেয়ে বুটস্ট্র্যাপের উন্নতি সম্পর্কে 1983-এ জাসা-এ এফ্রনের কাগজ দেখুন।
ইফ্রন এবং তিবশিরামির 1995 সালের স্ট্যানফোর্ড বিশ্ববিদ্যালয়ের একটি প্রযুক্তিগত প্রতিবেদন আমার নিজস্ব কিছু কাজ সহ সাহিত্যের সংক্ষিপ্তসার রয়েছে।