প্রদত্ত
- দৃষ্টান্ত দিয়ে একটি ডেটাসেটের একসাথে শ্রেণীর যেখানে প্রতিটি উদাহরণের ঠিক এক বর্গ জন্যে N x i y i
- একটি মাল্টিক্লাস শ্রেণিবদ্ধ
প্রশিক্ষণ ও পরীক্ষার পর আমি মূলত সঙ্গে একটি টেবিল আছে সত্য বর্গ এবং পূর্বাভাস বর্গ প্রতিটি উদাহরণের জন্য টেস্ট সেট হবে। সুতরাং প্রতিটি উদাহরণের জন্য আমার একটি হয় ম্যাচ ( y_i = a_i ) বা একটি মিস ( y_i \ neq a_i )।x i y i = a i y i ≠ a i
আমি কীভাবে ম্যাচের মানটি মূল্যায়ন করতে পারি? বিষয়টি হ'ল কিছু শ্রেণীর অনেক সদস্য থাকতে পারে, যেমন অনেকগুলি উদাহরণ এর সাথে সম্পর্কিত। স্পষ্টতই যদি সমস্ত ডেটা পয়েন্টের 50% এক শ্রেণির অন্তর্ভুক্ত থাকে এবং আমার চূড়ান্ত শ্রেণিবদ্ধকারী সামগ্রিকভাবে 50% সঠিক হয় তবে আমি কিছুই অর্জন করতে পারি নি। আমি ঠিক তেমনি একটি তুচ্ছ শ্রেণীবদ্ধ করতে পারি যা ইনপুট কী তা বিবেচনা না করেই সবচেয়ে বড় শ্রেণিকে আউটপুট করে দেয়।
প্রতিটি শ্রেণীর জন্য ম্যাচ এবং হিটগুলির পরিচিত পরীক্ষার সেট ফলাফলগুলির উপর ভিত্তি করে শ্রেণিবদ্ধের গুণমানের অনুমান করার জন্য কি কোনও স্ট্যান্ডার্ড পদ্ধতি আছে? সম্ভবত প্রতিটি নির্দিষ্ট শ্রেণীর জন্য ম্যাচের হারের পার্থক্য করা এমনকি গুরুত্বপূর্ণ?
আমি যে সহজ পদ্ধতির কথা ভাবতে পারি তা হ'ল বৃহত্তম শ্রেণির সঠিক মিলগুলি বাদ দেওয়া। আর কি?