0-1 ক্ষতি ফাংশন ব্যাখ্যা


19

ক্ষতির ফাংশনের উদ্দেশ্য কী তা আমি উপলব্ধি করার চেষ্টা করছি এবং আমি এটি বেশ বুঝতে পারি না।

সুতরাং, যতদূর আমি বুঝতে পারি ক্ষতির ফাংশনটি এমন এক ধরণের মেট্রিক প্রবর্তনের জন্য যা আমরা একটি ভুল সিদ্ধান্তের "ব্যয়" পরিমাপ করতে পারি।

সুতরাং আসুন আমি বলি যে আমার কাছে 30 টি অবজেক্টের একটি ডেটাসেট রয়েছে, আমি তাদের 20/10 এর মতো প্রশিক্ষণ / পরীক্ষার সেটে ভাগ করেছি আমি 0-1 লোকস ফাংশনটি ব্যবহার করব, সুতরাং আমার ক্লাসের লেবেলগুলির সেট এম হয় এবং ফাংশনটি দেখতে দেখতে এটির মতো দেখায় :

এল(আমি,)={0আমি=1আমিআমি,এম

সুতরাং আমি আমার প্রশিক্ষণের ডেটাতে কিছু মডেল তৈরি করেছি, বলি যে আমি নাইভ বয়েস শ্রেণিবদ্ধকারী ব্যবহার করছি এবং এই মডেলটি 7 টি অবজেক্টকে সঠিকভাবে শ্রেণিবদ্ধ করেছে (তাদেরকে সঠিক শ্রেণির লেবেল বরাদ্দ করেছে) এবং 3 টি অবজেক্টকে ভুলভাবে শ্রেণিবদ্ধ করা হয়েছিল।

সুতরাং আমার ক্ষতির ফাংশন "0" 7 বার এবং "1" 3 বার ফিরে আসবে - আমি এর থেকে কী ধরণের তথ্য পেতে পারি? আমার মডেলটি 30% অবজেক্টকে ভুলভাবে শ্রেণিবদ্ধ করেছে? নাকি এর আরও কিছু আছে?

আমার ভাবনার পথে যদি কোনও ভুল থাকে তবে আমি খুব দুঃখিত, আমি কেবল শিখার চেষ্টা করছি। আমার দেওয়া উদাহরণটি যদি "খুব বিমূর্ত" হয় তবে আমাকে জানান, আমি আরও সুনির্দিষ্ট হওয়ার চেষ্টা করব। যদি আপনি বিভিন্ন উদাহরণ ব্যবহার করে ধারণাটি ব্যাখ্যা করার চেষ্টা করে থাকেন তবে দয়া করে 0-1 ক্ষতি ফাংশনটি ব্যবহার করুন।

উত্তর:


14

কার্যকরভাবে নির্ভুলতার দিকে তাকানো হিসাবে আপনি 0-1 ক্ষতি ফাংশনটি সঠিকভাবে সংক্ষিপ্ত করেছেন। আপনার 1 জন বিবিধ শ্রেণীর আইটেমগুলির জন্য সূচক হয়ে উঠেছে, সেগুলিকে কীভাবে ভুল শ্রেণিবদ্ধ করা হয়েছিল তা নির্বিশেষে। যেহেতু 10 টি আইটেমের মধ্যে আপনার 3 টি রয়েছে তাই আপনার শ্রেণিবিন্যাসের নির্ভুলতা 70%।

আপনি যদি ক্ষতির ফাংশনে ওজন পরিবর্তন করেন তবে এই ব্যাখ্যাটি আর প্রয়োগ হয় না। উদাহরণস্বরূপ, রোগের শ্রেণিবিন্যাসে, মিথ্যাভাবে রোগ নির্ণয়ের চেয়ে (মিথ্যা পজিটিভ) রোগের চেয়ে ইতিবাচক কেস (মিথ্যা নেতিবাচক) মিস করা আরও ব্যয়বহুল হতে পারে। এই ক্ষেত্রে, আপনার ক্ষতি ফাংশন আরও বেশি ভারী নেতিবাচক ভুল মিথ্যাচারকে ওজন করবে। আপনার ক্ষতির পরিমাণটি আর এই ক্ষেত্রে নির্ভুলতার প্রতিনিধিত্ব করবে না, বরং বিযুক্তির সম্পূর্ণ "ব্যয়"। 0-1 ক্ষতি ফাংশন নির্ভুলতার সাথে তার সমতুল্যে অনন্য, যেহেতু আপনার যত্ন নেওয়া সমস্ত হ'ল আপনি এটি সঠিকভাবে পেয়েছেন কি না এবং কীভাবে ত্রুটিগুলি করা হয়েছে তা নয়।


@JohnnyJohansson পরিসংখ্যানে accurracy সংজ্ঞা যে, দেখতে en.wikipedia.org/wiki/Sensitivity_and_specificity
টিম

@ টিম - আমি এখনও 0-1 লোকসান কার্যক্রমে বিভ্রান্ত হয়েছি - ফলস্বরূপ ম্যাট্রিক্সের 1 টিরও বেশি কোনও মান থাকতে পারে, যদি 3 টি মিস শ্রেণিবদ্ধতা হয় তবে আমরা সংশ্লিষ্ট এন্ট্রিতে 3 এর মান দেখতে পারি? এখানে দেখুন ম্যাথ.স্ট্যাকেক্সেঞ্জারভিউ
জাভিয়ার


0

আমি মনে করি আপনার বিভ্রান্তি একটি ডেটা পয়েন্ট এবং সম্পূর্ণ ডেটা সেটের জন্য ক্ষতির তুলনায় ক্ষতির পার্থক্য করছে না।

L(y,y^)

iL(yi,y^i)

আমি আসলে পার্থক্যটি পেয়েছি, তবে পুরো ডেটাসেটের জন্য ক্ষতির গণনা করা ছাড়া অন্য কোনও ডেটা পয়েন্টের জন্য আমার এই ক্ষতির কী দরকার তা বুঝতে আমার পক্ষে কষ্ট হয়? এবং কোনও নির্দিষ্ট সমস্যার জন্য পর্যাপ্ত ক্ষতির ফাংশন বেছে নেওয়ার সময় আমার কী বিবেচনা করা উচিত?
জনি জোহানসন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.