আপনি কীভাবে নির্ভুলতা গণনা করবেন এবং বিভ্রান্তির ম্যাট্রিক্স ব্যবহার করে মাল্টিক্লাস শ্রেণিবিন্যাসের জন্য পুনরায় কল করবেন?


92

আমি আশ্চর্য হয়েছি যে কীভাবে নির্ভুলতা গণনা করা যায় এবং একটি বহু-শ্রেণীর শ্রেণিবিন্যাস সমস্যার জন্য কনফিউশন ম্যাট্রিক্স ব্যবহার করে পুনরুদ্ধার করা যায়। বিশেষত, একটি পর্যবেক্ষণ কেবল তার সর্বাধিক সম্ভাব্য শ্রেণি / লেবেলকে দেওয়া যেতে পারে। আমি গণনা করতে চাই:

  • যথার্থতা = টিপি / (টিপি + এফপি)
  • পুনরুদ্ধার = টিপি / (টিপি + এফএন)

প্রতিটি শ্রেণীর জন্য এবং তারপরে মাইক্রো-এভারেজেড এফ-মাপ গণনা করুন।


এই ডকএক্স , একটি শ্রেণিবদ্ধকরণের মডেলটির মূল্যায়ন - সঠিকতা এবং প্রত্যাহার আমাকে কী বলে? , কমপুমাইন থেকে বিভ্রান্তির ম্যাট্রিক্স এবং এর থেকে প্রাপ্ত পদক্ষেপের একটি সহজ ভূমিকা সরবরাহ করে। এটি বিভ্রান্তির ম্যাট্রিক্স, নির্ভুলতা, প্রত্যাহার, সুনির্দিষ্টতা এবং নির্ভুলতা তৈরি করতে সহায়তা করে।
জয়রান চুপান

4
উত্তর এখানে খুঁজে। খুব ভাল ব্যাখ্যা youtube.com/watch?v=FAr2GmWNbT0

কমম্পাইন লিঙ্কটি মারা গেছে।
ট্রেনটন

মাল্টিক্লাস কেসের ক্ষেত্রে, আমি কী বুঝতে পারি যে সারিগুলির সাথে (অক্ষ = 0) প্রত্যাহার এবং কলামগুলির পাশাপাশি (অক্ষ = 1) যথার্থতা। rxnlp.com/…
এমডি জিয়া উল্লাহ

উত্তর:


69

২-অনুমানের ক্ষেত্রে বিভ্রান্তির ম্যাট্রিক্স সাধারণত:

       | Declare H1  |  Declare H0 |
|Is H1 |    TP       |   FN        |
|Is H0 |    FP       |   TN        |

যেখানে আমি আপনার স্বীকৃতির অনুরূপ কিছু ব্যবহার করেছি:

  • টিপি = সত্য ধনাত্মক (এইচ 1 ঘোষণা করুন, সত্যে, H1),
  • এফএন = মিথ্যা নেতিবাচক (এইচ 0 ঘোষণা করুন, সত্যে, এইচ 1),
  • এফপি = মিথ্যা পজিটিভ
  • টিএন = সত্য নেতিবাচক

কাঁচা ডেটা থেকে, সারণির মানগুলি সাধারণত পরীক্ষার ডেটাতে প্রতিটি সংখ্যার জন্য গণনা করা হবে। এটি থেকে আপনার প্রয়োজনীয় পরিমাণগুলি গণনা করতে সক্ষম হওয়া উচিত।

সম্পাদন করা

বহু-শ্রেণীর সমস্যার সাধারণীকরণ হ'ল বিভ্রান্তির ম্যাট্রিক্সের সারি / কলামগুলির সমষ্টি। প্রদত্ত যে ম্যাট্রিক্স উপরের দিকে যেমন কেন্দ্রিক, অর্থাৎ ম্যাট্রিক্সের একটি প্রদত্ত সারি "সত্য" এর জন্য নির্দিষ্ট মানের সাথে মিলে যায়, আমাদের আছে:

Precision i=MiijMji

Recall i=MiijMij

iiii


1
আমার ক্ষেত্রে, এখানে 10+ শ্রেণি রয়েছে, সুতরাং আমি অনুমান করি যে এফএন এর অর্থ ঘোষিত ক্লাস এইচ (i) এর মোট গণনা হবে, i! = 1; এবং একই এফপি?
daiyue

হাই, আমি অবাক হয়েছি যে মানগুলি যথার্থতা এবং পুনর্বিবেচনার জন্য কী হবে যদি টিপি + এফপি = 0, এবং টিপি + এফএন = 0 বিভ্রান্তির ম্যাট্রিক্সের কিছু প্রকৃত শ্রেণির জন্য।
দাইয়ে

iঅ্যালগরিদম ঘোষিত এমন কোনও দৃষ্টান্ত না থাকলে শ্রেণির জন্য নির্ভুলতা নির্ধারিত iiপরীক্ষার সেটটিতে শ্রেণীর অন্তর্ভুক্ত না হলে শ্রেণির জন্য পুনর্বিবেচনা অপরিজ্ঞাত i
ডেভ

আমার চূড়ান্ত লক্ষ্য ম্যাক্রো এফ পরিমাপ গণনা করা হয়, সুতরাং আমার প্রতিটি শ্রেণীর জন্য যথার্থতা এবং পুনরুদ্ধার মানগুলি প্রয়োজন; সুতরাং উপরোক্ত দুটি ক্ষেত্রে কিছু শ্রেণিতে উপস্থিত হলে আমি কীভাবে ম্যাক্রো-এফ পরিমাপের গননা করতে পারি? বিশেষত, ফাইয়ের মান কী এবং আমি ক্লাস এম এর মধ্যে একটি শ্রেণি হিসাবে গণনা করি যে এম এর উপাদানগুলির সংখ্যা ম্যাক্রো এফ পরিমাপের গণনা করার সূত্রের বিভাজন হিসাবে গণ্য হবে।
ডেইউ

1
sry, আপনি আপনার ধারণা আরও পরিষ্কারভাবে ব্যাখ্যা করতে পারেন?
দাইয়ু

31

ভাল সারসংক্ষেপ কাগজ, বহু-শ্রেণীর সমস্যার জন্য এই মেট্রিকগুলিতে দেখে:

  • সোকলোভা, এম।, এবং ল্যাপালমে, জি। (২০০৯)। শ্রেণিবদ্ধকরণ কার্যগুলির জন্য কর্মক্ষমতা ব্যবস্থার একটি পদ্ধতিগত বিশ্লেষণ। তথ্য প্রক্রিয়াকরণ এবং পরিচালনা, 45 , পি। 427-437। ( পিডিএফ )

বিমূর্তটি পড়ে:

এই কাগজটি মেশিন লার্নিং শ্রেণিবদ্ধকরণ কার্যগুলির সম্পূর্ণ বর্ণালীতে ব্যবহৃত অর্থাত্ বাইনারি, মাল্টি-ক্লাস, মাল্টি-লেবেলযুক্ত, এবং শ্রেণিবিন্যাসের চব্বিশটি পারফরম্যান্স ব্যবস্থার একটি পদ্ধতিগত বিশ্লেষণ উপস্থাপন করে। প্রতিটি শ্রেণিবদ্ধকরণের জন্য, অধ্যয়নটি একটি বিভ্রান্তির ম্যাট্রিক্সের পরিবর্তনের একটি সেটকে নির্দিষ্ট বৈশিষ্ট্যের সাথে সম্পর্কিত করে। তারপরে বিশ্লেষণ একটি বিভ্রান্তির ম্যাট্রিক্সের পরিবর্তনের ধরণের উপরে মনোনিবেশ করে যা কোনও পরিমাপ পরিবর্তন করে না, সুতরাং, শ্রেণিবদ্ধের মূল্যায়ন (পরিমাপের চালান) সংরক্ষণ করে। ফলাফল হ'ল একটি শ্রেণিবিন্যাসের সমস্যা সম্পর্কিত সমস্ত প্রাসঙ্গিক লেবেল বিতরণের পরিবর্তনের ক্ষেত্রে পরিমাপের ইনভারিয়েন্স শৈলী। এই আনুষ্ঠানিক বিশ্লেষণ অ্যাপ্লিকেশনগুলির উদাহরণগুলির দ্বারা সমর্থিত যেখানে ব্যবস্থাগুলির বিপরীতে সম্পত্তিগুলি শ্রেণিবদ্ধদের আরও নির্ভরযোগ্য মূল্যায়নের দিকে পরিচালিত করে।


2
@ জেমসটেলর সাইটে আপনাকে স্বাগতম। আপনি কি লিঙ্কটি কাগজে তথ্য সংক্ষিপ্ত বিবরণ দেওয়ার জন্য পাঠকদের সিদ্ধান্ত নিতে প্রয়োজন যে এটির প্রয়োজন কি না এবং লিঙ্কটি মারা যাওয়ার ক্ষেত্রে কী তা প্রয়োজন?
গাং

8

স্ক্যালার্ন এবং নম্পী ব্যবহার করে:

from sklearn.metrics import confusion_matrix
import numpy as np

labels = ...
predictions = ...

cm = confusion_matrix(labels, predictions)
recall = np.diag(cm) / np.sum(cm, axis = 1)
precision = np.diag(cm) / np.sum(cm, axis = 0)

নির্ভুলতার এবং সামগ্রিক পুনর্বিবেচনার সামগ্রিক পদক্ষেপগুলি পেতে, তখন ব্যবহার করুন

np.mean(recall)
np.mean(precision)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.