ভূমিকা
কাপ্পা পরিসংখ্যাত (অথবা মান) একটি মেট্রিক যে তুলনা হয় পর্যবেক্ষিত যথার্থতা একটি সঙ্গে এক্সপেকটেড যথার্থতা (র্যান্ডম সুযোগ)। কাপা পরিসংখ্যান শুধুমাত্র একটি একক শ্রেণিবদ্ধকারীকে মূল্যায়ন করতে নয়, তবে নিজেদের মধ্যে শ্রেণিবদ্ধদের মূল্যায়ন করতে ব্যবহৃত হয়। উপরন্তু, এটা র্যান্ডম সুযোগ (একটি র্যান্ডম ক্লাসিফায়ার সঙ্গে চুক্তি), যা সাধারণত এটি সহজভাবে (ক মেট্রিক যেমন সঠিকতা ব্যবহার করে একটি কম বিভ্রান্তিকর অর্থ একাউন্টে লাগে পর্যবেক্ষিত যথার্থতা 80% অনেক কম একটি সঙ্গে চিত্তাকর্ষক এক্সপেকটেড যথার্থতা 75% 50% এর প্রত্যাশিত নির্ভুলতা বনাম )। পর্যবেক্ষিত নির্ভুলতা এবং প্রত্যাশিত নির্ভুলতার গণনাকাপা পরিসংখ্যান বোঝার জন্য অবিচ্ছেদ্য এবং একটি বিভ্রান্তির ম্যাট্রিক্স ব্যবহারের মাধ্যমে খুব সহজেই চিত্রিত করা হয়েছে। বিড়াল এবং কুকুরের একটি সাধারণ বাইনারি শ্রেণিবদ্ধকরণ থেকে একটি সাধারণ বিভ্রান্তির ম্যাট্রিক্স দিয়ে শুরু করুন :
গুনতি
Cats Dogs
Cats| 10 | 7 |
Dogs| 5 | 8 |
ধরুন যে লেবেলযুক্ত ডেটাতে তদারকি করা মেশিন লার্নিং ব্যবহার করে একটি মডেল তৈরি করা হয়েছিল। এটি সর্বদা ক্ষেত্রে হতে হবে না; কাপা পরিসংখ্যান প্রায়শই দুটি মানব রেটারের মধ্যে নির্ভরযোগ্যতার পরিমাপ হিসাবে ব্যবহৃত হয়। নির্বিশেষে, কলামগুলি একটি "রাটার" এর সাথে মিলছে যখন সারিগুলি অন্য "রাটার" এর সাথে মিলবে। তদারকি করা মেশিন লার্নিংয়ে একটি "রেটার" স্থল সত্যকে প্রতিবিম্বিত করে (শ্রেণিবদ্ধ করার জন্য প্রতিটি উদাহরণের প্রকৃত মান), লেবেলযুক্ত ডেটা থেকে প্রাপ্ত এবং অন্য "রেটার" শ্রেণিবিন্যাস সম্পাদন করতে ব্যবহৃত মেশিন লার্নিং শ্রেণিবদ্ধকারী। চূড়ান্তভাবে এটি কোন বিষয় নয় যা কোনটি কাপা পরিসংখ্যান গণনা করতে হবে, তবে স্পষ্টতার জন্য ' শ্রেণীবিভাগেরও।
বিভ্রান্তির ম্যাট্রিক্স থেকে আমরা দেখতে পাই মোট 30 টি দৃষ্টান্ত রয়েছে (10 + 7 + 5 + 8 = 30)। প্রথম কলাম অনুসারে 15 কে বিড়াল (10 + 5 = 15) হিসাবে লেবেল করা হয়েছিল এবং দ্বিতীয় কলাম অনুসারে 15 কুকুর (7 + 8 = 15) হিসাবে লেবেল করা হয়েছিল । আমরা আরও দেখতে পাচ্ছি যে মডেলটি 17 টি উদাহরণকে বিড়াল হিসাবে শ্রেণীবদ্ধ করেছে (10 + 7 = 17) এবং 13 টি উদাহরণ কুকুর হিসাবে (5 + 8 = 13)।
পর্যবেক্ষিত যথার্থতা কেবল দৃষ্টান্ত যে সমগ্র বিভ্রান্তির ম্যাট্রিক্স সর্বত্র সঠিকভাবে শ্রেণীবদ্ধ করা হয় সংখ্যা, দৃষ্টান্ত যে হিসাবে লেবেল করা হয়েছে সংখ্যা অর্থাৎ বিড়াল মাধ্যমে স্থল সত্য এবং তারপর শ্রেণীবদ্ধ যেমন বিড়াল দ্বারা মেশিন লার্নিং ক্লাসিফায়ার , অথবা লেবেল হিসাবে কুকুর মাধ্যমে স্থল সত্য এবং তারপরে মেশিন লার্নিং শ্রেণিবদ্ধ দ্বারা কুকুর হিসাবে শ্রেণিবদ্ধ করা । পর্যবেক্ষিত যথার্থতা গণনা করতে , আমরা কেবল মেশিন লার্নিং শ্রেণিবদ্ধকারী স্থল সত্যের সাথে একমত হয়ে সংখ্যার উদাহরণ সংযোজন করিলেবেল এবং উদাহরণগুলির মোট সংখ্যা দ্বারা বিভক্ত। এই বিভ্রান্তির ম্যাট্রিক্সের জন্য এটি 0.6 ((10 + 8) / 30 = 0.6) হবে।
কাপা স্ট্যাটিস্টিক্সের সমীকরণে পৌঁছানোর আগে আমাদের আরও একটি মান প্রয়োজন: প্রত্যাশিত নির্ভুলতা । এই মানটি নির্ভুলতা হিসাবে সংজ্ঞায়িত করা হয় যে কোনও র্যান্ডম শ্রেণিবদ্ধকারী বিভ্রান্তির ম্যাট্রিক্সের উপর ভিত্তি করে অর্জন করবে বলে আশা করা হচ্ছে। এক্সপেকটেড যথার্থতা সরাসরি প্রতিটি শ্রেণী (দৃষ্টান্ত সংখ্যা সঙ্গে সম্পর্কযুক্ত বিড়াল এবং কুকুর ), দৃষ্টান্ত সংখ্যা সহ মেশিন লার্নিং ক্লাসিফায়ার সঙ্গে একমত স্থল সত্য লেবেল। নিরূপণ করার জন্য এক্সপেকটেড যথার্থতা আমাদের বিভ্রান্তির ম্যাট্রিক্স জন্য, প্রথম গুন প্রান্তিক ফ্রিকোয়েন্সি এর বিড়াল দ্বারা একটি "রেট প্রদানকারী" জন্য প্রান্তিক ফ্রিকোয়েন্সি এরদ্বিতীয় "রেটার" এর জন্য বিড়াল , এবং দৃষ্টান্তগুলির মোট সংখ্যার দ্বারা ভাগ করা। প্রান্তিক ফ্রিকোয়েন্সি একটি নির্দিষ্ট "রেট প্রদানকারী" দ্বারা একটি নির্দিষ্ট বর্গ জন্য শুধু সমস্ত উদাহরণ "রেট প্রদানকারী" উল্লেখ করেছিলেন যে বর্গ ছিল এর সমষ্টি। আমাদের ক্ষেত্রে, 15 (10 + + 5 = 15) দৃষ্টান্ত হিসাবে লেবেল করা হয়েছে বিড়াল অনুযায়ী স্থল সত্য , এবং 17 (10 + + 7 = 17) দৃষ্টান্ত হিসাবে শ্রেণীবদ্ধ করা হয় বিড়াল দ্বারা মেশিন লার্নিং ক্লাসিফায়ার । এটির ফলাফল 8.5 (15 * 17/30 = 8.5) এর মান । এরপরে এটি দ্বিতীয় শ্রেণির জন্যও করা হয় (এবং 2 টির বেশি হলে প্রতিটি অতিরিক্ত শ্রেণির জন্য পুনরাবৃত্তি করা যেতে পারে)। 15(7 + 8 = 15) উদাহরণগুলিতে কুকুর হিসাবে লেবেল ছিলস্থল সত্য অনুসারে , এবং 13 (8 + 5 = 13) উদাহরণগুলি মেশিন লার্নিং শ্রেণিবদ্ধ দ্বারা কুকুর হিসাবে শ্রেণিবদ্ধ করা হয়েছিল । এটির ফলাফল 6.5 (15 * 13/30 = 6.5) এর মান । চূড়ান্ত পদক্ষেপ এই সব মান একসঙ্গে যোগ করার জন্য, এবং পরিশেষে, দৃষ্টান্ত মোট সংখ্যা দ্বারা আবার বিভক্ত একটি ফলে নেই এক্সপেকটেড যথার্থতা এর 0.5 ((8.5 + + 6.5) / 30 = 0.5)। আমাদের উদাহরণে, প্রত্যাশিত যথার্থতা নিষ্কাশিত 50% হতে, হিসাবে সবসময় ক্ষেত্রে হতে হবে যখন হয় "রেট প্রদানকারী" একই ফ্রিকোয়েন্সি সঙ্গে প্রতিটি বর্গ একটি বাইনারি ক্লাসিফিকেশন শ্রেণী (উভয় বিড়ালএবং কুকুরগুলিতে আমাদের কনফিউশন ম্যাট্রিক্সের গ্রাউন্ড ট্রুথ লেবেল অনুসারে 15 টি দৃষ্টান্ত রয়েছে )।
কাপ্তার পরিসংখ্যানগুলি তখন পর্যবেক্ষণ যথাযথতা ( 0.60 ) এবং প্রত্যাশিত নির্ভুলতা ( 0.50 ) এবং সূত্র দুটি ব্যবহার করে গণনা করা যেতে পারে :
Kappa = (observed accuracy - expected accuracy)/(1 - expected accuracy)
সুতরাং, আমাদের ক্ষেত্রে, কাপা পরিসংখ্যান সমান: (0.60 - 0.50) / (1 - 0.50) = 0.20।
অন্য উদাহরণ হিসাবে, এখানে একটি কম ভারসাম্য বিভ্রান্তির ম্যাট্রিক্স এবং সম্পর্কিত গণনা:
Cats Dogs
Cats| 22 | 9 |
Dogs| 7 | 13 |
স্থল সত্য: বিড়াল (29), কুকুর (22)
মেশিন লার্নিং ক্লাসিফায়ার: বিড়াল (31), কুকুর (20)
মোট: (51)
পর্যবেক্ষণ যথাযথতা: ((22 + 13) / 51) = 0.69
প্রত্যাশিত নির্ভুলতা: ((29) * 31/51) + (22 * 20/51)) / 51 = 0.51
কাপা: (0.69 - 0.51) / (1 - 0.51) = 0.37
সংক্ষেপে, ক্যাপ স্ট্যাটিস্টিক এমন একটি পরিমাপ যা মেশিন লার্নিং ক্লাসিফায়ার দ্বারা শ্রেণিবদ্ধ করা দৃষ্টান্তগুলি প্রত্যাশিত নির্ভুলতার দ্বারা পরিমাপিত একটি এলোমেলো শ্রেণিবদ্ধের যথার্থতার জন্য নিয়ন্ত্রণ করে গ্রাউন্ড সত্য হিসাবে লেবেলযুক্ত ডেটার সাথে কতটা ঘনিষ্ঠভাবে মিলিত হয়েছিল । এই কাপা পরিসংখ্যানগুলি কেবল শ্রেণিবদ্ধ নিজেই কীভাবে সম্পাদন করেছিল সে সম্পর্কে আলোকপাত করতে পারে না, একই মডেলটির জন্য কাপা পরিসংখ্যানগুলি একই শ্রেণিবিন্যাস কার্যের জন্য ব্যবহৃত অন্য কোনও মডেলের জন্য কপা পরিসংখ্যানের সাথে সরাসরি তুলনাযোগ্য।
ব্যাখ্যা
কাপা পরিসংখ্যানের কোনও মানক ব্যাখ্যা নেই। উইকিপিডিয়া অনুসারে (তাদের কাগজ উদ্ধৃত করে), ল্যান্ডিস এবং কোচ 0-0.20 কে সামান্য হিসাবে, 0.21-0.40 ন্যায্য হিসাবে, 0.41-0.60কে মাঝারি হিসাবে, 0.61-0.80কে যথেষ্ট হিসাবে এবং 0.81-1 প্রায় নিখুঁত হিসাবে বিবেচনা করে। ফ্লাইস কাপ্পাস> ০.75৫ কে দুর্দান্ত, 0.40-0.75 কে ভাল হিসাবে ভাল এবং <0.40 দরিদ্র হিসাবে বিবেচনা করে। এটি লক্ষ্য করা গুরুত্বপূর্ণ যে উভয় স্কেলগুলি কিছুটা স্বেচ্ছাচারী। কাপা পরিসংখ্যান ব্যাখ্যার সময় কমপক্ষে আরও দুটি বিবেচনার বিষয়টি বিবেচনায় নেওয়া উচিত। প্রথমত, সর্বাধিক নির্ভুল ব্যাখ্যাটি পাওয়া সম্ভব হলে কাপা পরিসংখ্যানকে সর্বদা সাথে থাকা বিভ্রান্তির ম্যাট্রিক্সের সাথে তুলনা করা উচিত। নিম্নলিখিত বিভ্রান্তির ম্যাট্রিক্স বিবেচনা করুন:
Cats Dogs
Cats| 60 | 125 |
Dogs| 5 | 5000|
কাপা পরিসংখ্যান 0.47, ল্যান্ডিস এবং কোচ অনুসারে মাঝারি জন্য প্রান্তিকের উপরে এবং ফ্লাইসের পক্ষে ফর্সা ভাল। তবে বিড়ালদের শ্রেণিবদ্ধ করার জন্য হিট রেটটি লক্ষ্য করুন । সমস্ত বিড়ালের এক তৃতীয়াংশেরও কম প্রকৃতপক্ষে বিড়াল হিসাবে শ্রেণিবদ্ধ ছিল ; বাকী সবাই কুকুর হিসাবে শ্রেণিবদ্ধ হয়েছিল । যদি আমরা বিড়ালদের সঠিকভাবে শ্রেণিবদ্ধকরণ সম্পর্কে আরও যত্নশীল (বলুন, আমরা ক্যাটসের প্রতি অ্যালার্জিযুক্ত তবে কুকুরের কাছে নয় , এবং আমরা যে সমস্ত প্রাণীর যত্ন নিয়েছি সেগুলি আমাদের যত প্রাণীর সংখ্যায় গ্রহণ করা যায় সর্বাধিক করার বিপরীতে নয়), তারপরে একটি নিম্ন শ্রেণীর কাপা তবে শ্রেণিবদ্ধ বিড়ালগুলির চেয়ে আরও ভাল হার আরও আদর্শ হতে পারে।
দ্বিতীয়ত, গ্রহণযোগ্য কাপা পরিসংখ্যানের মান প্রসঙ্গে ভিন্ন vary উদাহরণস্বরূপ, সহজেই পর্যবেক্ষণযোগ্য আচরণগুলির সাথে অনেক আন্ত-রাটার নির্ভরযোগ্যতা অধ্যয়নগুলিতে, 0.70 এর নীচে কাপা স্ট্যাটিস্টিক মানগুলি কম বলে বিবেচিত হতে পারে। যাইহোক, মেশিন লার্নিং ব্যবহার করে অজ্ঞাতনামা ঘটনা যেমন দিবস স্বপ্ন দেখার মতো জ্ঞানীয় রাজ্যের অন্বেষণ করতে ব্যবহার করেছেন, কেপ্পা পরিসংখ্যানের মানগুলি 0.40 এর উপরে।
সুতরাং, 0.40 কাপ্পা সম্পর্কে আপনার প্রশ্নের উত্তরে এটি নির্ভর করে। যদি অন্য কিছু না হয় তবে এর অর্থ হ'ল শ্রেণিবদ্ধকারী প্রত্যাশিত যথার্থতা এবং 100% যথার্থতার মধ্যবর্তী স্তরের শ্রেণিবিন্যাসের 2/5 হার অর্জন করেছিল। যদি প্রত্যাশিত নির্ভুলতা 80% ছিল, তার অর্থ শ্রেণীবদ্ধকারী 20% এর 40% (কারণ কাপা 0.4) করেছেন (কারণ এটি 80% এবং 100% এর মধ্যে দূরত্ব) 80% এর উপরে (কারণ এটি 0 এর একটি কাপা, বা এলোমেলো সুযোগ) বা 88%। সুতরাং, সেই ক্ষেত্রে, 0.10 এর কাপা প্রতিটি বৃদ্ধি শ্রেণিবদ্ধকরণের নির্ভুলতায় 2% বৃদ্ধি নির্দেশ করে। নির্ভুলতার পরিবর্তে যদি 50% হয়, তবে 0.4 এর একটি কাপ্পার অর্থ হল শ্রেণিবদ্ধকারী 50% (50% থেকে 100% এর মধ্যে দূরত্ব) 50% (40% এর মধ্যে দূরত্ব) এর 40% (0.4 এর কপা) এর যথার্থতার সাথে সম্পাদন করেছিলেন (কারণ এটি একটি 0 এর কাপা, বা এলোমেলো সুযোগ), বা 70%। আবার, এক্ষেত্রে তার মানে হ'ল কাপা বাড়ছে।
প্রত্যাশিত নির্ভুলতার ক্ষেত্রে এই স্কেলিংয়ের কারণে বিভিন্ন শ্রেণীর বিতরণের ডেটা সেটগুলিতে নির্মিত এবং মূল্যায়ন করা শ্রেণিবদ্ধদের কাপা পরিসংখ্যানের মাধ্যমে আরও নির্ভরযোগ্যভাবে তুলনা করা যেতে পারে (কেবল নিখুঁতভাবে ব্যবহারের বিরোধিতা হিসাবে)। এটি ক্লাসিফায়ার কীভাবে সমস্ত দৃষ্টান্তে পারফর্ম করে তার একটি আরও ভাল সূচক দেয় কারণ শ্রেণি বিতরণ একইভাবে স্কিউড করা থাকলে একটি সাধারণ নির্ভুলতা স্কিউ করা যায়। পূর্বে উল্লিখিত হিসাবে, 80% এর নির্ভুলতা প্রত্যাশিত নির্ভুলতা বনাম 75% এর প্রত্যাশিত নির্ভুলতার সাথে অনেক বেশি চিত্তাকর্ষক। উপরে বর্ণিত হিসাবে প্রত্যাশিত নির্ভুলতা স্কিউড বর্গ বিতরণগুলির পক্ষে সংবেদনশীল, সুতরাং কাপা পরিসংখ্যানের মাধ্যমে প্রত্যাশিত নির্ভুলতার জন্য নিয়ন্ত্রণ করে আমরা বিভিন্ন শ্রেণির বিতরণের মডেলগুলিকে আরও সহজে তুলনা করার অনুমতি দিই।
আমার যা কিছু আছে তা। যদি কেউ বাদ পড়ে থাকা কিছু, কোনও ভুল, বা কিছু এখনও অস্পষ্ট লক্ষ্য করে তবে দয়া করে আমাকে জানিয়ে দিন যাতে আমি উত্তরটি উন্নত করতে পারি।
উল্লেখগুলি আমি সহায়ক বলে মনে করেছি:
কাপ্পার একটি সংক্ষিপ্ত বিবরণ অন্তর্ভুক্ত: http://standardwisdom.com/softwarej Journal/2011/12/confusion-matrix-another-single-value-metric-kappa-statistic/
প্রত্যাশিত নির্ভুলতার গণনা করার বিবরণ অন্তর্ভুক্ত:
http://epivle.ccnmtl.columbia.edu/popup/how_to_calculate_kappa.html