আরওসি বক্ররেখা উত্পন্ন করতে (= রিসিভার অপারেটিং বৈশিষ্ট্যযুক্ত কার্ভগুলি):
ধরুন আমাদের কাছে লজিস্টিক রিগ্রেশন এর মতো একটি সম্ভাব্য, বাইনারি শ্রেণিবদ্ধ রয়েছে। আরওসি বক্ররেখা উপস্থাপনের আগে কনফিউশন ম্যাট্রিক্সের ধারণাটি বুঝতে হবে। আমরা যখন বাইনারি ভবিষ্যদ্বাণী করি তখন 4 ধরণের ত্রুটি হতে পারে:
- আমরা 0 পূর্বাভাস দিই যখন আমাদের ক্লাসটি হওয়া উচিত আসলে 0: এটিকে সত্য নেতিবাচক বলা হয় , অর্থাৎ আমরা সঠিকভাবে অনুমান করি যে শ্রেণিটি নেতিবাচক (0)। উদাহরণস্বরূপ, কোনও অ্যান্টিভাইরাস ভাইরাস হিসাবে কোনও ক্ষতিকারক ফাইল সনাক্ত করতে পারেনি।
- আমরা 0 পূর্বাভাস দিই যখন আমাদের ক্লাসটি হওয়া উচিত আসলে 1: একে ফালস নেগেটিভ বলা হয় , অর্থাৎ আমরা ভুলভাবে অনুমান করি যে শ্রেণিটি নেতিবাচক (0)। উদাহরণস্বরূপ, একটি অ্যান্টিভাইরাস কোনও ভাইরাস সনাক্ত করতে ব্যর্থ হয়েছিল।
- আমরা 1 টি পূর্বাভাস দিয়েছিলাম যখন আমাদের ক্লাসটি হওয়া উচিত আসলে 0: এটিকে একটি ফলস পজিটিভ বলা হয় , অর্থাৎ আমরা ভুলভাবে অনুমান করি যে শ্রেণিটি ইতিবাচক (1)। উদাহরণস্বরূপ, একটি অ্যান্টিভাইরাস কোনও ক্ষতিকারক ফাইলটিকে ভাইরাস হিসাবে বিবেচনা করে।
- আমরা পূর্বাভাস 1 যখন আমাদের ক্লাস থাকা উচিত আসলে 1: একে সত্য পজিটিভ বলা হয় , অর্থাৎ আমরা সঠিকভাবে অনুমান করি যে শ্রেণিটি ইতিবাচক (1)। উদাহরণস্বরূপ, একটি অ্যান্টিভাইরাস যথাযথভাবে একটি ভাইরাস সনাক্ত করেছে।
বিভ্রান্তির ম্যাট্রিক্স পেতে, আমরা মডেল দ্বারা তৈরি সমস্ত পূর্বাভাস পেয়েছি, এবং এই 4 ধরণের ত্রুটিগুলির মধ্যে প্রতিটি কতবার ঘটে তা গণনা করি:
একটি বিভ্রান্তির ম্যাট্রিক্সের এই উদাহরণে, শ্রেণিবদ্ধ করা হয়েছে এমন 50 টি ডাটা পয়েন্টগুলির মধ্যে 45 টি সঠিকভাবে শ্রেণিবদ্ধ করা হয়েছে এবং 5 টি ভুল শংসায়িত।
যেহেতু দুটি ভিন্ন মডেলের তুলনা করা প্রায়শই একাধিকটির চেয়ে একক মেট্রিক পাওয়া আরও সুবিধাজনক, তাই আমরা বিভ্রান্তির ম্যাট্রিক্স থেকে দুটি মেট্রিক গণনা করি, যা আমরা পরে একত্রিত করব:
- সত্য পজিটিভ রেট ( টিপিআর ), ওরফে। সংবেদনশীলতা, হিট রেট এবং স্মরণ , যা হিসাবে সংজ্ঞায়িত করা হয়েছেটিপিটিপি+ + এফএন । স্বজ্ঞাতভাবে এই মেট্রিকটি ইতিবাচক ডেটা পয়েন্টগুলির অনুপাতের সাথে মিলে যায় যা সঠিকভাবে ধনাত্মক হিসাবে বিবেচিত হয়, সমস্ত ইতিবাচক ডেটা পয়েন্টের সাথে সম্মান করে। অন্য কথায়, উচ্চতর টিপিআর, আমরা যত কম পজিটিভ ডেটা পয়েন্ট মিস করব।
- মিথ্যা পজিটিভ রেট ( এফপিআর ), ওরফে। ফল-আউট , যা হিসাবে সংজ্ঞায়িত করা হয়এফপিএফপি+ টিএন
0.00 ; 0.01 , 0.02 , … , 1.00
এই চিত্রটিতে, নীল অঞ্চলটি রিসিভার অপারেটিং চরিত্রগত (এআরওসি) এর বক্ররেখার সাথে থাকা অঞ্চলের সাথে মিলে যায়। তির্যকরে ড্যাশড লাইনটি আমরা একটি এলোমেলো পূর্বাভাসীর আরওসি বক্ররেখা উপস্থাপন করি: এর 0.5 টি এরওআরওসি রয়েছে। মডেলটি কার্যকর কিনা তা দেখার জন্য এলোমেলো ভবিষ্যদ্বাণী সাধারণত বেসলাইন হিসাবে ব্যবহৃত হয়।
যদি আপনি কিছু প্রথম হাতের অভিজ্ঞতা পেতে চান: