শ্রেণিবদ্ধের জন্য সর্বোত্তম প্রান্তিকতা কীভাবে নির্ধারণ করবেন এবং আরওসি বক্ররেখা উত্পন্ন করবেন?


27

ধরা যাক আমাদের একটি এসভিএম শ্রেণিবদ্ধ রয়েছে, আমরা কীভাবে আরওসি বক্রতা তৈরি করব? (তাত্ত্বিকভাবে পছন্দ করুন) (কারণ আমরা প্রতিটি প্রান্তিকের সাথে টিপিআর এবং এফপিআর তৈরি করি)। এবং কীভাবে আমরা এই এসভিএম শ্রেণিবদ্ধের জন্য সর্বোত্তম প্রান্তিকতা নির্ধারণ করব?


উত্তর:


14

বর্ণিত উদাহরণগুলির একটি সেটকে শ্রেণিবদ্ধ করতে SVM শ্রেণিবদ্ধকারী ব্যবহার করুন এবং উদাহরণগুলির একটি পূর্বাভাসের ভিত্তিতে আরওসি স্পেসে "একটি পয়েন্ট" চিহ্নিত করা যেতে পারে। ধরুন উদাহরণের সংখ্যা 200, প্রথমে চারটি মামলার উদাহরণের সংখ্যাটি গণনা করুন।

labeledtruelabeledfalsepredictedtrue7128predictedfalse5744


তারপরে টিপিআর (সত্য পজিটিভ রেট) এবং এফপিআর (মিথ্যা পজিটিভ রেট) গণনা করুন। , এবং আরওসি স্পেসে এক্স-অক্ষটি এফপিআর, এবং y- অক্ষটি টিপিআর হয়। সুতরাং পয়েন্ট প্রাপ্ত হয়। একটি আরওসি বক্ররেখা আঁকতে, কেবল (1) কিছু প্রান্তিক মান সামঞ্জস্য করুন যা সত্য বা মিথ্যা লেবেলযুক্ত উদাহরণগুলির সংখ্যা নিয়ন্ত্রণ করেTPR=71/(71+57)=0.5547FPR=28/(28+44)=0.3889(0.3889,0.5547)



উদাহরণস্বরূপ, যদি protein% এর উপরে নির্দিষ্ট প্রোটিনের ঘনত্ব কোনও রোগকে চিহ্নিত করে, α এর বিভিন্ন মান বিভিন্ন চূড়ান্ত টিপিআর এবং এফপিআর মান দেয়। প্রান্তিক মানগুলি গ্রিড অনুসন্ধানের অনুরূপভাবে নির্ধারণ করা যেতে পারে; বিভিন্ন প্রান্তিক মান সহ লেবেল প্রশিক্ষণের উদাহরণ, লেবেলযুক্ত উদাহরণগুলির বিভিন্ন সেট সহ ট্রেনের শ্রেণিবদ্ধকারী, পরীক্ষার ডেটাগুলিতে শ্রেণিবদ্ধকার চালান, এফপিআর মানগুলি গণনা করুন এবং প্রান্তিক মানগুলি নির্বাচন করুন যা নিম্নের (0 এর কাছাকাছি) এবং উচ্চ (1 টির কাছে) এফপিআর অন্তর্ভুক্ত করে মানসমূহ, অর্থাত্ 0, 0.05, 0.1, ..., 0.95, 1

(2) টীকাযুক্ত উদাহরণের অনেক সেট উত্পন্ন করুন
(3) উদাহরণগুলির সেটগুলিতে শ্রেণিবদ্ধ চালান
(4) গণনা একটি (এফপিআর, টিপিআর) পয়েন্ট তাদের প্রত্যেকের জন্য
(5) চূড়ান্ত আরওসি বক্ররেখা আঁকুন

কিছু বিবরণ http://en.wikedia.org/wiki/Receiver_operating_characteristic- এ চেক করা যায় ।

এছাড়াও, এই দুটি লিঙ্ক কীভাবে অনুকূল থ্রেশহোল্ড নির্ধারণ করবেন সে সম্পর্কে কার্যকর। একটি সহজ পদ্ধতি হ'ল সত্যের ধনাত্মক এবং মিথ্যা নেতিবাচক হারের সর্বাধিক যোগফলের সাথে এটি নেওয়া। অন্যান্য সূক্ষ্ম মাপদণ্ডে আর্থিক কাঠামো ইত্যাদির মতো বিভিন্ন থ্রেশহোল্ডগুলির সাথে জড়িত অন্যান্য ভেরিয়েবলগুলি অন্তর্ভুক্ত থাকতে পারে
http:
// -curves প্রাপক-অপারেটিং characteristic.html


5
আপনার ব্যাখ্যার জন্য ধন্যবাদ, অনুকূল থ্রেশহোল্ড সম্পর্কে কী?
রকটিস্টার

1
দুঃখিত, আমি শিখেছি যে অনুকূল প্রান্তিকতা একটি বিশেষ শব্দটি ঠিক এর আগে। অনুসন্ধানের পরে, আমি খুঁজে পেয়েছি যে গুগল বুকের "এসএএসের সাথে রিসিভার অপারেটিং চরিত্রগত কার্ভগুলির বিশ্লেষণ" বইয়ের "3.5 একটি অনুকূল থ্রেশহোল্ড নির্বাচন করা" বইয়ের সর্বোত্তম চৌম্বকটি নির্বাচন করার বিষয়ে কিছু বিশদ ব্যাখ্যা রয়েছে found এতে বর্ণিত দুটি বহুল ব্যবহৃত উপায় হ'ল প্রান্তিকতা বেছে নেওয়া যা ফলস্বরূপ বাইনারি পূর্বাভাস (1) যতটা সম্ভব নিখুঁত পূর্বাভাসকের নিকটবর্তী করে তুলবে। (২) যতটা সম্ভব অ-তথ্যমূলক ভবিষ্যদ্বাণী থেকে দূরে
টম

দুর্দান্ত, রেফারেন্সটা কোথায় পাব? ধন্যবাদ!
রকটিস্টার

2
হ্যাঁ, "একটি তথ্যহীন ভবিষ্যদ্বাণী থেকে অনেক দূরে" এর অর্থ কী? রেফারেন্স যোগ করুন।
সিমোন

1
এছাড়াও, আমি কেবল এটি থেকে পড়েছি যে অনুকূল থ্রেশহোল্ড নির্ধারণের জন্য অনেক মানদণ্ড রয়েছে। উদাহরণস্বরূপ, একটি সাধারণ মাপদণ্ডটি হ'ল সমস্ত থ্রেশহোল্ডের মধ্যে, সত্য-ধনাত্মক এবং মিথ্যা-নেতিবাচক মানগুলির সর্বাধিক যোগফল সহ একটি বেছে নিন। আরও অন্যান্য পরিশীলিত মানদণ্ড রয়েছে।
টম

3

একটি প্রান্তিক বাছাইয়ের সত্যিই সহজ উপায় হ'ল একটি পরীক্ষার সেটটির জন্য ইতিবাচক ক্ষেত্রেগুলির মধ্যমা পূর্বাভাসিত মানগুলি নেওয়া। এটি আপনার দোরগোড়ায় পরিণত হয়।

প্রান্তিকরটি আপনি সেই একই প্রান্তিকের কাছে তুলনামূলকভাবে কাছে আসেন যা আপনি রক বক্ররেখা ব্যবহার করে পাবেন যেখানে সত্য ধনাত্মক হার (টিআরপি) এবং 1 - মিথ্যা পজিটিভ রেট (এফপ্রি) ওভারল্যাপ। এই টিআরপি (ক্রস) 1-এফপি ক্রস মিথ্যা নেতিবাচক হ্রাস করার সময় সত্যিকারের ইতিবাচক সর্বাধিক করে তোলে।


আমি দেখি. মধ্যমা পূর্বাভাস মান। পরামর্শের জন্য ধন্যবাদ.
রকটস্টার

2
এই পদ্ধতির কোনও উত্স আছে?
জেকুইহুয়া

1
এটি আরওসি বক্ররেখায় টিপিআর = 0.5 এর সাথে পয়েন্টটি তুলার সমান, যা সত্যিই স্বেচ্ছাসেবী মনে হয়।
বনানিন

মিডিয়ান পূর্বাভাস মান? এবং আপনার যদি 1000: 1 এর বর্গ ভারসাম্যহীনতা থাকে?
ldmtwo

3

আপনার আরওসি স্পেসের উপরের বাম কোণে সবচেয়ে কাছের পয়েন্টটি চয়ন করুন। এখন এই পয়েন্টটি উত্পন্ন করতে ব্যবহৃত চৌম্বকটি সর্বোত্তম হওয়া উচিত।


2
কীভাবে এটি স্বয়ংক্রিয়ভাবে করবেন?
ldmtwo

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.