মূল্যায়ন সম্পর্কে অনেক ভুল বোঝাবুঝি রয়েছে। এর অংশটি ডেটাসেটে অ্যালগরিদমগুলি অনুকূল করার চেষ্টা করার মেশিন লার্নিং পদ্ধতির থেকে এসেছে, ডেটাতে কোনও আগ্রহ নেই।
চিকিত্সার প্রসঙ্গে, এটি আসল বিশ্বের ফলাফলগুলি সম্পর্কে - উদাহরণস্বরূপ, আপনি কত লোককে মারা যাওয়া থেকে বাঁচান। চিকিত্সার প্রসঙ্গে সংবেদনশীলতা (টিপিআর) ব্যবহার করা হয় যে কতগুলি ইতিবাচক কেস সঠিকভাবে বাছাই করা হয়েছে (অনুপাতটিকে মিথ্যা নেগেটিভ = এফএনআর হিসাবে হ্রাস করা হয়) যখন নির্দিষ্টকরণ (টিএনআর) ব্যবহার করা হয় ঠিক কতটি নেতিবাচক ক্ষেত্রে রয়েছে তা দেখতে অপসারণ (অনুপাতকে মিথ্যা ধনাত্মক হিসাবে পাওয়া = = এফপিআর হ্রাস করা)। কিছু রোগের মিলিয়নে একের প্রসার ঘটে। সুতরাং আপনি যদি সর্বদা নেতিবাচকভাবে অনুমান করেন তবে আপনার 0.999999 এর যথার্থতা রয়েছে - এটি সাধারণ জিরোআর লার্নার দ্বারা সাধিত হয় যা সর্বাধিক শ্রেণীর পূর্বাভাস দেয়। আপনি যদি রোগমুক্ত, এমন ভবিষ্যদ্বাণী করার জন্য যদি আমরা পুনঃ কল এবং যথার্থতার বিষয়টি বিবেচনা করি তবে আমাদের কাছে জিরোর জন্য রিক্যাল = 1 এবং যথার্থতা = 0.999999 রয়েছে। অবশ্যই, যদি আপনি + ve এবং -টি বিপরীত হন এবং ভবিষ্যদ্বাণী করার চেষ্টা করেন যে কোনও ব্যক্তির জিরোআর রোগ রয়েছে তবে আপনি পুনরায় কল করুন = 0 এবং যথার্থতা = অপরিশোধিত (যেমন আপনি ইতিবাচক পূর্বাভাসও করেননি, তবে প্রায়শই লোকেরা যথার্থতাকে 0 হিসাবে সংজ্ঞায়িত করে কেস)। মনে রাখবেন যে রিক্যাল (+ ভীম রিকাল) এবং বিপরীতমুখী রিকাল (-আর রিকাল), এবং সম্পর্কিত টিপিআর, এফপিআর, টিএনআর এবং এফএনআর সর্বদা সংজ্ঞায়িত হয় কারণ আমরা কেবল সমস্যাটি মোকাবিলা করছি কারণ আমরা জানি যে পার্থক্য করার জন্য দুটি শ্রেণি রয়েছে এবং আমরা ইচ্ছাকৃতভাবে সরবরাহ করি প্রতিটি উদাহরণ।
চিকিত্সা প্রসঙ্গে ক্যান্সার নিখোঁজ করার মধ্যে বিশাল পার্থক্যটি লক্ষ্য করুন (কোনও ব্যক্তি মারা যান এবং আপনার বিরুদ্ধে মামলা করা হবে) বনাম কোনও ওয়েব অনুসন্ধানে একটি কাগজ না পাওয়া (অন্য কোনও একজন যদি এর গুরুত্বপূর্ণ হয় তবে এটি উল্লেখ করবেন)। উভয় ক্ষেত্রেই এই ত্রুটিগুলি মিথ্যা নেতিবাচক হিসাবে চিহ্নিত করা হয়, বিপুল পরিমাণে নেতিবাচক হিসাবে। ওয়েবসার্চের ক্ষেত্রে আমরা স্বয়ংক্রিয়ভাবে প্রকৃত নেতিবাচক সংখ্যার একটি বৃহত জনসংখ্যা পেয়ে যাব কারণ আমরা কেবলমাত্র একটি সংখ্যক ফলাফল দেখি (উদাহরণস্বরূপ 10 বা 100) এবং প্রদর্শিত না হওয়া সত্যই নেতিবাচক ভবিষ্যদ্বাণী হিসাবে গ্রহণ করা উচিত নয় (এটি হতে পারে 101) ), ক্যান্সার পরীক্ষার ক্ষেত্রে আমাদের প্রত্যেকের জন্য ফলাফল রয়েছে এবং ওয়েবসার্কের বিপরীতে আমরা সক্রিয়ভাবে মিথ্যা নেতিবাচক স্তর (হার) নিয়ন্ত্রণ করি।
সুতরাং আরওসি সত্যিকারের ধনাত্মক (বাস্তব ধনাত্মক অনুপাত হিসাবে মিথ্যা নেতিবাচক বনাম) এবং মিথ্যা ধনাত্মক (সত্য versণাত্মকগুলির অনুপাত হিসাবে সত্য negativeণাত্মক) এর মধ্যে ট্রেড অফকে অন্বেষণ করছে। এটি সংবেদনশীলতা (+ ve পুনরুদ্ধার) এবং বিশিষ্টতা (- পুনরুদ্ধার) তুলনা করার সমান equivalent একটি পিএন গ্রাফও রয়েছে যা দেখতে দেখতে একই দেখাচ্ছে যেখানে আমরা টিপিআর বনাম এফপি তুলনায় টিপিআর বনাম এফপিআর তৈরি করি - তবে যেহেতু আমরা প্লটটিকে বর্গক্ষেত্র তৈরি করি ততই পার্থক্যটি আমরা আঁশিতে যে সংখ্যাগুলি রেখেছি is এগুলি ধ্রুবক দ্বারা টিপিআর = টিপি / আরপি, এফপিআর = টিপি / আরএন সম্পর্কিত যেখানে আরপি = টিপি + এফএন এবং আরএন = এফএন + এফপি ডেটাসেটে রিয়েল পজিটিভ এবং রিয়েল নেতিবাচক সংখ্যা এবং বিপরীত পক্ষপাতমূলক পিপি = টিপি + এফপি এবং পিএন = টিএন + এফএন হ'ল আমরা ইতিবাচক বা নেতিবাচক ভবিষ্যদ্বাণী করা বারের সংখ্যা। নোট করুন যে আমরা আরপি = আরপি / এন এবং আরএন = আরএন / এনকে ধনাত্মক সম্মানের প্রসারকে বলি। নেতিবাচক এবং পিপি = পিপি / এন এবং আরপি = আরপি / এন ইতিবাচক দিক থেকে পক্ষপাতিত্ব।
আমরা যদি গড় সংবেদনশীলতা এবং নির্দিষ্টতা যোগ করি বা ট্রেড অফ কার্ভের আওতাধীন অঞ্চলটি দেখি (আরওসি কেবল এক্স-অক্ষকে বিপরীত করে তুলি) তবে আমরা একই ফলাফলটি পাই যদি আমরা কোন শ্রেণিটি + Ve এবং + ve হয় আদান-প্রদান করি। যথার্থতা এবং পুনর্বিবেচনার ক্ষেত্রে এটি সত্য নয় (উপরে জিরোর দ্বারা রোগের পূর্বাভাস সহ চিত্রিত)। এই স্বেচ্ছাচারিতা যথার্থতা, পুনর্বিবেচনা এবং তাদের গড় (পাটিগণিত, জ্যামিতিক বা সুরেলা) এবং ট্রেড অফ গ্রাফের একটি বড় ঘাটতি।
সিস্টেমের পরামিতিগুলি পরিবর্তিত হওয়ার সাথে সাথে PR, PN, ROC, LIFT এবং অন্যান্য চার্টগুলি প্লট করা হয়েছে। প্রশিক্ষিত প্রতিটি পৃথক ব্যবস্থার জন্য এই ক্লাসিক্যালি প্লট পয়েন্টগুলি প্রায়শই একটি প্রান্তিক বৃদ্ধি বা হ্রাস হওয়ায় বিন্দুটি ইতিবাচক বনাম নেতিবাচক হিসাবে সংঘটিত হয় এমন বিন্দুটি পরিবর্তন করে।
কখনও কখনও প্লট করা পয়েন্টগুলি একইভাবে প্রশিক্ষিত সিস্টেমগুলির সেট (তবে বিভিন্ন এলোমেলো সংখ্যা বা স্যাম্পলিং বা অর্ডারিং ব্যবহার করে) প্যারামিটার / থ্রেশহোল্ডস / অ্যালগোরিদমগুলি পরিবর্তিত করতে পারে over এগুলি তাত্ত্বিক গঠন যা কোনও বিশেষ সমস্যার ক্ষেত্রে পারফরম্যান্সের পরিবর্তে সিস্টেমগুলির গড় আচরণ সম্পর্কে আমাদের জানায়। ট্রেড অফ চার্টগুলি নির্দিষ্ট অ্যাপ্লিকেশনটির জন্য সঠিক অপারেটিং পয়েন্ট বাছাই করতে আমাদের সহায়তা করার উদ্দেশ্যে করা হয়েছে (ডেটাসেট এবং অ্যাপ্রোচ) এবং এই জায়গা থেকেই আরওসি এর নাম পেয়েছে (রিসিভার অপারেটিং বৈশিষ্ট্যগুলি প্রাপ্ত তথ্যের সর্বাধিকীকরণের উদ্দেশ্যে, তথ্যের অর্থে)।
আসুন বিবেচনা করা যাক রিকাল বা টিপিআর বা টিপি এর বিরুদ্ধে কী ষড়যন্ত্র করা যেতে পারে।
টিপি বনাম এফপি (পিএন) - হুবহু বিভিন্ন সংখ্যার সাথে আরওসি প্লটের মতো দেখাচ্ছে
টিপিআর বনাম এফপিআর (আরওসি) - এফসির সাথে এফপিআরের বিপরীতে টিপিআর অপরিবর্তিত থাকলে +/- বিপরীত হয়।
টিপিআর বনাম টিএনআর (এলটি আরওসি) - আরএনসির মিরর ইমেজ টিএনআর = 1-এফপিআর (টিএন + এফপি = আরএন) হিসাবে
টিপি বনাম পিপি (লিফট) - ধনাত্মক এবং নেতিবাচক উদাহরণগুলির জন্য এক্স Incs (ননলাইনার প্রসারিত)
টিপিআর বনাম পিপি (Alt লিফট) - কেবল বিভিন্ন সংখ্যার সাথে লিফ্টের মতো দেখতে লাগে
টিপি বনাম 1 / পিপি - লিফ্টের সাথে খুব সমান (তবে ননলাইনার প্রসারিতের সাথে বিপরীত)
টিপিআর বনাম 1 / পিপি - টিপি বনাম 1 / পিপি এর সমান দেখাচ্ছে (y- অক্ষের বিভিন্ন সংখ্যা)
টিপি বনাম টিপি / পিপি - অনুরূপ তবে এক্স-অক্ষের প্রসারের সাথে (টিপি = এক্স -> টিপি = এক্স * টিপি)
টিপিআর বনাম টিপি / পিপি - অক্ষতে বিভিন্ন সংখ্যা সহ একই দেখায় looks
শেষটি রিকাল বনাম যথার্থতা!
এই গ্রাফগুলির জন্য নোট করুন যে কোনও বক্ররেখা যা অন্যান্য বক্ররেখাকে প্রাধান্য দেয় (উন্নত বা কমপক্ষে সমস্ত পয়েন্টে উচ্চতর) এখনও এই রূপান্তরগুলির পরে প্রভাব ফেলবে। যেহেতু আধিপত্যের অর্থ প্রতিটি বিন্দুতে "কমপক্ষে উচ্চতর", উচ্চ বক্ররেখাটি বক্ররেখার (এওসি) এর অধীন একটি অঞ্চলও "কমপক্ষে উচ্চ" থাকে কারণ এটিতে বক্ররেখার মধ্যবর্তী অঞ্চলও অন্তর্ভুক্ত থাকে। বিপরীতটি সত্য নয় : যদি কার্ভগুলি ছেদ করে, স্পর্শের বিপরীতে, কোনও আধিপত্য থাকে না তবে একটি এওসি এখনও অন্যটির চেয়ে বড় হতে পারে।
সমস্ত রূপান্তরগুলি হ'ল আরওসি বা পিএন গ্রাফের একটি বিশেষ অংশে প্রতিবিম্বিত এবং / অথবা বিভিন্ন (লিনিয়ার নয়) উপায়ে জুম করা। তবে, শুধুমাত্র আরওসি-র বক্ররেখার অধীনে অঞ্চলটির সুন্দর ব্যাখ্যা রয়েছে (সম্ভাবনাটি যে একটি ধনাত্মকটিকে নেতিবাচক - মান-হুইটনি ইউ স্ট্যাটিস্টিকের চেয়ে উচ্চতর স্থান দেওয়া হয়) এবং বক্ররেখার উপরে দূরত্ব (সম্ভাবনা যা অনুমানের পরিবর্তে কোনও জ্ঞাত সিদ্ধান্ত নেওয়া হয় - ইউডেন জে তথ্যের দ্বিধাত্বিক রূপ হিসাবে পরিসংখ্যান)।
সাধারণত, পিআর ট্রেড অফ বাঁক ব্যবহার করার প্রয়োজন নেই এবং বিশদ প্রয়োজন হলে আপনি কেবল আরওসি বক্ররেখাতে জুম করতে পারেন। আরওসি বক্ররেখার এক অনন্য সম্পত্তি রয়েছে যা তির্যক (টিপিআর = এফপিআর) সুযোগকে প্রতিনিধিত্ব করে, যে চান্স লাইনের (ডিএসি) উপরের দূরত্বটি জ্ঞাততা বা কোনও সিদ্ধান্তের সম্ভাবনার প্রতিনিধিত্ব করে, এবং বক্ররেখার (এওসি) এর আওতাধীন অঞ্চলটি র্যাঙ্কডনেস বা প্রতিনিধিত্ব করে সঠিক জোড়ায় র্যাঙ্কিংয়ের সম্ভাবনা। এই ফলাফলগুলি পিআর বক্ররেখাকে ধরে রাখে না , এবং উপরে বর্ণিত হিসাবে উচ্চতর পুনর্বিবেচনা বা টিপিআর এর জন্য এটিউ বিকৃত হয়। পিআর এউসি বড় হচ্ছে না বোঝাবেন আরওসি এউসি আরও বড় এবং এর ফলে র্যাঙ্কডনেস (র্যাঙ্কড +/- জোড়া সঠিকভাবে পূর্বাভাস দেওয়ার সম্ভাবনা - যেমন এটি কত ঘন ঘন পূর্বে ভবিষ্যদ্বাণী করে + শীর্ষের উপরে-উপরে থাকে) বোঝায় না এবং ইনফরমেশন (সংজ্ঞায়িত পূর্বাভাসের পরিবর্তে কোনও সম্ভাব্য ভবিষ্যদ্বাণী হওয়ার সম্ভাবনা) বোঝায় না এলোমেলো অনুমান - যেমন ভবিষ্যদ্বাণী করা হয় তখন এটি কী করে তা প্রায়শই এটি জানে)।
দুঃখিত - কোন গ্রাফ নেই! যদি কেউ উপরের রূপান্তরগুলি চিত্রিত করার জন্য গ্রাফ যোগ করতে চায় তবে তা দুর্দান্ত হবে! আরওসি, লিফট, বিআইআরডি, কাপা, এফ-পরিমাপ, অবহিতকরণ ইত্যাদি সম্পর্কে আমার কাগজপত্রগুলিতে বেশ কয়েকটি আছে তবে https এ আরওসি বনাম লিফট বনাম বিআইআরডি বনাম আরপি সম্পর্কিত চিত্র রয়েছে তবে এগুলি বেশ উপস্থাপিত হয়নি they : //arxiv.org/pdf/1505.00401.pdf
আপডেট: অত্যধিক দীর্ঘ উত্তর বা মন্তব্যে পুরো ব্যাখ্যা দেওয়ার চেষ্টা না করার জন্য, আমার কিছু কাগজপত্র যথার্থ বনাম রিক্যাল ট্রেডঅফস ইনক এর সাথে সমস্যাটি "আবিষ্কার" করছে। এফ 1, অবগতকরণের তথ্য এবং তারপরে আরওসি, কাপা, তাৎপর্য, ডেল্টাপ, এউসি ইত্যাদির সাথে সম্পর্কের "অন্বেষণ" ইত্যাদি "20 বছর আগে (এনটওয়িসল) আমার এই শিক্ষার্থীদের মধ্যে যে সমস্যা ছিল তা হ'ল এবং আরও অনেক লোক সত্যিকারের বাস্তবের উদাহরণ খুঁজে পেয়েছে since তাদের নিজস্ব যেখানে সেখানে গবেষণামূলক প্রমাণ ছিল যে আর / পি / এফ / এ পদ্ধতির মাধ্যমে শিক্ষানবিশকে র্রং পথ প্রেরণ করা হয়েছিল, যখন ইনফর্মেশন (বা উপযুক্ত ক্ষেত্রে কাপা বা সমঝোতা) তাদের সঠিক পথে পাঠিয়েছিল - এখন কয়েক ডজন ক্ষেত্র জুড়ে। কাপা এবং আরওসি-তে অন্যান্য লেখকের অনেকগুলি ভাল এবং প্রাসঙ্গিক কাগজপত্র রয়েছে তবে আপনি যখন কাপ্পাস বনাম আরওসি এউসি বনাম আরওসি উচ্চতা (অবহিততা বা ইয়ডেন 'ব্যবহার করেন) s জে) ২০১২ এর কাগজপত্রের তালিকায় স্পষ্ট করে দেওয়া হয়েছে (অন্যদের গুরুত্বপূর্ণ অনেকগুলি কাগজপত্র সেগুলিতে উদ্ধৃত করা হয়)। 2003 এর বুকমেকার পেপারটি প্রথমবারের জন্য মাল্টিক্লাস কেসের জন্য ইনফর্মডনেসের একটি সূত্র নিয়েছে। 2013 এর কাগজটি ইনফোর্ডনেসকে অনুকূলকরণ করার জন্য অ্যাডাবুস্টের মাল্টিক্লাস সংস্করণ পেয়েছে (এটি পরিবর্তিত ওয়েকার লিঙ্ক সহ যা এটি হোস্ট করে এবং এটি চালায়)।
তথ্যসূত্র
1998 এনএলপি পার্সারদের মূল্যায়নে পরিসংখ্যানের বর্তমান ব্যবহার। জে এনটওয়িসল, ডিএমডাব্লু শক্তি - ভাষা প্রক্রিয়াকরণে নতুন পদ্ধতি সম্পর্কে যৌথ সম্মেলনের কার্যক্রম: 215-224
https://dl.acm.org/citation.cfm?id=1603935
15 দ্বারা উদ্ধৃত
2003 স্মরণ এবং যথার্থ বনাম বুকমেকার। ডিএমডাব্লু পাওয়ারস - জ্ঞান বিজ্ঞানের উপর আন্তর্জাতিক সম্মেলন: 529-534
http://dspace2.flinders.edu.au/xmlui/handle/2328/27159
46 দ্বারা উদ্ধৃত
২০১১ মূল্যায়ন: নির্ভুলতা, প্রত্যাহার এবং এফ-পরিমাপ থেকে আরওসি, তথ্য, চিহ্ন এবং পারস্পরিক সম্পর্ক। ডিএমডাব্লু পাওয়ারস - মেশিন লার্নিং প্রযুক্তি জার্নাল 2 (1): 37-63।
http://dspace2.flinders.edu.au/xmlui/handle/2328/27165
1749 দ্বারা উদ্ধৃত
2012 কপা নিয়ে সমস্যা। ডিএমডাব্লু পাওয়ারস - ইউরোপীয় এসিএলের 13 তম সম্মেলনের কার্যক্রম: 345-355
https://dl.acm.org/citation.cfm?id=2380859
63 দ্বারা উদ্ধৃত
2012 আরওসি-কনসার্ট: ধারাবাহিকতা এবং নিশ্চিতকরণের আরওসি-ভিত্তিক পরিমাপ। ডিএমডাব্লু পাওয়ারস - স্প্রিং কংগ্রেস অন ইঞ্জিনিয়ারিং অ্যান্ড টেকনোলজি (এস-সিইটি) 2: 238-241
http://www.academia.edu/download/31939951/201203-SCET30795-ROC-ConCert-PID1124774.pdf
5 দ্বারা উদ্ধৃত
2013 অ্যাডাবুক এবং মাল্টিবুক:: সম্ভাবনা সংশোধন সহ অভিযোজিত বুস্টিং। DMW Powers- ICINCO আন্তর্জাতিক নিয়ন্ত্রণ, অটোমেশন ও রোবোটিক্স উপর ইনফরমেটিক্স সম্মেলন
http://www.academia.edu/download/31947210/201309-AdaBook-ICINCO-SCITE-Harvard-2upcor_poster.pdf
https://www.dropbox.com/s/artzz1l3vozb6c4/weka.jar (goes into Java Class Path)
https://www.dropbox.com/s/dqws9ixew3egraj/wekagui (GUI start script for Unix)
https://www.dropbox.com/s/4j3fwx997kq2xcq/wekagui.bat (GUI shortcut on Windows)
4 দ্বারা উদ্ধৃত