কীভাবে এউসির সম্ভাব্য ব্যাখ্যাটি পাওয়া যায়?


14

আরওসি বক্ররেখার অধীনে অঞ্চলটি কেন এমন সম্ভাবনা রয়েছে যে কোনও শ্রেণিবদ্ধ একজন এলোমেলোভাবে বেছে নেওয়া "ইতিবাচক" উদাহরণটি (পুনরুদ্ধার পূর্বাভাস থেকে) এলোমেলোভাবে বেছে নেওয়া "ইতিবাচক" একের (মূল ইতিবাচক শ্রেণি থেকে) উচ্চতর হবে? কীভাবে এই সত্যটি ইতিবাচক এবং নেতিবাচক শ্রেণির বিতরণের সিডিএফ এবং পিডিএফ প্রদান করে অবিচ্ছেদ্য ব্যবহার করে এই বিবৃতিটিকে গাণিতিকভাবে প্রমাণ করা যায়?


2
আমি এর খুব প্রাথমিক প্রমাণটি এখানে লিখেছি
ম্যাথু

উত্তর:


10

প্রথম জিনিস, আসুন আনুষ্ঠানিকভাবে আরওসি বক্ররেখার অধীনে অঞ্চলটি সংজ্ঞায়িত করার চেষ্টা করা যাক। কিছু অনুমান এবং সংজ্ঞা:

  • আমাদের একটি সম্ভাব্য শ্রেণিবদ্ধ রয়েছে যা একটি "স্কোর" গুলি (এক্স) আউটপুট দেয়, যেখানে এক্স বৈশিষ্ট্যগুলি হ'ল, এবং এস হ'ল আনুমানিক সম্ভাব্যতা পি (শ্রেণি = 1 | এক্স) এর জেনেরিক বর্ধমান একঘেয়ে ফাংশন।

  • , সঙ্গে= { 0 , 1 } : = বর্গ ট জন্য স্কোর, সিডিএফ সঙ্গে পিডিএফ এফ ( গুলি )fk(s)k={0,1}Fk(s)

  • একটি নতুন পর্যবেক্ষণ শ্রেণীবিন্যাস compraing স্কোর প্রাপ্ত হয় গুলি একটি থ্রেশহোল্ড টি

তদতিরিক্ত, গাণিতিক সুবিধার জন্য, আসুন ধনাত্মক শ্রেণি (ইভেন্টটি সনাক্ত করা হয়েছে) কে = 0 এবং নেতিবাচক কে = 1 বিবেচনা করুন this এই সেটিংয়ে আমরা সংজ্ঞা দিতে পারি:

  • পুনরুদ্ধার (ওরফে সংবেদনশীলতা, ওরফে টিপিআর) : (ধনাত্মক হিসাবে শ্রেণীবদ্ধ ধনাত্মক ক্ষেত্রে অনুপাত)F0(t)
  • বৈশিষ্ট্য (ওরফে টিএনআর) : (নেতিবাচক হিসাবে শ্রেণীবদ্ধ নেতিবাচক মামলার অনুপাত)1F1(t)
  • এফপিআর (ওরফে ফল আউট) : 1 - টিএনআর = F1(t)

রকপাখি বক্ররেখা তারপর একটি চক্রান্ত বিরুদ্ধে এফ 1 ( T ) । সেট বনাম = এফ 1 ( গুলি ) , আমরা আনুষ্ঠানিকভাবে যেমন আরওসি বক্ররেখা অধীনে এলাকায় সংজ্ঞায়িত করতে পারেন: একটি ইউ সি = 1 0 এফ 0 ( এফ - 1 1 ( বনাম ) ) বনাম পরিবর্তন পরিবর্তনশীল ( বনাম = 1 ( s ) d sF0(t)F1(t)v=F1(s)

AUC=01F0(F11(v))dv
dv=f1(s)ds):
AUC=F0(s)f1(s)ds

এই সূত্রটি ইজিলি সম্ভাব্যতা হিসাবে দেখা যেতে পারে যে ক্লাস 0 এর এলোমেলোভাবে আঁকানো সদস্য 1 ম শ্রেণীর এলোমেলোভাবে আঁকার সদস্যের স্কোরের চেয়ে কম স্কোর তৈরি করবে।

এই প্রমাণটি নেওয়া হয়েছে: https://pdfs.semanticscholar.org/1fcb/f15898db36990f651c1e5cdc0b405855de2c.pdf


5

@ আলেবুর উত্তর দুর্দান্ত। তবে এর স্বীকৃতিটি মানহীন এবং ধনাত্মক শ্রেণির জন্য 0 এবং theণাত্মক শ্রেণীর জন্য 1 ব্যবহার করে। নীচে মানক স্বরলিপিটির ফলাফল (0ণাত্মক শ্রেণীর জন্য 0 এবং ধনাত্মক শ্রেণীর জন্য 1) ফলাফল রয়েছে:

f0(s)F0(s)

f1(s)F1(s)

x(s)=1F0(s)

y(s)=1F1(s)

AUC=01y(x)dx=01y(x(τ))dx(τ)=+y(τ)x(τ)dτ=+(1F1(τ))(f0(τ))dτ=+(1F1(τ))f0(τ)dτ

τ প্রান্তিকের জন্য দাঁড়িয়ে। @ আলেবুর উত্তরে সর্বশেষ অভিব্যক্তিটির জন্য কেউ ব্যাখ্যাটি প্রয়োগ করতে পারেন।


1

τ

  1. একজন
  2. বিএকজন
  3. τ হ'ল কাটোফ থ্রেশহোল্ড। যদি কোনও ডাটা পয়েন্ট এর চেয়ে বেশি স্কোর অর্জন করে তবে এটি ইতিবাচক শ্রেণীর অন্তর্গত বলে পূর্বাভাস দেওয়া হয়েছে। অন্যথায়, এটি নেতিবাচক শ্রেণিতে থাকার পূর্বাভাস।

পি(একজন>τ)পি(বি>τ)

τএকজনইউসি ) এর ।

আমরা পেতে:

একজনইউসি=01টিপিআর(এক্স)এক্স=01পি(একজন>τ(এক্স))এক্স
এক্সএক্সটিপিআর

(1)একজনইউসি=এক্স[পি(একজন>τ(এক্স))]
এক্স~ইউ[0,1)

এক্সএফপিআর

এক্স=এফপিআর=পি(বি>τ(এক্স))
এক্স একটি অভিন্ন বিতরণ থেকে হতে,

পি(বি>τ(এক্স))~ইউ
=>পি(বি<τ(এক্স))~(1-ইউ)~ইউ
(2)=>এফবি(τ(এক্স))~ইউ

এক্সএফএক্স(ওয়াই)~ইউওয়াই~এক্স

এফএক্স(এক্স)=পি(এফএক্স(এক্স)<এক্স)=পি(এক্স<এফএক্স-1(এক্স))=এফএক্সএফএক্স-1(এক্স)=এক্স
এবং এটি কেবল ইউনিফর্ম ধারণ করে।

τ(x)B

এটি সমীকরণে প্রতিস্থাপন (1) আমরা পাই:

AUC=Ex(P(A>B))=P(A>B)

অন্য কথায়, বক্ররেখার নীচের অঞ্চলটি সম্ভবত একটি এলোমেলো ধনাত্মক নমুনার একটি এলোমেলো নেতিবাচক নমুনার চেয়ে উচ্চতর স্কোর হওয়ার সম্ভাবনা।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.