আর-এ AUPR গণনা করছে [বন্ধ]


14

আরওসি এর আওতায় প্যাকেজ গণনা করার অঞ্চলটি পাওয়া সহজ তবে কি এমন প্যাকেজ রয়েছে যা নির্ভুলতা-পুনর্বিবেচনা বক্ররেখার অধীনে অঞ্চলটি গণনা করে?



তারা অবশ্যই, তবুও এএফএইকি উভয়ই নির্ভুলতা-প্রত্যাহার বক্ররেখার অধীনে অঞ্চলটি গণনা করতে পারে না।

উত্তর:


14

জুলাই ২০১ 2016 পর্যন্ত, প্যাকেজ PRROC আরওসি এউসি এবং পিআর এউসি উভয়কেই গণনার জন্য দুর্দান্ত কাজ করে।

probsআপনার মডেলটির সাথে ইতিমধ্যে সম্ভাবনার একটি ভেক্টর রয়েছে (ধরে নেওয়া হয়েছে ) এবং সত্য শ্রেণীর লেবেলগুলি আপনার ডেটা ফ্রেমে রয়েছে বলে মনে করে df$label(0 এবং 1) এই কোডটি কাজ করা উচিত:

install.packages("PRROC")

require(PRROC)
fg <- probs[df$label == 1]
bg <- probs[df$label == 0]

# ROC Curve    
roc <- roc.curve(scores.class0 = fg, scores.class1 = bg, curve = T)
plot(roc)

# PR Curve
pr <- pr.curve(scores.class0 = fg, scores.class1 = bg, curve = T)
plot(pr)

PS: একমাত্র উদ্বেগজনক জিনিসটি আপনি scores.class0 = fgযখন fgলেবেল 1 এবং 0 টির জন্য গণনা করা হয় তা ব্যবহার করেন।

তাদের নীচের অঞ্চলগুলির সাথে এখানে আরওসি এবং পিআর বক্ররেখার উদাহরণ রয়েছে:

এওসি সহ আরওসি বক্ররেখা

এআউসি সহ পিআর বক্ররেখা

ডানদিকে থাকা বারগুলি হ'ল প্রান্তিক সম্ভাবনা যা বক্ররেখার একটি বিন্দু প্রাপ্ত হয়।

নোট করুন যে কোনও এলোমেলো শ্রেণিবদ্ধের জন্য, আরওসি এউসি ক্লাসের ভারসাম্যহীন নির্বিশেষে 0.5 এর কাছাকাছি থাকবে। যাইহোক, পিআর এউসি জটিল (( নির্ভুলতা প্রত্যাহার বক্ররেখা "বেসলাইন" কি দেখুন )।


দয়া করে উপরের উত্তরে লিঙ্কিত PRROC ডকুমেন্টেশনগুলি উল্লেখ করুন।
অরুণ

2

একটু আয় googling এক bioc প্যাকেজ, qpgraph ( qpPrecisionRecall), এবং একটি Cran এক, minet ( auc.pr)। যদিও তাদের সাথে আমার কোনও অভিজ্ঞতা নেই। উভয় জৈবিক নেটওয়ার্ক মোকাবেলা করার পরিকল্পনা করা হয়েছে।


এই মিনিটটি দেখতে দুর্দান্ত লাগছিল, তবে সাধারণ তথ্য থেকে উপযুক্ত ইনপুট তৈরি করতে এটির জন্য কিছু বাহ্যিক অ্যাডাপ্টার থাকা দরকার :-(

2

একবার আপনার কাছ থেকে একটি নির্ভুলতা প্রত্যাহার বক্ররেখা পেয়েছে qpPrecisionRecall, যেমন:

pr <- qpPrecisionRecall(measurements, goldstandard)

আপনি এটি করে এটির এউসি গণনা করতে পারেন:

f <- approxfun(pr[, 1:2])
auc <- integrate(f, 0, 1)$value

সহায়তা পৃষ্ঠাটি qpPrecisionRecallআপনাকে তার আর্গুমেন্টে ডেটা কাঠামোটি কী প্রত্যাশা করে তার বিশদ দেয়।


1
পিআর-কার্ভের জন্য আরও কিছু অভিনব সংহতকরণ প্রয়োজন হয় না? দেখুন: mnd.ly/oWQQw1

1

AUPRC()PerfMeasপ্যাকেজে একটি ফাংশন যা ডেটা খুব বড় হয়ে গেলে প্যাকেজে pr.curve()ফাংশনের চেয়ে অনেক ভাল PRROCpr.curve()এটি একটি দুঃস্বপ্ন এবং যখন লক্ষ লক্ষ এন্ট্রি সহ আপনার ভেক্টর থাকে তা শেষ করতে চিরকালের জন্য লাগে। PerfMeasতুলনায় কয়েক সেকেন্ড সময় নেয়। PRROCআর PerfMeasতে লেখা হয় এবং সি তে লেখা হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.