ঠিক আছে, (মিথ্যা পজিটিভ রেট), টি পি আর (সত্য পজিটিভ রেট) এবং এ সি সি এর মধ্যে সম্পর্ক মনে রাখবেনএফপিআরটিপিআরএকজনসিসি (যথার্থতা) এর :
টিপিআর = ∑ সত্য পজিটিভItive ইতিবাচক ক্ষেত্রে
এফপিআর = se মিথ্যা ধনাত্মকG নেতিবাচক মামলা
এ সিসি= টিপিআর ⋅ ∑ ধনাত্মক কেস + ( 1 - এফপিআর ) ⋅ g ণাত্মক মামলা∑ ইতিবাচক কেস + ∑ নেতিবাচক কেস
এ সিসিটিপিআরএফপিআর
এ সিসি= টিপিআর + 1 - এফপিআর2
এন-। এন+ +
এ সিসি( এন-। এন+ +) ≈ 1 - এফপিআর
এ সিসিএফপিআর
এই উদাহরণটি দেখুন, negativeণাত্মক ধনাত্মকতা 1000: 1 ছাড়িয়ে গেছে।
data = c(rnorm(10L), rnorm(10000L)+1)
lab = c(rep(1, 10L), rep(-1, 10000L))
plot(data, lab, col = lab + 3)
tresh = c(-10, data[lab == 1], 10)
do.call(function(x) abline(v = x, col = "gray"), list(tresh))
pred = lapply(tresh, function (x) ifelse(data <= x, 1, -1))
res = data.frame(
acc = sapply(pred, function(x) sum(x == lab)/length(lab)),
tpr = sapply(pred, function(x) sum(lab == x & x == 1)/sum(lab == 1)),
fpr = sapply(pred, function(x) sum(lab != x & x == 1)/sum(lab != 1))
)
res[order(res$acc),]
#> res[order(res$acc),]
# acc tpr fpr
#12 0.000999001 1.0 1.0000
#11 0.189110889 1.0 0.8117
#9 0.500099900 0.9 0.5003
#2 0.757742258 0.8 0.2423
#5 0.763136863 0.7 0.2368
#4 0.792007992 0.6 0.2078
#10 0.807292707 0.5 0.1924
#3 0.884215784 0.4 0.1153
#7 0.890709291 0.3 0.1087
#6 0.903096903 0.2 0.0962
#8 0.971428571 0.1 0.0277
#1 0.999000999 0.0 0.0000
দেখুন, কখন fpr
0 acc
হয় সর্বোচ্চ।
এবং নিখুঁতভাবে টীকাযুক্ত সহ এখানে আরওসি রয়েছে।
plot(sort(res$fpr), sort(res$tpr), type = "S", ylab = "TPR", xlab = "FPR")
text(sort(res$fpr), sort(res$tpr), pos = 4L, lab = round(res$acc[order(res$fpr)], 3L))
abline(a = 0, b = 1)
abline(a = 1, b = -1)
এ ইউসি
1-sum(res$fpr[-12]*0.1)
#[1] 0.74608
তল লাইনটি হ'ল আপনি কোনও উপায়ে মডেল ( tpr
= 0 আমার উদাহরণে) এর ফলস্বরূপ নির্ভুলতা অনুকূল করতে পারেন । এটি কারণ সঠিকতা একটি ভাল মেট্রিক নয়, ফলাফলের দ্বৈতকরণের সিদ্ধান্ত গ্রহণকারীকে রেখে দেওয়া উচিত।
টিপিআর = 1 - এফপিআর লাইন হিসাবে বলা হয় কারণ সেইভাবে উভয় ত্রুটির সমান ওজন থাকে, যদিও যথার্থতা অনুকূল নয়।
যখন আপনার ভারসাম্যহীন ক্লাস রয়েছে, নির্ভুলতার অনুকূলতা অপেক্ষাকৃত ছোট হতে পারে (যেমন সবাইকে সংখ্যাগরিষ্ঠ শ্রেণি হিসাবে পূর্বাভাস দিন)।
এ ইউসি
এবং সর্বোপরি গুরুত্বপূর্ণ: কেন উচ্চ শ্রেণীর শ্রেণিবদ্ধের তুলনায় এটিসি উচ্চতর যা আরও সঠিক?