যথার্থ-পুনর্বিবেচনা বক্ররেখার (পিআর-কার্ভের এউসি) আওতাভুক্ত যথার্থতা (এপি) কি অঞ্চল?
সম্পাদনা করুন:
পিআর এউসি এবং এপিতে পার্থক্য সম্পর্কে এখানে কিছু মন্তব্য।
এউসি নির্ভুলতার ট্র্যাপিজয়েডাল ইন্টারপোলেশন দ্বারা প্রাপ্ত। একটি বিকল্প এবং সাধারণত সমতুল্য মেট্রিক হল গড় যথার্থ (এপি), তথ্য.এপ হিসাবে প্রত্যাবর্তন returned প্রতিবার নতুন ধনাত্মক নমুনা প্রত্যাহার করার সময় প্রাপ্ত যথার্থতার গড় এটি। যথাযথ অংশগুলি দ্বারা নির্ভুলতা বিভক্ত হয় এবং এটি প্রায়শই টিআরইসি দ্বারা ব্যবহৃত সংজ্ঞা হয় তবে এটি এটিউ এর সমান।
http://www.vlfeat.org/overview/plots-rank.html
অধিকন্তু, auc এবং average_precision_score ফলাফল একই scikit-শিখতে হয় না। এটি আশ্চর্যজনক, কারণ ডকুমেন্টেশনে আমাদের রয়েছে:
পূর্বাভাস স্কোরগুলি থেকে গণনা গড় নির্ভুলতা (এপি) এই স্কোরটি যথার্থ-পুনর্বিবেচনা বক্ররেখার অধীনে অঞ্চলের সাথে মিলে যায়।
কোডটি এখানে:
# Compute Precision-Recall and plot curve
precision, recall, thresholds = precision_recall_curve(y_test, clf.predict_proba(X_test)[:,1])
area = auc(recall, precision)
print "Area Under PR Curve(AP): %0.2f" % area #should be same as AP?
print 'AP', average_precision_score(y_test, y_pred, average='weighted')
print 'AP', average_precision_score(y_test, y_pred, average='macro')
print 'AP', average_precision_score(y_test, y_pred, average='micro')
print 'AP', average_precision_score(y_test, y_pred, average='samples')
আমার শ্রেণিবদ্ধের জন্য আমার কাছে এরকম কিছু রয়েছে:
Area Under PR Curve(AP): 0.65
AP 0.676101781304
AP 0.676101781304
AP 0.676101781304
AP 0.676101781304