যথার্থতা যেহেতু, নমুনাগুলির অনুপাত সঠিকভাবে শ্রেণিবদ্ধ করা হয়েছে তাই আমরা দুটি অনুপাতের একটি সিস্টেম সম্পর্কিত অনুমানের পরীক্ষাটি প্রয়োগ করতে পারি।
যাক পি 1 এবং পি 2 accuracies যথাক্রমে ক্লাসিফায়ার 1 এবং 2 থেকে প্রাপ্ত হও, এন নমুনার সংখ্যা হতে। শ্রেণিবদ্ধ 1 এবং 2 তে সঠিকভাবে শ্রেণিবদ্ধ নমুনাগুলির সংখ্যা যথাক্রমে x 1 এবং x 2 ।p^1p^2nx1x2
p^1=x1/n,p^2=x2/n
পরীক্ষার পরিসংখ্যান দ্বারা দেওয়া হয়
Z=p^1−p^22p^(1−p^)/n−−−−−−−−−−√ where p^=(x1+x2)/2n
Our intention is to prove that the global accuracy of classifier 2, i.e., p2, is better than that of classifier 1, which is p1. This frames our hypothesis as
- H0:p1=p2 (null hypothesis stating both are equal)
- Ha:p1<p2 (alternative hypotyesis claiming the newer one is better than the existing)
The rejection region is given by
Z<−zα (if true reject H0 and accept Ha)
where zα is obtained from a standard normal distribition that pertains to a level of significance, α. For instance z0.5=1.645 for 5% level of significance. This means that if the relation Z<−1.645 is true, then we could say with 95% confidence level (1−α) that classifier 2 is more accurate than classifier 1.
References:
- R. Johnson and J. Freund, Miller and Freund’s Probability and Statistics
for Engineers, 8th Ed. Prentice Hall International, 2011. (Primary source)
- Test of Hypothesis-Concise Formula Summary. (Adopted from [1])