আমার দুটি ক্লাসিফায়ার আছে
- উ: নিষ্পাপ বায়েশিয়ান নেটওয়ার্ক
- বি: ট্রি (এককভাবে সংযুক্ত) বায়েশিয়ান নেটওয়ার্ক
নির্ভুলতা এবং অন্যান্য ব্যবস্থার ক্ষেত্রে, এ বিয়ের তুলনায় তুলনামূলকভাবে খারাপ সম্পাদন করে তবে আমি যখন আরওসি বিশ্লেষণ সম্পাদন করতে আর প্যাকেজগুলি আরআরসিআর এবং এউসি ব্যবহার করি তখন দেখা যায় যে এ-এর জন্য এটিসি বি এর জন্য এওসি থেকে বেশি, এটি কেন হয়? ঘটছে?
সত্য ধনাত্মক (টিপি), মিথ্যা ধনাত্মক (এফপি), মিথ্যা নেতিবাচক (এফএন), সত্য নেতিবাচক (টিএন), সংবেদনশীলতা (সেন), সুনির্দিষ্টতা (স্পেস), ধনাত্মক ভবিষ্যদ্বাণীমূলক মান (পিপিভি), নেতিবাচক ভবিষ্যদ্বাণীমূলক মান (এনপিভি), এবং ক এবং খ এর যথার্থতা (অ্যাক) নিম্নরূপ।
+------+---------+---------+
| | A | B |
+------+---------+---------+
| tp | 3601 | 769 |
| fp | 0 | 0 |
| fn | 6569 | 5918 |
| tn | 15655 | 19138 |
| sens | 0.35408 | 0.11500 |
| spec | 1.00000 | 1.00000 |
| ppv | 1.00000 | 1.00000 |
| npv | 0.70442 | 0.76381 |
| acc | 0.74563 | 0.77084 |
+------+---------+---------+
প্রান্তিকের উপর সংবেদন এবং বন্ধন (স্পেক এবং পিপিভি) বাদ দিয়ে (টিপি, এফএন, এফএন, এবং টিএন বাদে) বি এ এর চেয়ে আরও ভাল পারফরম্যান্স বলে মনে হচ্ছে seems
আমি যখন সংবেদন (y-axis) বনাম 1-স্পেস (এক্স-অক্ষ) এর জন্য AUC গণনা করি
aucroc <- auc(roc(data$prediction,data$labels));
এখানে এউসি তুলনা করা হচ্ছে।
+----------------+---------+---------+
| | A | B |
+----------------+---------+---------+
| sens vs 1-spec | 0.77540 | 0.64590 |
| sens vs spec | 0.70770 | 0.61000 |
+----------------+---------+---------+
সুতরাং এখানে আমার প্রশ্নগুলি:
- যথাযথতার সাথে "খ" যখন A কে ছাড়িয়ে যায় বলে বি এর চেয়ে আরও ভাল কেন, তবে এইউসি?
- সুতরাং, আমি কীভাবে সত্যিই A / B এর শ্রেণিবিন্যাসের পারফরম্যান্স বিচার / তুলনা করব? মানে, আমি কি এওসি মানটি ব্যবহার করব? আমি কি AC মানটি ব্যবহার করব এবং যদি তাই হয় কেন?
- তদ্ব্যতীত, আমি যখন এ এবং বি-তে যথাযথ স্কোরিং নিয়মগুলি প্রয়োগ করি, তখন ল লগ ক্ষতি, চতুর্ভুজ হ্রাস এবং গোলাকার ক্ষতির ক্ষেত্রে বি কে ছাড়িয়ে যায় (পি <0.001)। এউসির সাথে শ্রদ্ধার সাথে শ্রেণিবিন্যাসের পারফরম্যান্স বিচার করার ক্ষেত্রে এগুলি কীভাবে ওজন পাবে?
- এ এর জন্য আরওসি গ্রাফটি দেখতে খুব মসৃণ দেখাচ্ছে (এটি একটি বাঁকানো চাপ) তবে বি এর জন্য আরওসি গ্রাফ সংযুক্ত লাইনের একটি সেটের মতো দেখায়। কেন?
অনুরোধ হিসাবে, এখানে মডেল এ এর প্লটগুলি are
এখানে মডেল বি এর প্লটগুলি রয়েছে are
এ এবং বি এর সম্ভাব্যতা বিতরণের হিস্টগ্রাম প্লটগুলি এখানে রয়েছে (ব্রেক 20 এ সেট করা আছে)।
বি বনাম এ এর সম্ভাব্যতার বিস্তৃত প্লট এখানে রয়েছে is