পরিসংখ্যান ডটকম সপ্তাহের একটি সমস্যা প্রকাশ করেছে: আবাসিক বীমা জালিয়াতির হার 10% (দশটি দাবির মধ্যে একটি জালিয়াতি)। একজন পরামর্শদাতা দাবি পর্যালোচনা করতে এবং এগুলিকে প্রতারণা বা নন-জালিয়াতি হিসাবে শ্রেণিবদ্ধ করার জন্য একটি মেশিন লার্নিং সিস্টেমের প্রস্তাব দিয়েছেন। জালিয়াতি দাবিগুলি সনাক্ত করতে সিস্টেমটি 90% কার্যকর, তবে নন-জালিয়াতি দাবিগুলি সঠিকভাবে শ্রেণিবদ্ধ করতে কার্যকর 80% কার্যকর (এটি ভুলভাবে পাঁচটিতে একজনকে "জালিয়াতি" হিসাবে লেবেল করে)। যদি সিস্টেমটি কোনও দাবিকে প্রতারণামূলক হিসাবে শ্রেণিবদ্ধ করে, তবে এটি সত্যই প্রতারণামূলক হওয়ার সম্ভাবনা কী?
https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true
আমি এবং আমার পিয়ার দুজনেই স্বাধীনভাবে একই উত্তর নিয়ে এসেছি এবং এটি প্রকাশিত সমাধানের সাথে মেলে না।
আমাদের সমাধান:
(.9 * .1) / ((। 9 * .1) + (। 2 * .9)) = 1/3
তাদের সমাধান:
শর্তসাপেক্ষ সম্ভাবনায় এটি একটি সমস্যা। (এটিও একটি বয়েশিয়ান সমস্যা, তবে বেইস রুলে সূত্র প্রয়োগ করা যা ঘটছে তা কেবল অস্পষ্ট করতে সহায়তা করে)) ১০০ টি দাবি বিবেচনা করুন। ১০ টি প্রতারণামূলক হবে, এবং সিস্টেম তাদের 9 টিকে সঠিকভাবে "জালিয়াতি" হিসাবে লেবেল করবে। 90 টি দাবি ঠিক থাকবে, তবে সিস্টেমটি ভুলভাবে fraud২ (৮০%) কে "জালিয়াতি" হিসাবে শ্রেণিবদ্ধ করবে। সুতরাং মোট ৮১ টি দাবির লেবেল করা হয়েছে প্রতারণামূলক হিসাবে, তবে এর মধ্যে কেবল 9%, 11% আসলে প্রতারণামূলক।
কে ঠিক ছিল