স্ট্যাটিস্টিক্স ডট কম কী ভুল উত্তর প্রকাশ করেছে?


28

পরিসংখ্যান ডটকম সপ্তাহের একটি সমস্যা প্রকাশ করেছে: আবাসিক বীমা জালিয়াতির হার 10% (দশটি দাবির মধ্যে একটি জালিয়াতি)। একজন পরামর্শদাতা দাবি পর্যালোচনা করতে এবং এগুলিকে প্রতারণা বা নন-জালিয়াতি হিসাবে শ্রেণিবদ্ধ করার জন্য একটি মেশিন লার্নিং সিস্টেমের প্রস্তাব দিয়েছেন। জালিয়াতি দাবিগুলি সনাক্ত করতে সিস্টেমটি 90% কার্যকর, তবে নন-জালিয়াতি দাবিগুলি সঠিকভাবে শ্রেণিবদ্ধ করতে কার্যকর 80% কার্যকর (এটি ভুলভাবে পাঁচটিতে একজনকে "জালিয়াতি" হিসাবে লেবেল করে)। যদি সিস্টেমটি কোনও দাবিকে প্রতারণামূলক হিসাবে শ্রেণিবদ্ধ করে, তবে এটি সত্যই প্রতারণামূলক হওয়ার সম্ভাবনা কী?

https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true

আমি এবং আমার পিয়ার দুজনেই স্বাধীনভাবে একই উত্তর নিয়ে এসেছি এবং এটি প্রকাশিত সমাধানের সাথে মেলে না।

আমাদের সমাধান:

(.9 * .1) / ((। 9 * .1) + (। 2 * .9)) = 1/3

তাদের সমাধান:

শর্তসাপেক্ষ সম্ভাবনায় এটি একটি সমস্যা। (এটিও একটি বয়েশিয়ান সমস্যা, তবে বেইস রুলে সূত্র প্রয়োগ করা যা ঘটছে তা কেবল অস্পষ্ট করতে সহায়তা করে)) ১০০ টি দাবি বিবেচনা করুন। ১০ টি প্রতারণামূলক হবে, এবং সিস্টেম তাদের 9 টিকে সঠিকভাবে "জালিয়াতি" হিসাবে লেবেল করবে। 90 টি দাবি ঠিক থাকবে, তবে সিস্টেমটি ভুলভাবে fraud২ (৮০%) কে "জালিয়াতি" হিসাবে শ্রেণিবদ্ধ করবে। সুতরাং মোট ৮১ টি দাবির লেবেল করা হয়েছে প্রতারণামূলক হিসাবে, তবে এর মধ্যে কেবল 9%, 11% আসলে প্রতারণামূলক।

কে ঠিক ছিল


4
দেখে মনে হচ্ছে যে তারা আপনার গণনার সাথে
সামঞ্জস্য

2
@ না, চুপচাপ উত্তরটি সংশোধন করেছেন। লুক্কায়িত
আকসাকাল

ট্রিভিয়া: আচরণগত সিদ্ধান্ত গ্রহণের ক্ষেত্রে, এই সমস্যাটি প্রায়শই "ম্যামোগ্রাম সমস্যা" হিসাবে পরিচিত, যেহেতু এটির স্বাভাবিক উপস্থাপনাটি একজন রোগীকে একটি ইতিবাচক ম্যামোগ্রাম দেওয়ার সম্ভাবনা সম্পর্কে cancer
কোডিওলজিস্ট

"সুসংবাদটি হ'ল, আমাদের সিস্টেম 90% জালিয়াতিকে জালিয়াতি হিসাবে শ্রেণিবদ্ধ করে The সবচেয়ে খারাপ খবরটি এটি 80% জালিয়াতি হিসাবে জালিয়াতি হিসাবে চিহ্নিত করে।" নোট করুন যে 11% তারা গণনা করেছেন তা 10% বেস হারের চেয়ে কিছুটা বেশি। এমন একটি মেশিন লার্নিং মডেল যেখানে পতাকাঙ্কিত মামলায় জালিয়াতির হার বেস হারের চেয়ে 10% বেশি is
সংগৃহীত

উত্তর:


41

আমি বিশ্বাস করি যে আপনি এবং আপনার সহকর্মী সঠিক। পরিসংখ্যান ডটকমের চিন্তার সঠিক রেখা রয়েছে তবে একটি সহজ ভুল। 90 "ঠিক আছে" দাবিগুলির মধ্যে, আমরা আশা করি যে এর মধ্যে 20% ভুলভাবে প্রতারণার হিসাবে শ্রেণিবদ্ধ করা হবে, 80% নয়। 90 এর 20% হ'ল 18, যা 9 টি সঠিকভাবে চিহ্নিত দাবির দিকে এবং 18 টি ভুল দাবির সাথে সাথে 1/3 অনুপাতের সাথে বেইসের নিয়মের ফলস্বরূপ।


11

আপনি সঠিক. ওয়েবসাইট পোস্ট করা সমাধানটিকে সমস্যার বিভ্রান্তির উপর ভিত্তি করে তৈরি করা হয়েছে যে অবিশ্বাস্য 80% দাবী দেওয়া 20% এর পরিবর্তে প্রতারণামূলক হিসাবে শ্রেণিবদ্ধ করা হয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.