ব্যাখ্যা করতে কেন সবচেয়ে ভালো উপায় কি হয় না এফ 1 তুলনায়, একটি ভাল পরিমাপ বলে?
ব্যাখ্যা করতে কেন সবচেয়ে ভালো উপায় কি হয় না এফ 1 তুলনায়, একটি ভাল পরিমাপ বলে?
উত্তর:
স্মরণ করুন যে নির্ভুলতা এবং প্রত্যাহার হিসাবে সংজ্ঞায়িত করা হয়:
তাদের একসাথে যুক্ত করতে ফিরে যেতে দিন, এবং একটি তাত্পর্য তৈরি করুন: তাদের গুণ করুন
সুতরাং, আমাদের দুটি পরিমাণ রয়েছে, যার একই অংক রয়েছে, তবে বিভিন্ন ডিনোমিনেটর রয়েছে এবং আমরা সেগুলির গড় নিতে চাই। আমরা কি করি? আচ্ছা আমরা এগুলিকে উল্টাতে পারি, তাদের বিপরীতমুখী নিতে পারি। তারপরে আপনি তাদের একসাথে যুক্ত করতে পারেন could সুতরাং তারা "ডান দিকে", আপনি আবার বিপরীতটি নেন।
উল্টানোর এই প্রক্রিয়া এবং তারপরে উল্টানো আবার "নিয়মিত" গড়কে সুরেলা গড়তে পরিণত করে। এটা তোলে শুধু তাই যে স্পষ্টতা এবং রিকল সমন্বয়পূর্ণ গড় হল এফ 1-পরিসংখ্যাত। হারগুলি নিয়ে কাজ করার সময় সাধারণভাবে গাণিতিক গড়ের পরিবর্তে সুরেলা মানে ব্যবহৃত হয়, যেমনটি আমরা এখানে করছি doing
শেষ পর্যন্ত, এফ 1-স্ট্যাটিস্টিক হ'ল যথার্থতা এবং পুনর্বিবেচনার গড় এবং আপনি এটি ব্যবহার করেন কারণ আপনি মডেলটির পারফরম্যান্স মূল্যায়নের জন্য কোনও বা অন্যটিকে বেছে নিতে চান না।
সংক্ষিপ্ত উত্তরটি হ'ল: আপনি দুটি শতাংশের যোগফলের নির্দিষ্ট অর্থ আশা করতে পারবেন না যার দুটি পৃথক ডিনোমিনেটর রয়েছে। সুতরাং, এফ 1, এফ 2 বা এফ 0.5 এর মতো গড় পরিমাপের পদ্ধতি গ্রহণ করা। পরেরটি কমপক্ষে শতাংশের সম্পত্তি ধরে রাখে। যদিও তাদের অর্থ কি?
পৃথক ব্যবস্থা হিসাবে যথার্থতা এবং পুনরুদ্ধারের সৌন্দর্য হ'ল তাদের ব্যাখ্যার সহজতরতা এবং এ বিষয়টি যে তারা সহজেই মডেলের ব্যবসায়িক লক্ষ্যগুলির সাথে মোকাবিলা করতে পারে। মডেল অনুসারে শ্রেণিবদ্ধ হওয়া মামলার মধ্যে শতাংশের যথার্থতা পরিমাপ করে । সমস্ত মামলার বাইরে মডেলের দ্বারা পাওয়া শতাংশের পরিমাণ পুনরায় প্রত্যাহার করুন । অনেক সমস্যার জন্য, আপনাকে যথার্থ বা পুনরুদ্ধারকে অপ্টিমাইজ করার মধ্যে বেছে নিতে হবে।true positives
positive
true positives
true
যে কোনও গড় পরিমাপ উপরের ব্যাখ্যাটি হারাতে থাকে এবং কোন মাপে আপনি সবচেয়ে বেশি পছন্দ করেন সেটিকে উত্সাহিত করে। এফ 1 এর অর্থ হয় আপনি জানেন না যে আপনি रिकল বা যথার্থ পছন্দ করেন, বা আপনি তাদের প্রত্যেকের সাথে সমান ওজন যুক্ত করেন। আপনি যদি স্মরণটিকে যথার্থের চেয়ে বেশি গুরুত্বপূর্ণ বলে মনে করেন, তবে আপনাকে গড় গণনা (যেমন F2) এবং এর বিপরীতে (যেমন F0.5) এও এটির জন্য একটি উচ্চতর ওজন বরাদ্দ করা উচিত।
দুটি যোগ করা একটি খারাপ পরিমাপ। আপনি যদি সমস্ত কিছুকে ইতিবাচক হিসাবে পতাকাঙ্কিত করেন তবে আপনি কমপক্ষে 1 এর একটি স্কোর পাবেন, যেহেতু এটি সংজ্ঞা অনুসারে 100% প্রত্যাহারযোগ্য। এবং আপনি তার উপরে একটি সামান্য নির্ভুলতা বাম্প পাবেন। এফ 1 এ ব্যবহৃত জ্যামিতিক গড় দুর্বল লিঙ্ককে জোর দেয় কারণ এটি গুণক; আপনাকে কমপক্ষে যথাযথ উভয়ই ঠিক করতে হবে এবং শালীন এফ 1 স্কোরটি স্মরণ করতে হবে।
মারাত্মক অসম্পূর্ণ সম্ভাবনার ক্ষেত্রে F1 স্কোর বিশেষভাবে মূল্যবান।
নিম্নলিখিত উদাহরণটি বিবেচনা করুন: আমরা একটি বিরল তবে বিপজ্জনক অসুস্থতার জন্য পরীক্ষা করি। ধরা যাক যে ১,০০০.০০০ শহরে কেবল 100 জন সংক্রামিত are
টেস্ট এ এই সমস্ত 100 ধনাত্মক সনাক্ত করে। তবে এটিতে ৫০% মিথ্যা ইতিবাচক হারও রয়েছে: এটি ভুল করে অন্য 500.000 লোককে অসুস্থ হতে দেখায়।
এদিকে, পরীক্ষা বি সংক্রামিতদের 10% হারায়, তবে কেবল 1.000 মিথ্যা ধনাত্মক (0.1% মিথ্যা ইতিবাচক হার) দেয়
স্কোর গণনা করা যাক। পরীক্ষার জন্য, যথার্থ কার্যকরভাবে 0 হবে; পুনরুদ্ধার হুবহু 1 হবে। পরীক্ষার বি জন্য, যথার্থতা এখনও ছোট হবে, প্রায় 0.01। পুনর্বিবেচনা 0.9 এর সমান হবে।
যদি আমরা নির্লিপ্তভাবে সংখ্যার গাণিতিক গড়টি নিখুঁতভাবে গ্রহণ করি এবং পুনরায় স্মরণ করি, এটি পরীক্ষার A এর জন্য 1 (0.5) এবং বি বি পরীক্ষার জন্য 0.91 (0.455) দেবে, সুতরাং পরীক্ষা A সামান্য ভাল বলে মনে হবে।
তবে, আমরা যদি ব্যবহারিক দৃষ্টিকোণ থেকে দেখি তবে A পরীক্ষাটি মূল্যহীন: যদি কোনও ব্যক্তিকে ইতিবাচকভাবে পরীক্ষা করা হয় তবে তার সত্যিকারের অসুস্থ হওয়ার সম্ভাবনা 50.000 এর মধ্যে 1! টেস্ট বি এর আরও ব্যবহারিক তাত্পর্য রয়েছে: আপনি ১.১০০ লোককে হাসপাতালে নিয়ে যেতে পারেন এবং তাদের নিবিড়ভাবে পর্যবেক্ষণ করতে পারেন। এটি F1 স্কোর দ্বারা সঠিকভাবে প্রতিফলিত হয়েছে: পরীক্ষার A এর জন্য এটি 0.0002 এর কাছাকাছি হবে, পরীক্ষার বি: (0.01 * 0.9) / (0.01 + 0.9) = 0.0098, যা এখনও বরং দরিদ্র, তবে প্রায় 50 গুণ ভাল।
স্কোর মান এবং ব্যবহারিক তাত্পর্যগুলির মধ্যে এই ম্যাচটি এফ 1 স্কোরকে মূল্যবান করে তোলে।
সাধারণভাবে, জ্যামিতিক গড়কে সর্বাধিক করে তোলা মানগুলি একইরকম হওয়ার বিষয়ে জোর দেয়। উদাহরণস্বরূপ, দুটি মডেল নিন: প্রথমটির (যথার্থতা, পুনর্বিবেচনা) = (0.8, 0.8) এবং দ্বিতীয়টির (যথার্থতা, পুনর্বিবেচনা) = (0.6, 1.0) রয়েছে। বীজগণিত গড় ব্যবহার করে, উভয় মডেল সমতুল্য হবে। জ্যামিতিক গড় ব্যবহার করে, প্রথম মডেলটি আরও ভাল কারণ এটি পুনরুদ্ধারের জন্য নির্ভুলতার বাণিজ্য করে না।