এফপিআর (মিথ্যা পজিটিভ রেট) বনাম এফডিআর (ভুয়া আবিষ্কারের হার)

20

স্টোরি এবং তিবশিরানী (2003) জিনোম বিস্তৃত অধ্যয়নের জন্য বিখ্যাত গবেষণা পত্রের পরিসংখ্যানগত তাত্পর্য থেকে নিম্নলিখিত উদ্ধৃতিটি এসেছে :

উদাহরণস্বরূপ, 5% এর একটি মিথ্যা ধনাত্মক হারের অর্থ হল যে গবেষণায় সত্যিকারের নাল বৈশিষ্ট্যের গড় 5% তাত্পর্যপূর্ণ বলা হবে। 5% এর একটি এফডিআর (মিথ্যা আবিষ্কারের হার) এর অর্থ হল যে সমস্ত বৈশিষ্ট্যগুলিকে উল্লেখযোগ্য বলা হয়, এর মধ্যে 5% সত্যই গড়পড়তা truly

একটি সহজ সংখ্যাসূচক বা চাক্ষুষ উদাহরণ ব্যবহার করে এর অর্থ কি কেউ ব্যাখ্যা করতে পারে? এর অর্থ কী তা বুঝতে আমার খুব কষ্ট হচ্ছে। আমি একা এফডিআর বা এফপিআর-তে বিভিন্ন পোস্ট পেয়েছি তবে সুনির্দিষ্ট তুলনা কোথায় করা হয়েছে তা খুঁজে পাইনি।

এটি বিশেষত ভাল হবে যদি এই অঞ্চলের বিশেষজ্ঞরা এমন পরিস্থিতি বর্ণনা করতে পারেন যেখানে একজনের তুলনায় একজন ভাল, বা উভয়ই ভাল বা খারাপ।

— 慕慕
সূত্র

3

আমি লক্ষ্য করেছি আপনি @ এম কেটি এর উত্তরটি একটি অনুগ্রহ, নাসিরকে দিয়েছিলেন। যদি সেই উত্তরটি আপনার জন্য আপনার প্রশ্নের সমাধান করে, আপনিও অনুগ্রহ সূচকটির নীচে বাম দিকে চেক চিহ্নটি ক্লিক করে এটি গ্রহণ করতে পারেন।

— গুং - মনিকা পুনরায়

29

আমি এগুলি কয়েকটি ভিন্ন উপায়ে ব্যাখ্যা করতে যাচ্ছি কারণ এটি আমাকে এটি বুঝতে সহায়তা করেছিল।

আসুন একটি নির্দিষ্ট উদাহরণ গ্রহণ করা যাক। আপনি একটি গ্রুপের একটি রোগের জন্য একটি পরীক্ষা করছেন। এখন কিছু শর্ত সংজ্ঞায়িত করা যাক। নিম্নলিখিত প্রত্যেকের জন্য, আমি এমন একজন ব্যক্তির কথা উল্লেখ করছি যার পরীক্ষা করা হয়েছে:

সত্য পজিটিভ (টিপি) : এই রোগটি রোগ হিসাবে চিহ্নিত হয়েছে having

মিথ্যা পজিটিভ (এফপি) : এই রোগটি নেই, এটি রোগ হিসাবে চিহ্নিত identified

সত্যিকারের নেতিবাচক (টিএন) : এই রোগটি নেই, এটি রোগ না থাকার হিসাবে চিহ্নিত

ভুয়া negativeণাত্মক (এফএন) : এই রোগটি রয়েছে, এটি রোগ না থাকার হিসাবে চিহ্নিত

দৃশ্যত, এটি সাধারণত বিভ্রান্তির ম্যাট্রিক্স ব্যবহার করে প্রদর্শিত হয় :

মিথ্যা ইতিবাচক হার (FPR) যারা রোগ নেই কিন্তু রোগ (সমস্ত FPS), তার হিসাবে সনাক্ত করা হয় সংখ্যা যারা রোগ না থাকে মানুষের মোট সংখ্যা দ্বারা বিভক্ত (অন্তর্ভুক্ত সব FPS এবং TNS) ।

এফ পি আর = \frac{এফ পি}{এফ পি + + টি এন}

$FPR = \frac{FP}{FP + TN}$

মিথ্যা আবিষ্কারের হার (রুজভেল্টের) যারা রোগ নেই কিন্তু রোগ (সমস্ত FPS) এটি হিসাবে চিহ্নিত আছে নম্বর, হয় যারা রোগ তার হিসাবে সনাক্ত করা হয় মোট সংখ্যা দ্বারা বিভক্ত (সমস্ত FPS এবং TPS অন্তর্ভুক্ত )।

এফ ডি আর = \frac{এফ পি}{এফ পি + + টি পি}

$FDR = \frac{FP}{FP + TP}$

সুতরাং, পার্থক্যটি হ'ল ডোনোমিনিটারে অর্থাৎ আপনি কী মিথ্যা ধনাত্মক সংখ্যার সাথে তুলনা করছেন?

FPR আপনি সব মানুষ যারা রোগ যারা রোগ তার হিসাবে চিহ্নিত হবে না অনুপাত কহন হয়।

রুজভেল্টের আপনি সব মানুষের রোগ যারা রোগ হবে না তার হিসাবে চিহ্নিত অনুপাত কহন হয়।

উভয়ই তাই দরকারী, ব্যর্থতার স্বতন্ত্র ব্যবস্থা। টিপি, এফপি, টিএন এবং এফএন এর পরিস্থিতি এবং অনুপাতের উপর নির্ভর করে আপনি অন্যটির চেয়ে বেশি যত্ন নিতে পারেন।

আসুন এখন এটিতে কিছু নম্বর রাখি। আপনি রোগের জন্য 100 জনকে পরিমাপ করেছেন এবং নিম্নলিখিতগুলি পান:

সত্য ধনাত্মক (টিপি) : 12

মিথ্যা ধনাত্মক (এফপি) : 4

সত্য নেতিবাচক (টিএন) : 76

মিথ্যা নেতিবাচক (এফএন) : 8

বিভ্রান্তির ম্যাট্রিক্স ব্যবহার করে এটি দেখানোর জন্য:

তারপর,

এফ পি আর = \frac{এফ পি}{এফ পি + + টি এন} = \frac{4}{4 + + 76} = \frac{4}{80} = 0.05 = 5 %

$FPR = \frac{FP}{FP + TN} = \frac{4}{4 + 76} = \frac{4}{80} = 0.05 = 5\%$

এফ ডি আর = \frac{এফ পি}{এফ পি + + টি পি} = \frac{4}{4 + + 12} = \frac{4}{16} = 0.25 = 25 %

$FDR = \frac{FP}{FP + TP} = \frac{4}{4 + 12} = \frac{4}{16} = 0.25 = 25\%$

অন্য কথায়,

এফপিআর আপনাকে বলে যে 5% লোক যাদের এই রোগ ছিল না তাদের চিহ্নিত করা হয়েছিল এই রোগটি। এফডিআর আপনাকে বলে যে 25% লোক যারা এই রোগ ছিল বলে চিহ্নিত হয়েছিল তাদের আসলে এই রোগ ছিল না।

@ অ্যামিবার মন্তব্যের ভিত্তিতে সম্পাদনা করুন (উপরের উদাহরণের সংখ্যাগুলিও):

পার্থক্য এত গুরুত্বপূর্ণ কেন? আপনি যে কাগজটির সাথে লিঙ্ক করেছেন, স্টোরি এবং তিবশিরানি উল্লেখ করেছেন যে জিনোমওয়াইড স্টাডিতে এফপিআর (বা টাইপ আই ত্রুটির হার) সম্পর্কে জোর ফোকাস ছিল এবং লোকেরা এই ত্রুটিযুক্ত অনুলিপি তৈরি করতে নেতৃত্ব দিচ্ছিল। এর কারণ হল একবার আপনি খুঁজতে FPR ফিক্সিং দ্বারা উল্লেখযোগ্য ফলাফল, আপনি কি সত্যিই, সত্যিই বিবেচনা করতে আপনার গুরুত্বপূর্ণ ফলাফল কত ভুল হবে। উপরের উদাহরণে, 25% 'উল্লেখযোগ্য ফলাফল' ভুল হত! $n$

[পার্শ্ব দ্রষ্টব্য: উইকিপিডিয়া উল্লেখ করেছে যে এফপিআর গাণিতিকভাবে I টাইপ ত্রুটি টাইপের সমতুল্য হলেও এটি ধারণামূলকভাবে স্বতন্ত্র হিসাবে বিবেচিত হয় কারণ একটি সাধারণত একটি প্রাইমারি সেট করা হয় অন্যটি সাধারণত পরীক্ষার কার্যকারিতা পরিমাপ করার জন্য ব্যবহৃত হয়। এটি গুরুত্বপূর্ণ তবে আমি এখানে এটি নিয়ে আলোচনা করব না]।

এবং আরও কিছুটা সম্পূর্ণতার জন্য:

স্পষ্টতই, এফপিআর এবং এফডিআর কেবলমাত্র প্রাসঙ্গিক মেট্রিক নয় যা আপনি বিভ্রান্তির ম্যাট্রিক্সে চারটি পরিমাণের সাথে গণনা করতে পারবেন। এর অনেক সম্ভব বৈশিষ্ট্যের মান যে প্রেক্ষাপটের দরকারী হতে পারে , দুই অপেক্ষাকৃত সাধারণ বেশী যে আপনি সম্মুখীন করার সম্ভাবনা বেশি রয়েছে:

সংবেদনশীলতা হিসাবে পরিচিত ট্রু পজিটিভ রেট (টিপিআর) হ'ল এই রোগে আক্রান্ত লোকদের অনুপাত হ'ল এই রোগটি যাদের এই রোগ রয়েছে বলে চিহ্নিত করা হয়।

টি পি আর = \frac{টি পি}{টি পি + + এফ এন}

$TPR = \frac{TP}{TP + FN}$

ট্রু নেগেটিভ রেট (টিএনআর) , যা নির্দিষ্টতা হিসাবেও পরিচিত , এটি এমন লোকের অনুপাত যা যাদের এই রোগ নেই তারা যাদের এই রোগটি নেই বলে চিহ্নিত করা হয়।

টি এন আর = \frac{টি এন}{টি এন + + এফ পি}

$TNR = \frac{TN}{TN + FP}$

— এমকেটি - মনিকা পুনরায় স্থাপন করুন
সূত্র

3

+1 টি। সংখ্যাসূচক উদাহরণটি সামঞ্জস্য করার জন্য এটি বোধগম্য হতে পারে যাতে এফপিআর = 5% কারণ আপনি যদি পি <0.05 কে মানদণ্ড হিসাবে ব্যবহার করেন (পরীক্ষার সঠিক আকার রয়েছে বলে ধরে নেওয়া) তবে আপনি যা করতে যাচ্ছেন তা তাই। বা 1% যদি পি <0.01, যাই হোক না কেন। এই সংযোগটি নির্দেশ করা কিছু পাঠকদের জন্য সহায়ক হতে পারে।

— অ্যামিবা বলেছেন মোনিকা

1

@ অ্যামিবা আপনাকে ধন্যবাদ, এটি একটি ভাল ধারণা। আমি পরে এটি করার চেষ্টা করব।

— এমকেটি - মনিকা

2

আপনার https://en.wikedia.org/wiki/Confusion_matrix এ সারণীটি পরীক্ষা করা উচিত । অনুগ্রহ করে নোট করুন যে এফডিআর অনুভূমিক অবস্থায় এফপিআরটি উলম্বভাবে স্থাপন করা হয়েছে।

আপনার নাল অনুমানটি সত্য হলে এফপি হয় তবে আপনি এটিকে প্রত্যাখ্যান করেন
আপনি উল্লেখযোগ্য কিছু পূর্বাভাস দিলে এফডি হয় তবে আপনার উচিত হবে না

— SmallChess
সূত্র

আমি এটি জানি তবে আমি তুলনা করতে বিশেষভাবে আগ্রহী যেমন আপনি যদি কিছু নম্বর এবং ভিজ্যুয়ালাইজেশন দিয়ে নিজের সংখ্যাগুলি সমর্থন করার জন্য সেই ধারণাটি ব্যাখ্যা করতে পারেন যা খুব আকর্ষণীয় হবে।

— 李慕