এফপিআর (মিথ্যা পজিটিভ রেট) বনাম এফডিআর (ভুয়া আবিষ্কারের হার)


20

স্টোরি এবং তিবশিরানী (2003) জিনোম বিস্তৃত অধ্যয়নের জন্য বিখ্যাত গবেষণা পত্রের পরিসংখ্যানগত তাত্পর্য থেকে নিম্নলিখিত উদ্ধৃতিটি এসেছে :

উদাহরণস্বরূপ, 5% এর একটি মিথ্যা ধনাত্মক হারের অর্থ হল যে গবেষণায় সত্যিকারের নাল বৈশিষ্ট্যের গড় 5% তাত্পর্যপূর্ণ বলা হবে। 5% এর একটি এফডিআর (মিথ্যা আবিষ্কারের হার) এর অর্থ হল যে সমস্ত বৈশিষ্ট্যগুলিকে উল্লেখযোগ্য বলা হয়, এর মধ্যে 5% সত্যই গড়পড়তা truly

একটি সহজ সংখ্যাসূচক বা চাক্ষুষ উদাহরণ ব্যবহার করে এর অর্থ কি কেউ ব্যাখ্যা করতে পারে? এর অর্থ কী তা বুঝতে আমার খুব কষ্ট হচ্ছে। আমি একা এফডিআর বা এফপিআর-তে বিভিন্ন পোস্ট পেয়েছি তবে সুনির্দিষ্ট তুলনা কোথায় করা হয়েছে তা খুঁজে পাইনি।

এটি বিশেষত ভাল হবে যদি এই অঞ্চলের বিশেষজ্ঞরা এমন পরিস্থিতি বর্ণনা করতে পারেন যেখানে একজনের তুলনায় একজন ভাল, বা উভয়ই ভাল বা খারাপ।


3
আমি লক্ষ্য করেছি আপনি @ এম কেটি এর উত্তরটি একটি অনুগ্রহ, নাসিরকে দিয়েছিলেন। যদি সেই উত্তরটি আপনার জন্য আপনার প্রশ্নের সমাধান করে, আপনিও অনুগ্রহ সূচকটির নীচে বাম দিকে চেক চিহ্নটি ক্লিক করে এটি গ্রহণ করতে পারেন।
গুং - মনিকা পুনরায়

উত্তর:


29

আমি এগুলি কয়েকটি ভিন্ন উপায়ে ব্যাখ্যা করতে যাচ্ছি কারণ এটি আমাকে এটি বুঝতে সহায়তা করেছিল।

আসুন একটি নির্দিষ্ট উদাহরণ গ্রহণ করা যাক। আপনি একটি গ্রুপের একটি রোগের জন্য একটি পরীক্ষা করছেন। এখন কিছু শর্ত সংজ্ঞায়িত করা যাক। নিম্নলিখিত প্রত্যেকের জন্য, আমি এমন একজন ব্যক্তির কথা উল্লেখ করছি যার পরীক্ষা করা হয়েছে:

সত্য পজিটিভ (টিপি) : এই রোগটি রোগ হিসাবে চিহ্নিত হয়েছে having

মিথ্যা পজিটিভ (এফপি) : এই রোগটি নেই, এটি রোগ হিসাবে চিহ্নিত identified

সত্যিকারের নেতিবাচক (টিএন) : এই রোগটি নেই, এটি রোগ না থাকার হিসাবে চিহ্নিত

ভুয়া negativeণাত্মক (এফএন) : এই রোগটি রয়েছে, এটি রোগ না থাকার হিসাবে চিহ্নিত

দৃশ্যত, এটি সাধারণত বিভ্রান্তির ম্যাট্রিক্স ব্যবহার করে প্রদর্শিত হয় :

এখানে চিত্র বর্ণনা লিখুন

মিথ্যা ইতিবাচক হার (FPR) যারা রোগ নেই কিন্তু রোগ (সমস্ত FPS), তার হিসাবে সনাক্ত করা হয় সংখ্যা যারা রোগ না থাকে মানুষের মোট সংখ্যা দ্বারা বিভক্ত (অন্তর্ভুক্ত সব FPS এবং TNS) ।

এফপিআর=এফপিএফপি+ +টিএন

মিথ্যা আবিষ্কারের হার (রুজভেল্টের) যারা রোগ নেই কিন্তু রোগ (সমস্ত FPS) এটি হিসাবে চিহ্নিত আছে নম্বর, হয় যারা রোগ তার হিসাবে সনাক্ত করা হয় মোট সংখ্যা দ্বারা বিভক্ত (সমস্ত FPS এবং TPS অন্তর্ভুক্ত )।

এফডিআর=এফপিএফপি+ +টিপি


সুতরাং, পার্থক্যটি হ'ল ডোনোমিনিটারে অর্থাৎ আপনি কী মিথ্যা ধনাত্মক সংখ্যার সাথে তুলনা করছেন?

FPR আপনি সব মানুষ যারা রোগ যারা রোগ তার হিসাবে চিহ্নিত হবে না অনুপাত কহন হয়।

রুজভেল্টের আপনি সব মানুষের রোগ যারা রোগ হবে না তার হিসাবে চিহ্নিত অনুপাত কহন হয়।

উভয়ই তাই দরকারী, ব্যর্থতার স্বতন্ত্র ব্যবস্থা। টিপি, এফপি, টিএন এবং এফএন এর পরিস্থিতি এবং অনুপাতের উপর নির্ভর করে আপনি অন্যটির চেয়ে বেশি যত্ন নিতে পারেন।


আসুন এখন এটিতে কিছু নম্বর রাখি। আপনি রোগের জন্য 100 জনকে পরিমাপ করেছেন এবং নিম্নলিখিতগুলি পান:

সত্য ধনাত্মক (টিপি) : 12

মিথ্যা ধনাত্মক (এফপি) : 4

সত্য নেতিবাচক (টিএন) : 76

মিথ্যা নেতিবাচক (এফএন) : 8

বিভ্রান্তির ম্যাট্রিক্স ব্যবহার করে এটি দেখানোর জন্য:

এখানে চিত্র বর্ণনা লিখুন

তারপর,

এফপিআর=এফপিএফপি+ +টিএন=44+ +76=480=0.05=5%

এফডিআর=এফপিএফপি+ +টিপি=44+ +12=416=0.25=25%

অন্য কথায়,

এফপিআর আপনাকে বলে যে 5% লোক যাদের এই রোগ ছিল না তাদের চিহ্নিত করা হয়েছিল এই রোগটি। এফডিআর আপনাকে বলে যে 25% লোক যারা এই রোগ ছিল বলে চিহ্নিত হয়েছিল তাদের আসলে এই রোগ ছিল না।


@ অ্যামিবার মন্তব্যের ভিত্তিতে সম্পাদনা করুন (উপরের উদাহরণের সংখ্যাগুলিও):

পার্থক্য এত গুরুত্বপূর্ণ কেন? আপনি যে কাগজটির সাথে লিঙ্ক করেছেন, স্টোরি এবং তিবশিরানি উল্লেখ করেছেন যে জিনোমওয়াইড স্টাডিতে এফপিআর (বা টাইপ আই ত্রুটির হার) সম্পর্কে জোর ফোকাস ছিল এবং লোকেরা এই ত্রুটিযুক্ত অনুলিপি তৈরি করতে নেতৃত্ব দিচ্ছিল। এর কারণ হল একবার আপনি খুঁজতে FPR ফিক্সিং দ্বারা উল্লেখযোগ্য ফলাফল, আপনি কি সত্যিই, সত্যিই বিবেচনা করতে আপনার গুরুত্বপূর্ণ ফলাফল কত ভুল হবে। উপরের উদাহরণে, 25% 'উল্লেখযোগ্য ফলাফল' ভুল হত!এন

[পার্শ্ব দ্রষ্টব্য: উইকিপিডিয়া উল্লেখ করেছে যে এফপিআর গাণিতিকভাবে I টাইপ ত্রুটি টাইপের সমতুল্য হলেও এটি ধারণামূলকভাবে স্বতন্ত্র হিসাবে বিবেচিত হয় কারণ একটি সাধারণত একটি প্রাইমারি সেট করা হয় অন্যটি সাধারণত পরীক্ষার কার্যকারিতা পরিমাপ করার জন্য ব্যবহৃত হয়। এটি গুরুত্বপূর্ণ তবে আমি এখানে এটি নিয়ে আলোচনা করব না]।


এবং আরও কিছুটা সম্পূর্ণতার জন্য:

স্পষ্টতই, এফপিআর এবং এফডিআর কেবলমাত্র প্রাসঙ্গিক মেট্রিক নয় যা আপনি বিভ্রান্তির ম্যাট্রিক্সে চারটি পরিমাণের সাথে গণনা করতে পারবেন। এর অনেক সম্ভব বৈশিষ্ট্যের মান যে প্রেক্ষাপটের দরকারী হতে পারে , দুই অপেক্ষাকৃত সাধারণ বেশী যে আপনি সম্মুখীন করার সম্ভাবনা বেশি রয়েছে:

সংবেদনশীলতা হিসাবে পরিচিত ট্রু পজিটিভ রেট (টিপিআর) হ'ল এই রোগে আক্রান্ত লোকদের অনুপাত হ'ল এই রোগটি যাদের এই রোগ রয়েছে বলে চিহ্নিত করা হয়।

টিপিআর=টিপিটিপি+ +এফএন

ট্রু নেগেটিভ রেট (টিএনআর) , যা নির্দিষ্টতা হিসাবেও পরিচিত , এটি এমন লোকের অনুপাত যা যাদের এই রোগ নেই তারা যাদের এই রোগটি নেই বলে চিহ্নিত করা হয়।

টিএনআর=টিএনটিএন+ +এফপি


3
+1 টি। সংখ্যাসূচক উদাহরণটি সামঞ্জস্য করার জন্য এটি বোধগম্য হতে পারে যাতে এফপিআর = 5% কারণ আপনি যদি পি <0.05 কে মানদণ্ড হিসাবে ব্যবহার করেন (পরীক্ষার সঠিক আকার রয়েছে বলে ধরে নেওয়া) তবে আপনি যা করতে যাচ্ছেন তা তাই। বা 1% যদি পি <0.01, যাই হোক না কেন। এই সংযোগটি নির্দেশ করা কিছু পাঠকদের জন্য সহায়ক হতে পারে।
অ্যামিবা বলেছেন মোনিকা

1
@ অ্যামিবা আপনাকে ধন্যবাদ, এটি একটি ভাল ধারণা। আমি পরে এটি করার চেষ্টা করব।
এমকেটি - মনিকা

2

আপনার https://en.wikedia.org/wiki/Confusion_matrix এ সারণীটি পরীক্ষা করা উচিত । অনুগ্রহ করে নোট করুন যে এফডিআর অনুভূমিক অবস্থায় এফপিআরটি উলম্বভাবে স্থাপন করা হয়েছে।

  • আপনার নাল অনুমানটি সত্য হলে এফপি হয় তবে আপনি এটিকে প্রত্যাখ্যান করেন
  • আপনি উল্লেখযোগ্য কিছু পূর্বাভাস দিলে এফডি হয় তবে আপনার উচিত হবে না

আমি এটি জানি তবে আমি তুলনা করতে বিশেষভাবে আগ্রহী যেমন আপনি যদি কিছু নম্বর এবং ভিজ্যুয়ালাইজেশন দিয়ে নিজের সংখ্যাগুলি সমর্থন করার জন্য সেই ধারণাটি ব্যাখ্যা করতে পারেন যা খুব আকর্ষণীয় হবে।
李慕
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.