বেনজামিনী এবং হচবার্গ মিথ্যা আবিষ্কারের হারকে ঠিক একইভাবে সংজ্ঞায়িত করেন, যেমন মিথ্যা ধনাত্মক ধনাত্মক পরীক্ষার ভগ্নাংশ। সুতরাং যদি আপনি একাধিক তুলনার জন্য তাদের পদ্ধতিটি ব্যবহার করেন আপনি সঠিকভাবে FDR নিয়ন্ত্রণ করেন। এটি লক্ষণীয়, যদিও, বিএইচ পদ্ধতিতে বেশ কয়েকটি বৈকল্পিক রয়েছে। বার্কলেতে বেঞ্জামিনির সেমিনারগুলি ইউটিউবে রয়েছে, এবং দেখার মতো মূল্যবান:
আমি নিশ্চিত নই যে @ অ্যামিবা কেন "এটিকে খুব দৃ strongly়তার সাথে প্রস্তুত করা হয়েছে এবং এটি আসলে বিভ্রান্তিকর হতে পারে"। আমি কেন সে / সে তা ভাবছে তা জানতে আগ্রহী হব। সর্বাধিক প্ররোচিত যুক্তিটি সিমুলেটেড টি পরীক্ষা (বিভাগ 6) থেকে আসে। এটি অনুশীলন করে প্রায় প্রত্যেকে যা করেন তা অনুকরণ করে এবং এটি দেখায় যে আপনি যদি 0.0 এর কাছাকাছি পর্যবেক্ষণ করেন এবং আবিষ্কার করেছেন বলে দাবি করেন তবে আপনি অন্তত 26% সময় ভুল করবেন। কী ভুল হতে পারে?
অবশ্যই, আমার এটিকে সর্বনিম্ন হিসাবে বর্ণনা করা উচিত নয়। আপনি যদি ধরে নেন যে সেখানে আসল প্রভাব হওয়ার 50% সম্ভাবনা রয়েছে তবে আপনি এটি পেয়ে যাবেন। অবশ্যই যদি আপনি ধরে নেন যে আপনার বেশিরভাগ হাইপোথিসিগুলি আগে থেকেই সঠিক, তবে আপনি 26% এর চেয়ে কম এফডিআর পেতে পারেন, তবে আপনি কি অনুমানের যে কোনও দাবিটিকে স্বাগত জানাতে পারেন যে অনুমানের ভিত্তিতে একটি আবিষ্কার করেছেন তা কল্পনা করতে পারেন? আপনি ইতিপূর্বে 90% নিশ্চিত ছিলেন যে আপনার উপসংহারটি সত্য হবে। 26% হ'ল ন্যূনতম এফডিআর যে 0.5% এর চেয়ে বেশি পূর্বের কোনও সম্ভাবনা অনুমান করার পক্ষে যুক্তিসঙ্গত ভিত্তি নয়।
পরীক্ষিত হওয়ার সময় শিকারগুলি প্রায়শই উঠে দাঁড়ায় না, এটি দেওয়া ভাল যে কোনও নির্দিষ্ট অনুমানের সত্য হওয়ার মাত্র 10% সম্ভাবনা রয়েছে এবং সেক্ষেত্রে এফডিআর একটি বিপর্যয়কর 76% হবে।
এটা সত্য যে নাল অনুমানের উপর এই সমস্তই সংঘটিত যে শূন্য পার্থক্য রয়েছে (তথাকথিত বিন্দু নাল)। অন্যান্য পছন্দগুলি বিভিন্ন ফলাফল দিতে পারে। তবে মূল বিষয়টি হ'ল প্রায় প্রত্যেকেই বাস্তব জীবনে ব্যবহার করে (যদিও এটি সম্পর্কে সচেতন নাও হতে পারে)। তবুও বিন্দুটি আমার কাছে পুরোপুরি ব্যবহার করার মতো উপযুক্ত জিনিস বলে মনে হচ্ছে। এটি কখনও কখনও আপত্তি জানায় যে সত্য পার্থক্য কখনও শূন্য হয় না। আমি একমত না উভয় গ্রুপকে একইরকম চিকিত্সা দেওয়া হয় সেই ক্ষেত্রে থেকে আমাদের ফলাফলগুলি পৃথক নয় কিনা তা আমরা বলতে চাই, তাই আসল পার্থক্য হ'ল শূন্য। যদি আমরা স্থির করি যে আউট ডেটা সেই দৃশ্যের সাথে সামঞ্জস্যপূর্ণ নয়, তবে আমরা প্রভাবের আকারটি অনুমান করতে যাই। এবং সেই মুহুর্তে আমরা প্রভাবটি বাস্তব হলেও তা বাস্তবে গুরুত্বপূর্ণ হওয়ার পক্ষে যথেষ্ট কিনা তা নিয়ে পৃথক রায় করি।দেবোরা মায়োর ব্লগ ।
@ আমেবা আপনার প্রতিক্রিয়া জন্য ধন্যবাদ।
মায়োর ব্লগের আলোচনায় মূলত মায়ো আমার সাথে একমত নন, যদিও তিনি কেন কমপক্ষে আমার কাছে তা স্পষ্ট করেননি। স্টিফেন সেন সঠিকভাবে উল্লেখ করেছেন যে আপনি যদি অন্য পূর্বের বিতরণ পোস্ট করেন তবে আপনি একটি আলাদা উত্তর পেতে পারেন। এটি আমার কাছে কেবল বিষয়গত বায়েশিয়ানদের কাছেই আকর্ষণীয় বলে মনে হচ্ছে।
এটি অবশ্যই প্রাত্যহিক অনুশীলনের সাথে অপ্রাসঙ্গিক যা সর্বদা একটি পয়েন্ট বাতিল করে। এবং আমি যেমন ব্যাখ্যা করেছি, এটি আমার কাছে একদম বুদ্ধিমান জিনিস বলে মনে হচ্ছে।
অনেক পেশাদার পরিসংখ্যানবিদ আমার মত একই সিদ্ধান্তে এসেছেন। সেল্কে এবং বার্গার এবং ভ্যালেন জনসন (আমার কাগজে রেফারেস) ব্যবহার করে দেখুন। আমার দাবী সম্পর্কে খুব বিতর্কিত (বা খুব আসল) কিছুই নেই।
আপনার অন্য বিষয়টি, ০.৫ পূর্বে ধরে নেওয়া সম্পর্কে, আমার মোটেই অনুমান বলে মনে হয় না। যেমন আমি উপরে ব্যাখ্যা করেছি, 0.5 এর উপরে যে কোনও কিছুই অনুশীলনে অগ্রহণযোগ্য হবে। 0.5 এর নীচে যে কোনও কিছু মিথ্যা আবিষ্কারের হারকে আরও বেশি করে তোলে (উদাহরণস্বরূপ 76% পূর্বে যদি 0.1 হয়)। অতএব এটি বলা মোটেও যুক্তিসঙ্গত যে 26% হল ন্যূনতম মিথ্যা আবিষ্কারের হার যা আপনি আশা করতে পারেন যদি আপনি একক পরীক্ষায় পি = 0.047 পর্যবেক্ষণ করেন।
আমি এই প্রশ্ন সম্পর্কে আরও চিন্তা করা হয়েছে। আমার এফডিআর সম্পর্কে সংজ্ঞাটি বেঞ্জামিনির-পজিটিভ পরীক্ষার ভগ্নাংশের মতোই। তবে এটি একেবারে ভিন্ন সমস্যার ক্ষেত্রে প্রয়োগ করা হয়, একটি একক পরীক্ষার ব্যাখ্যা। পর্দার দৃষ্টিতে যদি আমি অন্য একটি শব্দ বেছে নিই তবে ভাল হত better
একক পরীক্ষার ক্ষেত্রে, বি অ্যান্ড এইচ পি মানটি অপরিবর্তিত রেখে দেয়, সুতরাং আমি যে শব্দটি ব্যবহার করি সে অর্থে এটি মিথ্যা আবিষ্কারের হার সম্পর্কে কিছু বলে না।
অবশ্যই আপনি ঠিক বলেছেন। বেনজামিনী এবং হচবার্গ এবং অন্যান্য ব্যক্তিরা যারা একাধিক তুলনা করে কাজ করেন তাদের লক্ষ্য কেবল প্রকার 1 ত্রুটির হারটি সংশোধন করা। সুতরাং তারা একটি "সঠিক" পি মান দিয়ে শেষ হয়। এটি অন্য কোনও পি মান হিসাবে একই সমস্যার সাপেক্ষে। আমার সর্বশেষ গবেষণাপত্রে, আমি এই ভুল বোঝাবুঝি এড়ানোর প্রয়াসে এফডিআর থেকে ফলস পজিটিভ রিস্ক (এফপিআর) এ নাম পরিবর্তন করেছি।
কিছু গণনা করার জন্য আমরা একটি ওয়েব অ্যাপও লিখেছি (আমরা যে কয়েকটি আর-র স্ক্রিপ্টগুলি সরবরাহ করি তা ডাউনলোড করার পরে) after এটি https://davidcolquhoun.shinyapps.io/3-calcs-final/ এ এটির সম্পর্কে সমস্ত মতামত স্বাগত (প্রথমে নোটস ট্যাবটি পড়ুন)।
পিএস ওয়েব ক্যালকুলেটরটির এখন একটি নতুন (স্থায়ী, আমি আশা করি) http://fpr-calc.ucl.ac.uk/ এ
Shiny.io ব্যবহার করা সহজ তবে যদি কেউ আসলে অ্যাপটি ব্যবহার করে তবে খুব ব্যয়বহুল :-(
আমি এই আলোচনায় ফিরে এসেছি, এখন বিষয়টি নিয়ে আমার দ্বিতীয় পত্রটি রয়েল সোসাইটি ওপেন সায়েন্সে প্রকাশিত হতে চলেছে। এটি https://www.biorxiv.org/content/early/2017/08/07/144337 এ রয়েছে
আমি বুঝতে পেরেছি যে আমি প্রথম কাগজে সবচেয়ে বড় ভুলটি হয়েছিল "মিথ্যা আবিষ্কারের হার (এফডিআর)" শব্দটি ব্যবহার করা। নতুন কাগজে আমি আরও স্পষ্ট করে দিয়েছি যে আমি একাধিক তুলনা সমস্যা সম্পর্কে কিছুই বলছি না। আমি কেবলমাত্র একক পক্ষপাতদুষ্ট পরীক্ষায় পর্যালোচনা করা P মানটিকে কীভাবে ব্যাখ্যা করব সেই প্রশ্নের সাথেই আমি ডিল করি।
সর্বশেষ সংস্করণে, আমি সম্ভাব্যতার সাথে উল্লেখ করছি যে বিভ্রান্তি হ্রাস করার আশায় ফলসটি এফডিআরের পরিবর্তে মিথ্যা পজিটিভ ঝুঁকি (এফপিআর) হিসাবে ফলাফল দেয়। আমি বিপরীত বায়েশিয়ান পদ্ধতির পক্ষেও বলছি - 5% এর এফপিআর নিশ্চিত করার জন্য যে পূর্বের সম্ভাবনা প্রয়োজন তা নির্দিষ্ট করে দিন। আপনি যদি পি = 0.05 পর্যবেক্ষণ করেন তবে তা 0.87 এ আসে। অন্য কথায় আপনাকে প্রায় (%)%) নিশ্চিত হতে হবে যে 5% এর এফপিআর অর্জনের জন্য পরীক্ষা-নিরীক্ষার আগে সত্যিকারের প্রভাব ছিল (যা বেশিরভাগ মানুষ এখনও বিশ্বাস করে, ভুলভাবে পি = 0.05 অর্থ)।