এফডিআর পদ্ধতিগুলি বেসের হারের মডেল ছাড়াই একটি মিথ্যা আবিষ্কারের হারের কীভাবে অনুমান করতে পারে?


9

কেউ কী ব্যাখ্যা করতে পারেন যে কীভাবে এফডিআর পদ্ধতিগুলি সত্য পজিটিভের ভিত্তির হারের মডেল / ধারণা না নিয়ে কোনও এফডিআর অনুমান করতে সক্ষম হয়?

উত্তর:


5

আমি মনে করি এটি সত্যিই একটি ভাল প্রশ্ন; অনেক লোক বেনজামিনী-হচবার্গ প্রক্রিয়া (সংক্ষেপে বিএইচ; সম্ভবত এফডিআর নিয়ন্ত্রণের জন্য সর্বাধিক জনপ্রিয় পদ্ধতি) একটি কালো বাক্স হিসাবে ব্যবহার করে। প্রকৃতপক্ষে এখানে একটি অন্তর্নিহিত ধারণা আছে যা এটি পরিসংখ্যানগুলিতে তৈরি করে এবং এটি পি-ভ্যালুগুলির সংজ্ঞায় খুব ভালভাবে লুকিয়ে আছে!

সু-সংজ্ঞায়িত পি-মান এটি হ'ল অনুমানের অধীনে সমানভাবে বিতরণ করা হয় ( )। কখনও কখনও এটি এমনকি হতে পারে যে , অর্থাত্ ইউনিফর্মের চেয়ে স্টোকাসটিক্যালি ছোট, তবে এটি কেবল পদ্ধতিগুলি আরও রক্ষণশীল করে তোলে (এবং তাই এখনও বৈধ)। সুতরাং, আপনার পি-মানগুলি গণনা করে টি-টেস্ট বা আপনার পছন্দের কোনও পরীক্ষা ব্যবহার করে আপনি নাল অনুমানের অধীনে বিতরণ সম্পর্কিত তথ্য সরবরাহ করছেন।PPPU[0,1]Pr[Pt]tP

তবে এখানে লক্ষ্য করুন যে আমি নাল অনুমানের বিষয়ে কথা বলেছি; সুতরাং আপনি সত্য ধনাত্মকগুলির মূল হার সম্পর্কে জ্ঞানের বিষয়ে যা উল্লেখ করেছেন তা প্রয়োজন হয় না , আপনার কেবলমাত্র মিথ্যা ধনাত্মকগুলির ভিত্তির হার সম্পর্কে জ্ঞান প্রয়োজন! কেন?

আসুন সব প্রত্যাখ্যাত (ধনাত্মক) অনুমানের এবং সংখ্যা বোঝাতে মিথ্যা positives, তারপর:RV

FDR=E[Vmax(R,1)]E[V]E[R]

সুতরাং এফডিআর অনুমান করার জন্য আপনার কাছে , অনুমান করার একটি উপায় প্রয়োজন । আমরা এখন সিদ্ধান্ত নিয়ম যা সব P-মান প্রত্যাখ্যান তাকান হবে । স্বরলিপিটিতে এটি পরিষ্কার করার জন্য আমি এ জাতীয় পদ্ধতির সম্পর্কিত পরিমাণ / এলোমেলো ভেরিয়েবলের জন্য ও লিখব ।E[R]E[V]tFDR(t),R(t),V(t)

যেহেতু কেবলমাত্র মোট প্রত্যাখ্যানের প্রত্যাশা, তাই আপনি যে পরিমাণ প্রত্যাখ্যান করেছেন তা নিরপেক্ষভাবে অনুমান করতে পারেন, সুতরাং , অর্থাত্ আপনার পি-মানগুলির কতগুলি গণনা করে ।E[R(t)]E[R(t)]R(t)t

এখন সম্পর্কে কী ? মনে করুন আপনার মোট অনুমানের হ'ল নাল হাইপোথিসেস, তারপরে নীচে পি-ভ্যালুগুলির (বা উপ-অভিন্নতা) দ্বারা:E[V]m0m

E[V(t)]=i nullPr[Pit]m0t

তবে আমরা এখনও জানি না , তবে আমরা জানি যে , সুতরাং একটি রক্ষণশীল উপরের । সুতরাং, যেহেতু আমাদের কেবল মিথ্যা ধনাত্মক সংখ্যার উপর একটি উপরের আবদ্ধ প্রয়োজন, এটি যথেষ্ট যে আমরা তাদের বিতরণটি জানি! এবং বিএইচ প্রক্রিয়া ঠিক এটি করে।m0m0mE[V(t)]mt

সুতরাং, যদিও আড়ং জেং এর মন্তব্য যে "বিএইচ পদ্ধতিটি প্রদত্ত স্তরের প্রশ্নে এফডিআর নিয়ন্ত্রণ করার একটি উপায় is এটি এফডিআর অনুমান করার বিষয়ে নয়" এটি মিথ্যা নয়, এটি অত্যন্ত বিভ্রান্তিকরও! বি এইচ পদ্ধতি আসলে আছে প্রতিটি দেওয়া থ্রেশহোল্ড জন্য রুজভেল্টের অনুমান । এবং তারপরে এটি সর্বাধিক প্রান্তিক প্রান্তটি বেছে নেয়, যেমন আনুমানিক এফডিআর pha নীচে । প্রকৃতপক্ষে "স্থায়ী P-মান" হাইপোথিসিস এর মূলত থ্রেশহোল্ড এ রুজভেল্টের মাত্র একটি অনুমান (isotonization পর্যন্ত)। আমি মনে করি প্রমিত বিএইচ অ্যালগরিদম এই বাস্তবতাটি কিছুটা আড়াল করে, তবে এই দুটি পদ্ধতির সমতুল্যতা দেখানো সহজ (একাধিক পরীক্ষামূলক সাহিত্যে "সমতুল্য উপপাদ্য" নামেও পরিচিত)।tαit=pi

চূড়ান্ত মন্তব্য হিসাবে, স্টোরির প্রক্রিয়া সম্পর্কিত এমন কিছু পদ্ধতি রয়েছে যা এমনকি ডেটা থেকে অনুমান করে; এটি সামান্য বিট দ্বারা শক্তি বৃদ্ধি করতে পারে। এছাড়াও নীতিগতভাবে আপনি ঠিক বলেছেন, আরও শক্তিশালী পদ্ধতিগুলি পেতে বিকল্পের (আপনার সত্য পজিটিভ বেস রেট) অধীনে বিতরণও মডেল করা যেতে পারে; তবে এখনও পর্যন্ত একাধিক পরীক্ষামূলক গবেষণা প্রধানত ক্ষমতা সর্বাধিকের পরিবর্তে টাইপ -1 ত্রুটির নিয়ন্ত্রণ বজায় রাখার দিকে মনোনিবেশ করেছে। একটি অসুবিধাটি হ'ল অনেক ক্ষেত্রে আপনার প্রতিটি প্রকৃত বিকল্পের আলাদা বিকল্প বিতরণ হবে (উদাহরণস্বরূপ বিভিন্ন অনুমানের জন্য আলাদা শক্তি), যখন নালীর নীচে সমস্ত পি-মানগুলির একই বন্টন থাকে। এটি সত্যিকারের ইতিবাচক হারের মডেলিংকে আরও কঠিন করে তোলে।m0


3
+1 সম্ভবত "বিএইচ" বেনজামিনী-হচবার্গকে বোঝায় । (সংক্ষিপ্ত শব্দটির বানানটি সর্বদা একটি ভাল ধারণা, যাতে লোকেরা ভুল বোঝে না।) আমাদের সাইটে আপনাকে স্বাগতম!
whuber

1
ধন্যবাদ! এছাড়াও হ্যাঁ আপনি ঠিকই বলেছেন, সেটিকে প্রতিফলিত করার জন্য আমি আমার পোস্ট সম্পাদনা করেছি।
এয়ার এয়ার

4

@ মায়ার পরামর্শ অনুসারে, বেঞ্জামিন-হচবার্গ (বিএইচ) পদ্ধতি এফডিআর নিয়ন্ত্রণের নিশ্চয়তা দেয়। এটির অনুমান করার লক্ষ্য নেই। এটির জন্য পরীক্ষার পরিসংখ্যানগুলির মধ্যে কেবল দুর্বল নির্ভরতা অনুমিতি প্রয়োজন। [1,2]

এফডিআর অনুমান করার লক্ষ্যে যে পদ্ধতিগুলি [উদাহরণস্বরূপ ৩,৪,৫] জেনারেটর প্রক্রিয়াটি অনুমান করতে পারে তার জন্য কিছু অনুমানের প্রয়োজন হয়। তারা সাধারণত ধরে নেয় পরীক্ষার পরিসংখ্যানগুলি স্বাধীন। তারা পরীক্ষার পরিসংখ্যানের নাল বিতরণেও কিছু গ্রহণ করবে। এই নাল বিতরণ থেকে প্রস্থানগুলি, একসাথে স্বাধীনতা অনুমানের সাথে, এইভাবে প্রভাবগুলিতে দায়ী করা যেতে পারে এবং এফডিআর অনুমান করা যেতে পারে।

নোট করুন যে এই ধারণাগুলি আধা-তত্ত্বাবধানে অভিনবত্ব সনাক্তকরণের সাহিত্যে পুনরায় প্রদর্শিত হবে। [6]।

[1] বেনজামিনী, ওয়াই, এবং ওয়াই হচবার্গ। "মিথ্যা আবিষ্কারের হার নিয়ন্ত্রণ করা: একাধিক পরীক্ষার জন্য ব্যবহারিক এবং শক্তিশালী পদ্ধতি” " জার্নাল-রোয়াল স্ট্যাটাসটিকাল সোসাইটি সিরিজ বি 57 (1995): 289–289।

[2] বেনজামিনী, ওয়াই, এবং ডি ইয়েকুটিয়ালি। "নির্ভরতার অধীনে একাধিক পরীক্ষায় মিথ্যা আবিষ্কারের হারের নিয়ন্ত্রণ।" সংখ্যাবৃদ্ধির সংখ্যা 29, নং। 4 (2001): 1165–88।

[3] স্টোরি, জেডি "মিথ্যা আবিষ্কারের হারের প্রতি সরাসরি দৃষ্টিভঙ্গি"। রয়্যাল স্ট্যাটিস্টিকাল সোসাইটি সিরিজ বি 64 এর জার্নাল, নং। 3 (2002): 479–98। ডোই: 10.1111 / 1467-9868.00346।

[৪] এফ্রন, বি। "মাইক্রোয়ারে, এমিরিকাল বেইস এবং দ্বি-গ্রুপ মডেল।" পরিসংখ্যান বিজ্ঞান 23, না। 1 (2008): 1-22।

[5] জিন, জিয়াশুন এবং টি টনি ক্যা C "বৃহত্তর স্কেল একাধিক তুলনাতে নাল এবং এফেক্টের অনুপাতের অনুমান।" আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের জার্নাল ১০২, নং। 478 (1 জুন, 2007): 495–506। ডোই: 10.1198 / 016214507000000167।

[]] ক্লেসেন, মার্ক, জেসি ডেভিস, ফ্র্যাঙ্ক ডি স্মেট এবং বার্ট ডি মুর। "শুধুমাত্র ধনাত্মক এবং লেবেলযুক্ত ডেটা ব্যবহার করে বাইনারি শ্রেণিবদ্ধের মূল্যায়ন।" আরএক্সিভ: 1504.06837 [সিএস, স্ট্যাটাস], 26 এপ্রিল, 2015. http://arxiv.org/abs/1504.06837


1
+1 টি যদিও অনুচ্ছেদ থেকে আমার মূল পয়েন্ট যে বি এইচ পদ্ধতি আসলে ছিল না (রক্ষণশীল একটি বিট যদিও) রুজভেল্টের আনুমানিক হিসাব একটি উপায় সুপারিশ এবং আসলে না এটা অনুমান চূড়ান্ত প্রত্যাখ্যানের থ্রেশহোল্ড উতরান থেকে। রেফারেন্সের ধাপে ধাপের পদ্ধতি হিসাবে এর অ্যালগরিদমিক সংজ্ঞা [1] এটিকে অস্পষ্ট করে তোলে, তবে এফডিআর সম্পর্কে দিনের শেষে অনুমান বিএইচ পদ্ধতিটি ঠিক কী করে !! (এফরন প্রায়ই যে বিন্দু করে তোলে, কিন্তু অনুচ্ছেদ 4. দেখতে আপনার অবগতির [3] কে "দুই মধ্যে একটি সংযোগ পন্থা"।)
বায়ু

2
আপনি ঠিক বলেছেন যে [3, এক .২.৫] অনুসরণ করে, কেউ পিএইচ প্রক্রিয়াটিকে দিয়ে এফডিআর এর রক্ষণশীল প্রাক্কলন হিসাবে ব্যবহার হিসাবে দেখতে পাবে । p0=1
জনরোস

0

যখন সত্যিকারের অন্তর্নিহিত মডেলটি অজানা, আমরা এফডিআর গণনা করতে পারি না, তবে অনুমানের পরীক্ষার মাধ্যমে এফডিআর মানটি অনুমান করতে পারি । মূলত পারমিটেশন পরীক্ষার পদ্ধতিটি তার পরিবর্তনের সাথে ফলাফল পরিবর্তনশীল ভেক্টর পরিবর্তন করে একাধিকবার অনুমানের পরীক্ষা করে চলেছে। এটি নমুনার অনুমোদনের উপর ভিত্তি করেও করা যেতে পারে তবে আগেরটির মতো সাধারণ নয় not

কাগজটি এখানে এফডিআর অনুমানের জন্য স্ট্যান্ডার্ড ক্রমুয়েশন পদ্ধতি পর্যালোচনা করে এবং নতুন এফডিআর অনুমানের প্রস্তাবও দেয়। এটি আপনার প্রশ্নের সমাধান করতে সক্ষম হওয়া উচিত।


3
বিএইচের মতো সর্বাধিক প্রচলিত পদ্ধতি কোনও ক্রমশক্তি পরীক্ষা ব্যবহার করে না। এটি কি ব্যবহার করে? এছাড়াও, ক্রমাঙ্কন পরীক্ষাগুলি সাধারণত শূন্যের অধীনে একটি বিতরণ সরবরাহ করে, কোনও এফডিআর অনুমানের জন্য নাল এবং বিকল্প উভয়ের মডেলগুলির পাশাপাশি প্রতিটিগুলির অন্তর্নিহিত আপেক্ষিক অনুপাতের প্রয়োজন হয় না?
user4733

প্রথমত, বিএইচ পদ্ধতিটি প্রদত্ত স্তরের এ এফডিআর নিয়ন্ত্রণ করার একটি উপায় । এটি এফডিআর অনুমান করার বিষয়ে নয়। দ্বিতীয়ত, অনুমানের পরীক্ষাগুলি সমস্ত অনুমানের শূন্যের অধীনে পরিচালিত হয়। "আপনি নাল এবং বিকল্প উভয়ের মডেলগুলির পাশাপাশি প্রতিটিটির অন্তর্নিহিত আপেক্ষিক অনুপাত" বলতে কী বোঝাতে চাইছেন তা আমি নিশ্চিত নই। কিন্তু আপনি যখন আপনার অনুমান সেট আপ করেন, আপনার ইতিমধ্যে আপনার নাল এবং বিকল্প জোড়া রয়েছে। এটা কোনো কিছু হলো? q
অ্যারন জেং
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.