উত্তর:
আমি মনে করি এটি সত্যিই একটি ভাল প্রশ্ন; অনেক লোক বেনজামিনী-হচবার্গ প্রক্রিয়া (সংক্ষেপে বিএইচ; সম্ভবত এফডিআর নিয়ন্ত্রণের জন্য সর্বাধিক জনপ্রিয় পদ্ধতি) একটি কালো বাক্স হিসাবে ব্যবহার করে। প্রকৃতপক্ষে এখানে একটি অন্তর্নিহিত ধারণা আছে যা এটি পরিসংখ্যানগুলিতে তৈরি করে এবং এটি পি-ভ্যালুগুলির সংজ্ঞায় খুব ভালভাবে লুকিয়ে আছে!
সু-সংজ্ঞায়িত পি-মান এটি হ'ল অনুমানের অধীনে সমানভাবে বিতরণ করা হয় ( )। কখনও কখনও এটি এমনকি হতে পারে যে , অর্থাত্ ইউনিফর্মের চেয়ে স্টোকাসটিক্যালি ছোট, তবে এটি কেবল পদ্ধতিগুলি আরও রক্ষণশীল করে তোলে (এবং তাই এখনও বৈধ)। সুতরাং, আপনার পি-মানগুলি গণনা করে টি-টেস্ট বা আপনার পছন্দের কোনও পরীক্ষা ব্যবহার করে আপনি নাল অনুমানের অধীনে বিতরণ সম্পর্কিত তথ্য সরবরাহ করছেন।
তবে এখানে লক্ষ্য করুন যে আমি নাল অনুমানের বিষয়ে কথা বলেছি; সুতরাং আপনি সত্য ধনাত্মকগুলির মূল হার সম্পর্কে জ্ঞানের বিষয়ে যা উল্লেখ করেছেন তা প্রয়োজন হয় না , আপনার কেবলমাত্র মিথ্যা ধনাত্মকগুলির ভিত্তির হার সম্পর্কে জ্ঞান প্রয়োজন! কেন?
আসুন সব প্রত্যাখ্যাত (ধনাত্মক) অনুমানের এবং সংখ্যা বোঝাতে মিথ্যা positives, তারপর:
সুতরাং এফডিআর অনুমান করার জন্য আপনার কাছে , অনুমান করার একটি উপায় প্রয়োজন । আমরা এখন সিদ্ধান্ত নিয়ম যা সব P-মান প্রত্যাখ্যান তাকান হবে । স্বরলিপিটিতে এটি পরিষ্কার করার জন্য আমি এ জাতীয় পদ্ধতির সম্পর্কিত পরিমাণ / এলোমেলো ভেরিয়েবলের জন্য ও লিখব ।
যেহেতু কেবলমাত্র মোট প্রত্যাখ্যানের প্রত্যাশা, তাই আপনি যে পরিমাণ প্রত্যাখ্যান করেছেন তা নিরপেক্ষভাবে অনুমান করতে পারেন, সুতরাং , অর্থাত্ আপনার পি-মানগুলির কতগুলি গণনা করে ।
এখন সম্পর্কে কী ? মনে করুন আপনার মোট অনুমানের হ'ল নাল হাইপোথিসেস, তারপরে নীচে পি-ভ্যালুগুলির (বা উপ-অভিন্নতা) দ্বারা:
তবে আমরা এখনও জানি না , তবে আমরা জানি যে , সুতরাং একটি রক্ষণশীল উপরের । সুতরাং, যেহেতু আমাদের কেবল মিথ্যা ধনাত্মক সংখ্যার উপর একটি উপরের আবদ্ধ প্রয়োজন, এটি যথেষ্ট যে আমরা তাদের বিতরণটি জানি! এবং বিএইচ প্রক্রিয়া ঠিক এটি করে।
সুতরাং, যদিও আড়ং জেং এর মন্তব্য যে "বিএইচ পদ্ধতিটি প্রদত্ত স্তরের প্রশ্নে এফডিআর নিয়ন্ত্রণ করার একটি উপায় is এটি এফডিআর অনুমান করার বিষয়ে নয়" এটি মিথ্যা নয়, এটি অত্যন্ত বিভ্রান্তিকরও! বি এইচ পদ্ধতি আসলে আছে প্রতিটি দেওয়া থ্রেশহোল্ড জন্য রুজভেল্টের অনুমান । এবং তারপরে এটি সর্বাধিক প্রান্তিক প্রান্তটি বেছে নেয়, যেমন আনুমানিক এফডিআর pha নীচে । প্রকৃতপক্ষে "স্থায়ী P-মান" হাইপোথিসিস এর মূলত থ্রেশহোল্ড এ রুজভেল্টের মাত্র একটি অনুমান (isotonization পর্যন্ত)। আমি মনে করি প্রমিত বিএইচ অ্যালগরিদম এই বাস্তবতাটি কিছুটা আড়াল করে, তবে এই দুটি পদ্ধতির সমতুল্যতা দেখানো সহজ (একাধিক পরীক্ষামূলক সাহিত্যে "সমতুল্য উপপাদ্য" নামেও পরিচিত)।
চূড়ান্ত মন্তব্য হিসাবে, স্টোরির প্রক্রিয়া সম্পর্কিত এমন কিছু পদ্ধতি রয়েছে যা এমনকি ডেটা থেকে অনুমান করে; এটি সামান্য বিট দ্বারা শক্তি বৃদ্ধি করতে পারে। এছাড়াও নীতিগতভাবে আপনি ঠিক বলেছেন, আরও শক্তিশালী পদ্ধতিগুলি পেতে বিকল্পের (আপনার সত্য পজিটিভ বেস রেট) অধীনে বিতরণও মডেল করা যেতে পারে; তবে এখনও পর্যন্ত একাধিক পরীক্ষামূলক গবেষণা প্রধানত ক্ষমতা সর্বাধিকের পরিবর্তে টাইপ -1 ত্রুটির নিয়ন্ত্রণ বজায় রাখার দিকে মনোনিবেশ করেছে। একটি অসুবিধাটি হ'ল অনেক ক্ষেত্রে আপনার প্রতিটি প্রকৃত বিকল্পের আলাদা বিকল্প বিতরণ হবে (উদাহরণস্বরূপ বিভিন্ন অনুমানের জন্য আলাদা শক্তি), যখন নালীর নীচে সমস্ত পি-মানগুলির একই বন্টন থাকে। এটি সত্যিকারের ইতিবাচক হারের মডেলিংকে আরও কঠিন করে তোলে।
@ মায়ার পরামর্শ অনুসারে, বেঞ্জামিন-হচবার্গ (বিএইচ) পদ্ধতি এফডিআর নিয়ন্ত্রণের নিশ্চয়তা দেয়। এটির অনুমান করার লক্ষ্য নেই। এটির জন্য পরীক্ষার পরিসংখ্যানগুলির মধ্যে কেবল দুর্বল নির্ভরতা অনুমিতি প্রয়োজন। [1,2]
এফডিআর অনুমান করার লক্ষ্যে যে পদ্ধতিগুলি [উদাহরণস্বরূপ ৩,৪,৫] জেনারেটর প্রক্রিয়াটি অনুমান করতে পারে তার জন্য কিছু অনুমানের প্রয়োজন হয়। তারা সাধারণত ধরে নেয় পরীক্ষার পরিসংখ্যানগুলি স্বাধীন। তারা পরীক্ষার পরিসংখ্যানের নাল বিতরণেও কিছু গ্রহণ করবে। এই নাল বিতরণ থেকে প্রস্থানগুলি, একসাথে স্বাধীনতা অনুমানের সাথে, এইভাবে প্রভাবগুলিতে দায়ী করা যেতে পারে এবং এফডিআর অনুমান করা যেতে পারে।
নোট করুন যে এই ধারণাগুলি আধা-তত্ত্বাবধানে অভিনবত্ব সনাক্তকরণের সাহিত্যে পুনরায় প্রদর্শিত হবে। [6]।
[1] বেনজামিনী, ওয়াই, এবং ওয়াই হচবার্গ। "মিথ্যা আবিষ্কারের হার নিয়ন্ত্রণ করা: একাধিক পরীক্ষার জন্য ব্যবহারিক এবং শক্তিশালী পদ্ধতি” " জার্নাল-রোয়াল স্ট্যাটাসটিকাল সোসাইটি সিরিজ বি 57 (1995): 289–289।
[2] বেনজামিনী, ওয়াই, এবং ডি ইয়েকুটিয়ালি। "নির্ভরতার অধীনে একাধিক পরীক্ষায় মিথ্যা আবিষ্কারের হারের নিয়ন্ত্রণ।" সংখ্যাবৃদ্ধির সংখ্যা 29, নং। 4 (2001): 1165–88।
[3] স্টোরি, জেডি "মিথ্যা আবিষ্কারের হারের প্রতি সরাসরি দৃষ্টিভঙ্গি"। রয়্যাল স্ট্যাটিস্টিকাল সোসাইটি সিরিজ বি 64 এর জার্নাল, নং। 3 (2002): 479–98। ডোই: 10.1111 / 1467-9868.00346।
[৪] এফ্রন, বি। "মাইক্রোয়ারে, এমিরিকাল বেইস এবং দ্বি-গ্রুপ মডেল।" পরিসংখ্যান বিজ্ঞান 23, না। 1 (2008): 1-22।
[5] জিন, জিয়াশুন এবং টি টনি ক্যা C "বৃহত্তর স্কেল একাধিক তুলনাতে নাল এবং এফেক্টের অনুপাতের অনুমান।" আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের জার্নাল ১০২, নং। 478 (1 জুন, 2007): 495–506। ডোই: 10.1198 / 016214507000000167।
[]] ক্লেসেন, মার্ক, জেসি ডেভিস, ফ্র্যাঙ্ক ডি স্মেট এবং বার্ট ডি মুর। "শুধুমাত্র ধনাত্মক এবং লেবেলযুক্ত ডেটা ব্যবহার করে বাইনারি শ্রেণিবদ্ধের মূল্যায়ন।" আরএক্সিভ: 1504.06837 [সিএস, স্ট্যাটাস], 26 এপ্রিল, 2015. http://arxiv.org/abs/1504.06837 ।
যখন সত্যিকারের অন্তর্নিহিত মডেলটি অজানা, আমরা এফডিআর গণনা করতে পারি না, তবে অনুমানের পরীক্ষার মাধ্যমে এফডিআর মানটি অনুমান করতে পারি । মূলত পারমিটেশন পরীক্ষার পদ্ধতিটি তার পরিবর্তনের সাথে ফলাফল পরিবর্তনশীল ভেক্টর পরিবর্তন করে একাধিকবার অনুমানের পরীক্ষা করে চলেছে। এটি নমুনার অনুমোদনের উপর ভিত্তি করেও করা যেতে পারে তবে আগেরটির মতো সাধারণ নয় not
কাগজটি এখানে এফডিআর অনুমানের জন্য স্ট্যান্ডার্ড ক্রমুয়েশন পদ্ধতি পর্যালোচনা করে এবং নতুন এফডিআর অনুমানের প্রস্তাবও দেয়। এটি আপনার প্রশ্নের সমাধান করতে সক্ষম হওয়া উচিত।