দুর্দান্ত প্রশ্ন! আসুন আমরা পিছনে ফিরে আসি এবং বুঝি যে বনফেরোনি কী করেছিল এবং কেন বেনজামিনী এবং হচবার্গের জন্য বিকল্পটি বিকাশ করা প্রয়োজন হয়েছিল।
একাধিক পরীক্ষার সংশোধন নামে একটি পদ্ধতি সম্পাদন করা সাম্প্রতিক বছরগুলিতে এটি প্রয়োজনীয় এবং বাধ্যতামূলক হয়ে পড়েছে। এটি উচ্চ জমিদারি বিজ্ঞানের সাথে একসাথে সঞ্চালিত ক্রমবর্ধমান পরীক্ষার কারণে, বিশেষত পুরো জিনোম অ্যাসোসিয়েশন স্টাডিজ (জিডাব্লুএএস) এর আবির্ভাবের সাথে জেনেটিক্সে। জেনেটিক্সের বিষয়ে আমার উল্লেখটি ক্ষমা করুন, কারণ এটি আমার কাজের ক্ষেত্র। আমরা একযোগে 1,000,000 পরীক্ষার প্রক্রিয়া চালানো হলে , আমরা আশা 50 , 000 মিথ্যা positives। এটি হাস্যকরভাবে বৃহত, এবং এইভাবে আমাদের সেই স্তরটি নিয়ন্ত্রণ করতে হবে যেখানে তাত্পর্যটি মূল্যায়ন করা হয়। বোনফেরনির সংশোধন, এটি স্বীকৃতি প্রান্তিক ( 0.05 / এম ) স্বাধীন পরীক্ষার সংখ্যার ( 0.05 / এম ) দ্বারা ভাগ করেP=0.0550,000 পরিবারগত ত্রুটি হার ( এফ ডাব্লু ই আর ) এর সংশোধন করে।(0.05/M)FWER
এটি সত্য কারণ FWER F W E R = 1 - ( 1 - T W E R ) M এর সমীকরণের মাধ্যমে পরীক্ষা-ভিত্তিক ত্রুটি হারের ( ) সম্পর্কিত । অর্থাৎ, 100 শতাংশ মাইনাস 1 পরীক্ষার ভিত্তিতে ত্রুটি হারকে বিয়োগ করে যাচাই করা স্বতন্ত্র পরীক্ষার সংখ্যার শক্তি বাড়িয়ে তোলে। অনুমান করা যে ( 1 - 0.05 ) 1 / এম = 1 - 0.05TWERFWER=1−(1−TWER)M দেয়টিডব্লিউইআর≈0.05(1−0.05)1/M=1−0.05M , যা এম সম্পূর্ণরূপে স্বতন্ত্র পরীক্ষাগুলির জন্য স্বীকৃতি পি মান।TWER≈0.05M
বেঞ্জামিনী এবং হচবার্গের মতো আমরা এখন যে সমস্যার মুখোমুখি হয়েছি তা হ'ল সমস্ত পরীক্ষা সম্পূর্ণ স্বতন্ত্র নয়। সুতরাং, Bonferroni সংশোধন, যদিও মজবুত এবং নমনীয়, একটি overcorrection হয় । জেনেটিক্সের ক্ষেত্রে বিবেচনা করুন যেখানে লিঙ্কেজ ডিসইকিলিব্রিয়াম নামে একটি ক্ষেত্রে দুটি জিন যুক্ত হয়; তা হল, যখন একটি জিনের রূপান্তর হয়, অন্য আরেকটি প্রকাশ হওয়ার সম্ভাবনা বেশি থাকে। এগুলি স্পষ্টতই স্বাধীন পরীক্ষা নয়, যদিও বোনেরফেরনি সংশোধনে তারা ধরে নেওয়া হয় । এখানেই আমরা দেখতে শুরু করেছি যে এম দ্বারা পি মানকে ভাগ করে নেওয়া এমন একটি প্রান্তিকতা তৈরি করছে যা কৃত্রিমভাবে স্বল্প স্বতন্ত্র পরীক্ষাগুলির কারণে একে অপরকে প্রভাবিত করে, যা এমন একটি এম তৈরি করে যা আমাদের বাস্তব পরিস্থিতির জন্য খুব বড়, যেখানে জিনিসগুলি বিস্তৃত হয় না স্বতন্ত্র।
বেনজামিনী এবং হচবার্গের প্রস্তাবিত পদ্ধতি এবং ইয়েকুটিয়ালি (এবং আরও অনেক) দ্বারা বর্ধিত পদ্ধতি বোনেরফেরোনির চেয়ে বেশি উদারপন্থী এবং বাস্তবে বোনিফেরনি সংশোধন এখন কেবলমাত্র সবচেয়ে বড় গবেষণায় ব্যবহৃত হয়। কারণ, এফডিআর-তে, আমরা পরীক্ষাগুলির অংশের উপর কিছুটা নির্ভরশীলতা অনুমান করি এবং এইভাবে একটি এম যা খুব বড় এবং অবাস্তব এবং ফলাফলগুলি থেকে মুক্তি পাওয়া যায় যা আমরা বাস্তবে যত্ন করি। সুতরাং স্বতন্ত্র নয় এমন 1000 টি পরীক্ষার ক্ষেত্রে সত্যিকারের এম 1000 হবে না, তবে নির্ভরতার কারণে কিছু ছোট smaller সুতরাং আমরা যখন 0.05 কে 1000 দ্বারা ভাগ করি তখন প্রান্তিকতা খুব কঠোর হয় এবং আগ্রহী হতে পারে এমন কিছু পরীক্ষা এড়ানো হয়।
আপনি যদি নির্ভরতা জন্য নিয়ন্ত্রণের পিছনে যান্ত্রিকগুলি সম্পর্কে যত্নবান হন তবে আমি নিশ্চিত নই, আপনি যদি না করেন তবে আমি আপনার রেফারেন্সের জন্য ইয়েকুটিয়ালি কাগজটি লিঙ্ক করেছি। আমি আপনার তথ্য এবং কৌতূহলের জন্য আরও কয়েকটি জিনিস সংযুক্ত করব।
আশা করি এটি কোনও উপায়ে সহায়তা করেছে, আমি যদি কিছু ভুল উপস্থাপন করি তবে দয়া করে আমাকে জানান।
~ ~ ~
তথ্যসূত্র
ইতিবাচক নির্ভরতার বিষয়ে ইয়েকুটিয়ালি কাগজ - http://www.math.tau.ac.il/~ybenja/MyPapers/benjamini_yekutieli_ANNSTAT2001.pdf
(দেখুন 1.3 - সমস্যা।)
বনফেরোনি এবং আগ্রহের অন্যান্য বিষয়গুলির ব্যাখ্যা - প্রকৃতি জিনেটিক্স পর্যালোচনা। বৃহত আকারের জেনেটিক স্টাডিতে পরিসংখ্যান শক্তি এবং তাত্পর্য পরীক্ষা - পাক সি শাম এবং শন এম পুরসেল
(বাক্স ৩ দেখুন)
http://en.wikipedia.org/wiki/Familywise_error_rate
সম্পাদনা করুন:
আমার আগের উত্তরে আমি ইতিবাচক নির্ভরতা সরাসরি সংজ্ঞায়িত করি নি, যা ছিল তাই বলা হয়েছিল। ইয়েকুটিেলি কাগজে বিভাগটি 2.2
পজিটিভ নির্ভরতা শিরোনামযুক্ত এবং আমি এটির বিশদ বিবরণ হিসাবে এটি প্রস্তাব করি। যাইহোক, আমি বিশ্বাস করি যে আমরা এটিকে আরও কিছুটা সংহত করতে পারি।
প্রথমে কাগজটি ইতিবাচক নির্ভরশীলতার বিষয়ে কথা বলে শুরু হয়, এটি অস্পষ্ট শব্দ হিসাবে ব্যবহার করে যা ব্যাখ্যাযোগ্য তবে নির্দিষ্ট নয়। আপনি প্রমাণাদি পড়া হলে, জিনিস যে ইতিবাচক নির্ভরতা যেমন উল্লেখ করা হয় PRSD ডেকে বললেন, "একটি উপসেট থেকে প্রতিটি এক ইতিবাচক রিগ্রেশন বশ্যতা আগে হিসাবে সংজ্ঞায়িত করা হয় "। I 0 হল পরীক্ষার উপসেট যা সঠিকভাবে নাল অনুমান (0) সমর্থন করে। পিআরডিএস এর পরে নিম্নলিখিত হিসাবে সংজ্ঞায়িত করা হয়।I0I0
হ'ল আমাদের পরীক্ষার পরিসংখ্যানগুলির পুরো সেট, এবং আমি 0 আমাদের পরীক্ষার পরিসংখ্যানগুলির সেট যা সঠিকভাবে শূন্যকে সমর্থন করে। সুতরাং, জন্য এক্স উপর PRDS (ইতিবাচক নির্ভরশীল) হতে আমি 0 , সম্ভাবনা এক্স এর একটি উপাদান হচ্ছে আমি 0 (NULLs) পরীক্ষা পরিসংখ্যান অ কমে সেট বৃদ্ধির এক্স (উপাদান এক্স )।XI0XI0XI0xX
এর ব্যাখ্যা হিসাবে, আমরা যখন আমাদের মূল্যগুলি সর্বনিম্ন থেকে সর্বোচ্চে অর্ডার করি , পরীক্ষার পরিসংখ্যানের নাল সেটের অংশ হওয়ার সম্ভাবনা সবচেয়ে কম পি মানের চেয়ে কম হয় এবং সেখান থেকে বৃদ্ধি পায়। এফডিআর পরীক্ষার পরিসংখ্যানগুলির এই তালিকার একটি সীমানা নির্ধারণ করে যে নাল সেটের অংশ হওয়ার সম্ভাবনা 0.05। এফডিআর নিয়ন্ত্রণ করার সময় আমরা এটিই করছি।P
সংক্ষেপে, ধনাত্মক নির্ভরতার সম্পত্তি হ'ল সত্য নাল পরীক্ষার পরিসংখ্যানের সেটের উপরে আমাদের সম্পূর্ণ পরিসংখ্যানের পরিসংখ্যানের ধনাত্মক রিগ্রেশন নির্ভরতার সম্পত্তি, এবং আমরা 0.05 এর একটি এফডিআরের জন্য নিয়ন্ত্রণ করি; এইভাবে পি মানগুলি নীচে থেকে যায় (ধাপে ধাপের পদ্ধতি), এগুলি নাল সেটটির অংশ হওয়ার সম্ভাবনা বাড়ায়।
কোভেরিয়েন্স ম্যাট্রিক্স সম্পর্কে মন্তব্যগুলিতে আমার পূর্ববর্তী উত্তরটি ভুল ছিল না, কিছুটা অস্পষ্ট। আমি আশা করি এটি আরও কিছুটা সাহায্য করবে।