এফডিআর নিয়ন্ত্রণের জন্য সাধারণ পদ্ধতি ব্যবহার করার শর্ত হিসাবে "ইতিবাচক নির্ভরতা" এর অর্থ


36

বেনজামিনী এবং হচবার্গ মিথ্যা আবিষ্কারের হার (এফডিআর) নিয়ন্ত্রণের জন্য প্রথম (এবং এখনও সর্বাধিক ব্যবহৃত, আমি মনে করি) পদ্ধতিটি তৈরি করেছিলাম।

আমি পৃথক তুলনার জন্য প্রতিটি পি মানগুলির একটি গুচ্ছ দিয়ে শুরু করতে চাই এবং সিদ্ধান্ত নিতে পারি কোনটি "আবিষ্কার" বলা কম, কোন নির্দিষ্ট মান (10% বলুন) এফডিআর নিয়ন্ত্রণ করে। সাধারণ পদ্ধতির একটি অনুমান হ'ল তুলনাগুলির সেটটি হয় স্বতন্ত্র বা "ইতিবাচক নির্ভরতা" থাকে তবে পি মানগুলির একটি সেট বিশ্লেষণের প্রসঙ্গে এই বাক্যাংশটির অর্থ কী তা আমি বুঝতে পারি না।


1
আমার উত্তরে অনুগ্রহ দেওয়ার জন্য ধন্যবাদ, হার্ভে! আপনি কি বলবেন যে এটি আপনার জন্য এই সমস্যাটি সমাধান করে, বা আপনি আরও বিশদ বিবরণ খুঁজছেন? আমি লক্ষ্য করেছি যে আপনি এখনও কোনও উত্তর গ্রহণ করেন নি, সে কারণেই আমি স্পষ্ট করতে চাই। ধন্যবাদ। আপনি এখনও কি স্পষ্ট করতে চান তা স্পষ্ট করতে আপনি আপনার প্রশ্নটিতে মন্তব্য বা সম্পাদনা করতে পারেন।
অ্যামিবা বলেছেন মনিকাকে

2
@amoeba। অনুগ্রহের জন্য সময়সীমা আমার উপর ছিল এবং আপনার উত্তরটি সর্বোত্তম ছিল। সত্যি বলতে গেলে, এই মুহূর্তে আমার কাছে এমনটা কখনই ঘটে নি যে অনুদান দেওয়াও উত্তরটি গ্রহণ করে না। তবে আমি জানি এগুলি স্বতন্ত্র (আমি জেট ল্যাগকে দোষ দেব)। তবে একটি সম্পূর্ণ উত্তরে সত্যিকারের বাস্তব উদাহরণ অন্তর্ভুক্ত করতে হবে যেখানে পি মান দুটি সেট করে এবং ইতিবাচক নির্ভরতা হয় না। আমি এক সপ্তাহের জন্য একটি উত্তর গ্রহণ বন্ধ করে রাখব এই আশায় যে কেউ উভয় ধরণের উদাহরণ দিতে পারে, তাই এর অর্থটি পরিষ্কার।
হার্ভি মোটুলস্কি

এটি সম্ভবত সত্যই সন্তোষজনক উদাহরণ নয়, তবে আমরা যদি পারস্পরিক সম্পর্কযুক্ত ভেরিয়েবলের উপর এক-লেজযুক্ত পরীক্ষা করার বিষয়ে চিন্তা করি তবে ইতিবাচক পজিটিভ এবং ইতিবাচক নির্ভরতা ছাড়াই সহজেই আসা সম্ভব। কল্পনা করুন যে আমি A = 0 কিনা এবং এক-লেজযুক্ত বিকল্পের (এ> 0 এবং বি> 0) বি = 0 কিনা তা পরীক্ষা করছি। আরও কল্পনা করুন যে বি এ এর ​​উপর নির্ভর করে উদাহরণস্বরূপ, কল্পনা করুন আমি জানতে চাই যে কোনও জনসংখ্যার তুলনায় পুরুষের চেয়ে বেশি মহিলা রয়েছে এবং জনসংখ্যায় টেস্টের চেয়ে আরও ডিম্বাশয় রয়েছে কি না। স্পষ্টভাবে প্রথম প্রশ্নের পি-মান জানার পরে দ্বিতীয়টির জন্য আমাদের পি-মানটির প্রত্যাশা বদলে যায়
জ্যাকব সোকারার

ধন্যবাদ, হার্ভে আমি আশা করি এটি স্পষ্ট ছিল যে আমি আপনাকে আমার উত্তর (!!) স্বীকার করার জন্য চাপ দিচ্ছিলাম না বরং এই থ্রেডে আপনি কী ধরণের উত্তর সন্ধান করছেন এবং আপনি এখনও স্পষ্ট করে বলতে চাইবেন তা স্পষ্ট করে বলার জন্য নয়। আমি আসলে এই বিষয়টিতে বিশেষজ্ঞ নই, কেবল এটি বোঝার চেষ্টা করছি।
অ্যামিবা বলেছেন মিনিকার

উভয় পি-মান একই দিকে পরিবর্তিত হয় এবং এটি PRD। তবে আমি পরিবর্তে দ্বিতীয় অনুমানটি পরীক্ষা করে দেখি যে জনসংখ্যা 2 ডিম্বাশয়ের তুলনায় আরও বেশি টেস্টিস রয়েছে, দ্বিতীয় পি-মানটির জন্য আমাদের প্রত্যাশা প্রথম পি-মান বাড়ার সাথে সাথে হ্রাস পায়। এটি পিআরডি নয়।
জ্যাকব সোকারার

উত্তর:


20

আপনার প্রশ্ন থেকে এবং বিশেষ করে আপনার উত্তরগুলি থেকে অন্য উত্তরগুলিতে, আমার কাছে মনে হয় আপনি মূলত এখানে "বড় চিত্র" সম্পর্কে বিভ্রান্ত রয়েছেন : যথা, "ইতিবাচক নির্ভরতা" প্রসঙ্গে কী বোঝায় - কি বিরোধিতা করে? পিআরডিএস শর্তের প্রযুক্তিগত অর্থ। তাই আমি বড় ছবি সম্পর্কে কথা বলতে হবে।

বড় ছবি

কল্পনা করুন যে আপনি নাল হাইপোথেসিস পরীক্ষা করছেন, এবং কল্পনা করুন যে সেগুলি সমস্ত সত্য। প্রতিটি ভ্যালু এলোমেলো পরিবর্তনশীল; বারবার পুনরুক্তি করা পরীক্ষার মাধ্যমে প্রতিবার আলাদা ডিফারনেট ভ্যালু পাওয়া যায়, তাই ভ্যালুগুলির বিতরণ (নালীর নীচে) সম্পর্কে কথা বলতে পারেন । এটি সুপরিচিত যে কোনও পরীক্ষার জন্য নালীর নীচে মূল্যগুলির বিতরণ অবশ্যই অভিন্ন হতে হবে; সুতরাং মাল্টিপ্লিট টেস্টিংয়ের ক্ষেত্রে, ভ্যালুগুলির সমস্ত প্রান্তিক বিতরণ অভিন্ন হবে।এন পি পি পি পি এন পিNN ppppNp

সমস্ত ডেটা এবং সমস্ত পরীক্ষা যদি একে অপরের থেকে স্বতন্ত্র থাকে, তবে মূল্যগুলির যৌথ মাত্রিক বন্টনও অভিন্ন হবে। এটি সত্য হবে উদাহরণস্বরূপ একটি ক্লাসিক "জেলি-বিন" পরিস্থিতিতে যখন একগুচ্ছ স্বাধীন জিনিস পরীক্ষা করা হয়:এন পিNNp

সবুজ জেলি মটরশুটি

তবে এটির মতো হওয়ার দরকার নেই। মূল্যগুলির যেকোন জুটি নীতিগতভাবে ইতিবাচক বা নেতিবাচকভাবে সম্পর্কিত হতে পারে, বা আরও জটিল উপায়ে নির্ভর হতে পারে। চারটি গ্রুপের মধ্যে সমস্ত জুটিযুক্ত পার্থক্য পরীক্ষা করার কথা বিবেচনা করুন; এটি পরীক্ষা। ছয়টি ভ্যালুগুলির প্রতিটিই একত্রে বিতরণ করা হয়। তবে এগুলি সমস্ত ইতিবাচকভাবে সম্পর্কিত: যদি (প্রদত্ত প্রয়াসে) গোষ্ঠী A যদি বিশেষত নিম্নতর হয়, তবে এ-বনাম-বি তুলনা কম ভ্যালু অর্জন করতে পারে (এটি মিথ্যা ইতিবাচক হবে)। তবে এই পরিস্থিতিতে সম্ভবত এ-বনাম-সি, পাশাপাশি-এ-বনাম- ডিও কম ভ্যালু অর্জন করবে। সুতরাংএন = 4 3 / 2 = 6 পি পি পি পিpN=43/2=6ppppমূল্যগুলি স্পষ্টতই স্বতন্ত্র এবং এগুলি একে অপরের মধ্যে ইতিবাচকভাবে সম্পর্কযুক্ত।

এটি, অনানুষ্ঠানিকভাবে, "ইতিবাচক নির্ভরতা" বলতে কী বোঝায়।

একাধিক পরীক্ষার ক্ষেত্রে এটি সাধারণ পরিস্থিতি বলে মনে হচ্ছে। আরেকটি উদাহরণ হ'ল বিভিন্ন ভেরিয়েবলের পার্থক্যের জন্য পরীক্ষা করা যা একে অপরের মধ্যে পারস্পরিক সম্পর্কযুক্ত। এর মধ্যে একটির মধ্যে উল্লেখযোগ্য পার্থক্য পাওয়া অন্য একটিতে উল্লেখযোগ্য পার্থক্য পাওয়ার সম্ভাবনা বাড়িয়ে তোলে।

এটি একটি প্রাকৃতিক উদাহরণ নিয়ে আসা কঠিন যেখানে মূল্যগুলি "নেতিবাচকভাবে নির্ভর" হবে " @ ব্যবহারকারী 43849 উপরের মন্তব্যে মন্তব্য করেছেন যে একতরফা পরীক্ষার জন্য এটি সহজ:p

কল্পনা করুন যে আমি A = 0 কিনা এবং এক-লেজযুক্ত বিকল্পের (এ> 0 এবং বি> 0) বি = 0 কিনা তা পরীক্ষা করছি। আরও কল্পনা করুন যে বি এ এর ​​উপর নির্ভর করে উদাহরণস্বরূপ, কল্পনা করুন আমি জানতে চাই যে কোনও জনসংখ্যার তুলনায় পুরুষের তুলনায় আরও বেশি মহিলা রয়েছে এবং জনসংখ্যায় টেস্টের চেয়ে আরও ডিম্বাশয় রয়েছে কি না। স্পষ্টভাবে প্রথম প্রশ্নের পি-মান জানার পরে দ্বিতীয়টির জন্য আমাদের পি-মানটির প্রত্যাশা পরিবর্তন হয়। উভয় পি-মান একই দিকে পরিবর্তিত হয় এবং এটি PRD। তবে আমি পরিবর্তে দ্বিতীয় অনুমানটি পরীক্ষা করে দেখি যে জনসংখ্যা 2 ডিম্বাশয়ের তুলনায় আরও বেশি টেস্টিস রয়েছে, দ্বিতীয় পি-মানটির জন্য আমাদের প্রত্যাশা প্রথম পি-মান বাড়ার সাথে সাথে হ্রাস পায়। এটি পিআরডি নয়।

তবে আমি এখনও পর্যন্ত পয়েন্ট নাল দিয়ে একটি প্রাকৃতিক উদাহরণ নিয়ে আসতে পারিনি।


এখন, "ইতিবাচক নির্ভরতা" এর সঠিক গাণিতিক সূত্র যা বেঞ্জামিন-হচবার্গ পদ্ধতির বৈধতার গ্যারান্টি দেয় এটি বরং জটিল। অন্যান্য উত্তরে যেমন উল্লেখ করা হয়েছে, মূল রেফারেন্স হ'ল বেনজামিনী এবং ইয়েকুটিয়েল ২০০১ ; তারা দেখায় যে পিআরডিএস সম্পত্তি ("একটি উপসেট থেকে প্রত্যেকের উপর ইতিবাচক রিগ্রেশন নির্ভরতা") বেঞ্জামিন-হচবার্গ পদ্ধতিতে অন্তর্ভুক্ত। এটি পিআরডি ("ইতিবাচক রিগ্রেশন নির্ভরতা") সম্পত্তির একটি শিথিল রূপ, যার অর্থ পিআরডি পিআরডিএসকে বোঝায় এবং তাই বেনজামিনী-হচবার্গ পদ্ধতিতে অন্তর্ভুক্ত।

পিআরডি / পিআরডিএসের সংজ্ঞাগুলির জন্য @ ব্যবহারকারী 43849 এর উত্তর (+1) এবং বেনজামিনী এবং ইয়েকুটিয়ালি কাগজটি দেখুন। সংজ্ঞাগুলি বরং প্রযুক্তিগত এবং সেগুলি সম্পর্কে আমার কাছে ভাল জ্ঞান নেই। প্রকৃতপক্ষে, বি ও ওয়াই আরও কয়েকটি অন্যান্য সম্পর্কিত ধারণাগুলির উল্লেখ করেছেন: অর্ডার টু (এমটিপি 2) এবং পজিটিভ অ্যাসোসিয়েশনের মাল্টিভিয়ারিয়েট মোট পজিটিভিটি। বি অ্যান্ড ওয়াইয়ের মতে, এগুলি নিম্নলিখিত হিসাবে সম্পর্কিত (চিত্রটি আমার):

পিআরডি, পিআরডিএস, এমটিপি 2, এবং পিএ

এমটিপি 2 পিআরডি প্রয়োগ করে যা পিআরডিএসকে বোঝায় যা বিএইচ পদ্ধতির নির্ভুলতার গ্যারান্টি দেয়। PRD এছাড়াও পিএ কিন্তু পিএ বোঝা PRDS।


নেতিবাচক নির্ভরতা একটি উদাহরণ হতে চান পোস্টে হক pairwise পরীক্ষার নিম্নলিখিত, বলো, তিন দল, এর ANOVA oneway যেখানে , কিন্তু ˉ এক্স বি < μ বি , যখন ˉ এক্স একজনμ একজন , এবং ˉ এক্স সিμ সি , তাই যখন পি একটি  বনাম  বি হল কম সম্ভবত প্রত্যাখ্যান করার (কারণ অধীনেμA<μB<μCx¯B<μBx¯AμAx¯CμCpA vs. B | ˉ x - ˉ x বি | < | ˉ x বি - ˉ x সি | পি বি  বনাম  সিH0 |x¯Ax¯B|<|x¯Bx¯C|), কিন্তু নির্ভরতা কারণে হয় আরো প্রত্যাখ্যান করার সম্ভাবনা বেশি? pB vs. C
অ্যালেক্সিস

1
@ অ্যালেক্সিস আমি নিজেই এই লাইনগুলি নিয়ে ভাবছিলাম, তবে আমি মনে করি এটি কাজ করে না কারণ নালীর নীচে কী ঘটেছিল তা আমাদের বিবেচনা করা দরকার । এই ক্ষেত্রে, এবং এর ফলে আপনার যুক্তিটি ভেঙে যায়। μA=μB=μC
অ্যামিবা বলছে মনিকা পুনরায়

সুতরাং, যদি নেতিবাচক নির্ভরশীল পরিস্থিতিগুলির বিষয়ে ভাবতে অসুবিধা হয়, তবে বেনজামিনী-হচবার্গ পদ্ধতি স্বাধীন গ্রুপগুলি সম্পর্কে সর্বজনীন নাল অনুমানের প্রত্যাখ্যানের পরে পোস্ট হকের জুড়ির মতো পরীক্ষার মতো পরিস্থিতিতে বৈধ is (উদাহরণস্বরূপ এএনওওএ অবরুদ্ধ নয়, কোচরানের কিউ, ক্রুসকল- ওয়ালিস ইত্যাদি)?
অ্যালেক্সিস

@ অ্যালেক্সিস আমি বিশ্বাস করি এটি সঠিক, হ্যাঁ। আমি এখনও নেতিবাচক নির্ভরতার সাথে একটি প্রাকৃতিক উদাহরণ নিয়ে আসার চেষ্টা করছি ...
অ্যামিবা

দুর্দান্ত! তুমি যাও, মেয়ে! :) ("মেয়ে" শব্দের লিঙ্গমুক্ত অর্থের জন্য))।
অ্যালেক্সিস

18

দুর্দান্ত প্রশ্ন! আসুন আমরা পিছনে ফিরে আসি এবং বুঝি যে বনফেরোনি কী করেছিল এবং কেন বেনজামিনী এবং হচবার্গের জন্য বিকল্পটি বিকাশ করা প্রয়োজন হয়েছিল।

একাধিক পরীক্ষার সংশোধন নামে একটি পদ্ধতি সম্পাদন করা সাম্প্রতিক বছরগুলিতে এটি প্রয়োজনীয় এবং বাধ্যতামূলক হয়ে পড়েছে। এটি উচ্চ জমিদারি বিজ্ঞানের সাথে একসাথে সঞ্চালিত ক্রমবর্ধমান পরীক্ষার কারণে, বিশেষত পুরো জিনোম অ্যাসোসিয়েশন স্টাডিজ (জিডাব্লুএএস) এর আবির্ভাবের সাথে জেনেটিক্সে। জেনেটিক্সের বিষয়ে আমার উল্লেখটি ক্ষমা করুন, কারণ এটি আমার কাজের ক্ষেত্র। আমরা একযোগে 1,000,000 পরীক্ষার প্রক্রিয়া চালানো হলে , আমরা আশা 50 , 000 মিথ্যা positives। এটি হাস্যকরভাবে বৃহত, এবং এইভাবে আমাদের সেই স্তরটি নিয়ন্ত্রণ করতে হবে যেখানে তাত্পর্যটি মূল্যায়ন করা হয়। বোনফেরনির সংশোধন, এটি স্বীকৃতি প্রান্তিক ( 0.05 / এম ) স্বাধীন পরীক্ষার সংখ্যার ( 0.05 / এম ) দ্বারা ভাগ করেP=0.0550,000 পরিবারগত ত্রুটি হার ( এফ ডাব্লু আর ) এর সংশোধন করে।(0.05/M)FWER

এটি সত্য কারণ FWER F W E R = 1 - ( 1 - T W E R ) M এর সমীকরণের মাধ্যমে পরীক্ষা-ভিত্তিক ত্রুটি হারের ( ) সম্পর্কিত । অর্থাৎ, 100 শতাংশ মাইনাস 1 পরীক্ষার ভিত্তিতে ত্রুটি হারকে বিয়োগ করে যাচাই করা স্বতন্ত্র পরীক্ষার সংখ্যার শক্তি বাড়িয়ে তোলে। অনুমান করা যে ( 1 - 0.05 ) 1 / এম = 1 - 0.05TWERFWER=1(1TWER)M দেয়টিডব্লিউআর0.05(10.05)1/M=10.05M , যা এম সম্পূর্ণরূপে স্বতন্ত্র পরীক্ষাগুলির জন্য স্বীকৃতি পি মান।TWER0.05এম

বেঞ্জামিনী এবং হচবার্গের মতো আমরা এখন যে সমস্যার মুখোমুখি হয়েছি তা হ'ল সমস্ত পরীক্ষা সম্পূর্ণ স্বতন্ত্র নয়। সুতরাং, Bonferroni সংশোধন, যদিও মজবুত এবং নমনীয়, একটি overcorrection হয় । জেনেটিক্সের ক্ষেত্রে বিবেচনা করুন যেখানে লিঙ্কেজ ডিসইকিলিব্রিয়াম নামে একটি ক্ষেত্রে দুটি জিন যুক্ত হয়; তা হল, যখন একটি জিনের রূপান্তর হয়, অন্য আরেকটি প্রকাশ হওয়ার সম্ভাবনা বেশি থাকে। এগুলি স্পষ্টতই স্বাধীন পরীক্ষা নয়, যদিও বোনেরফেরনি সংশোধনে তারা ধরে নেওয়া হয় । এখানেই আমরা দেখতে শুরু করেছি যে এম দ্বারা পি মানকে ভাগ করে নেওয়া এমন একটি প্রান্তিকতা তৈরি করছে যা কৃত্রিমভাবে স্বল্প স্বতন্ত্র পরীক্ষাগুলির কারণে একে অপরকে প্রভাবিত করে, যা এমন একটি এম তৈরি করে যা আমাদের বাস্তব পরিস্থিতির জন্য খুব বড়, যেখানে জিনিসগুলি বিস্তৃত হয় না স্বতন্ত্র।

বেনজামিনী এবং হচবার্গের প্রস্তাবিত পদ্ধতি এবং ইয়েকুটিয়ালি (এবং আরও অনেক) দ্বারা বর্ধিত পদ্ধতি বোনেরফেরোনির চেয়ে বেশি উদারপন্থী এবং বাস্তবে বোনিফেরনি সংশোধন এখন কেবলমাত্র সবচেয়ে বড় গবেষণায় ব্যবহৃত হয়। কারণ, এফডিআর-তে, আমরা পরীক্ষাগুলির অংশের উপর কিছুটা নির্ভরশীলতা অনুমান করি এবং এইভাবে একটি এম যা খুব বড় এবং অবাস্তব এবং ফলাফলগুলি থেকে মুক্তি পাওয়া যায় যা আমরা বাস্তবে যত্ন করি। সুতরাং স্বতন্ত্র নয় এমন 1000 টি পরীক্ষার ক্ষেত্রে সত্যিকারের এম 1000 হবে না, তবে নির্ভরতার কারণে কিছু ছোট smaller সুতরাং আমরা যখন 0.05 কে 1000 দ্বারা ভাগ করি তখন প্রান্তিকতা খুব কঠোর হয় এবং আগ্রহী হতে পারে এমন কিছু পরীক্ষা এড়ানো হয়।

আপনি যদি নির্ভরতা জন্য নিয়ন্ত্রণের পিছনে যান্ত্রিকগুলি সম্পর্কে যত্নবান হন তবে আমি নিশ্চিত নই, আপনি যদি না করেন তবে আমি আপনার রেফারেন্সের জন্য ইয়েকুটিয়ালি কাগজটি লিঙ্ক করেছি। আমি আপনার তথ্য এবং কৌতূহলের জন্য আরও কয়েকটি জিনিস সংযুক্ত করব।

আশা করি এটি কোনও উপায়ে সহায়তা করেছে, আমি যদি কিছু ভুল উপস্থাপন করি তবে দয়া করে আমাকে জানান।

~ ~ ~

তথ্যসূত্র

ইতিবাচক নির্ভরতার বিষয়ে ইয়েকুটিয়ালি কাগজ - http://www.math.tau.ac.il/~ybenja/MyPapers/benjamini_yekutieli_ANNSTAT2001.pdf

(দেখুন 1.3 - সমস্যা।)

বনফেরোনি এবং আগ্রহের অন্যান্য বিষয়গুলির ব্যাখ্যা - প্রকৃতি জিনেটিক্স পর্যালোচনা। বৃহত আকারের জেনেটিক স্টাডিতে পরিসংখ্যান শক্তি এবং তাত্পর্য পরীক্ষা - পাক সি শাম এবং শন এম পুরসেল

(বাক্স ৩ দেখুন)

http://en.wikipedia.org/wiki/Familywise_error_rate

সম্পাদনা করুন:

আমার আগের উত্তরে আমি ইতিবাচক নির্ভরতা সরাসরি সংজ্ঞায়িত করি নি, যা ছিল তাই বলা হয়েছিল। ইয়েকুটিেলি কাগজে বিভাগটি 2.2পজিটিভ নির্ভরতা শিরোনামযুক্ত এবং আমি এটির বিশদ বিবরণ হিসাবে এটি প্রস্তাব করি। যাইহোক, আমি বিশ্বাস করি যে আমরা এটিকে আরও কিছুটা সংহত করতে পারি।

প্রথমে কাগজটি ইতিবাচক নির্ভরশীলতার বিষয়ে কথা বলে শুরু হয়, এটি অস্পষ্ট শব্দ হিসাবে ব্যবহার করে যা ব্যাখ্যাযোগ্য তবে নির্দিষ্ট নয়। আপনি প্রমাণাদি পড়া হলে, জিনিস যে ইতিবাচক নির্ভরতা যেমন উল্লেখ করা হয় PRSD ডেকে বললেন, "একটি উপসেট থেকে প্রতিটি এক ইতিবাচক রিগ্রেশন বশ্যতা আগে হিসাবে সংজ্ঞায়িত করা হয় "। I 0 হল পরীক্ষার উপসেট যা সঠিকভাবে নাল অনুমান (0) সমর্থন করে। পিআরডিএস এর পরে নিম্নলিখিত হিসাবে সংজ্ঞায়িত করা হয়।I0I0

PRDS

হ'ল আমাদের পরীক্ষার পরিসংখ্যানগুলির পুরো সেট, এবং আমি 0 আমাদের পরীক্ষার পরিসংখ্যানগুলির সেট যা সঠিকভাবে শূন্যকে সমর্থন করে। সুতরাং, জন্য এক্স উপর PRDS (ইতিবাচক নির্ভরশীল) হতে আমি 0 , সম্ভাবনা এক্স এর একটি উপাদান হচ্ছে আমি 0 (NULLs) পরীক্ষা পরিসংখ্যান অ কমে সেট বৃদ্ধির এক্স (উপাদান এক্স )।XI0XI0XI0xX

এর ব্যাখ্যা হিসাবে, আমরা যখন আমাদের মূল্যগুলি সর্বনিম্ন থেকে সর্বোচ্চে অর্ডার করি , পরীক্ষার পরিসংখ্যানের নাল সেটের অংশ হওয়ার সম্ভাবনা সবচেয়ে কম পি মানের চেয়ে কম হয় এবং সেখান থেকে বৃদ্ধি পায়। এফডিআর পরীক্ষার পরিসংখ্যানগুলির এই তালিকার একটি সীমানা নির্ধারণ করে যে নাল সেটের অংশ হওয়ার সম্ভাবনা 0.05। এফডিআর নিয়ন্ত্রণ করার সময় আমরা এটিই করছি।P

সংক্ষেপে, ধনাত্মক নির্ভরতার সম্পত্তি হ'ল সত্য নাল পরীক্ষার পরিসংখ্যানের সেটের উপরে আমাদের সম্পূর্ণ পরিসংখ্যানের পরিসংখ্যানের ধনাত্মক রিগ্রেশন নির্ভরতার সম্পত্তি, এবং আমরা 0.05 এর একটি এফডিআরের জন্য নিয়ন্ত্রণ করি; এইভাবে পি মানগুলি নীচে থেকে যায় (ধাপে ধাপের পদ্ধতি), এগুলি নাল সেটটির অংশ হওয়ার সম্ভাবনা বাড়ায়।

কোভেরিয়েন্স ম্যাট্রিক্স সম্পর্কে মন্তব্যগুলিতে আমার পূর্ববর্তী উত্তরটি ভুল ছিল না, কিছুটা অস্পষ্ট। আমি আশা করি এটি আরও কিছুটা সাহায্য করবে।


6
ধন্যবাদ। আপনি পরিবারগত ত্রুটি হারগুলি নিয়ন্ত্রণের (বনফেরোনি ইত্যাদি) বনাম এফডিআর নিয়ন্ত্রণের একটি পরিষ্কার ওভারভিউ সরবরাহ করেন তবে "ইতিবাচক নির্ভরতা" এর অর্থ কী তা আমি এখনও বুঝতে পারি না। বিবেচনা করুন যে আমার কাছে 1000 পি মান রয়েছে, যা কিছু রোগের সাথে বা তার সাথে লোকেরা তুলনা করে 1000 বিভিন্ন জিনের পরীক্ষার এক্সপ্রেশন। এই তুলনাগুলি "আবিষ্কার" কোনটি তা নির্ধারণ করার জন্য আমি বিএইচ পদ্ধতি ব্যবহার করি। এই প্রসঙ্গে "ইতিবাচক নির্ভরতা" এর অর্থ কী?
হার্ভে মোটুলস্কি

9
একটি ছোট কিন্তু গুরুত্বপূর্ণ নোট: বনফেরোনি স্বাধীনতার বিষয়ে একেবারেই কোনও অনুমান করেনি। প্রকৃতপক্ষে, এটি পারস্পরিক একচেটিয়া ক্ষেত্রে সঠিকভাবে আবরণ করবে, যা একরকমভাবে আপনি যতটা স্বাধীন পেতে পারেন তেমন দূরে। সেখানে হয় একটি সংশোধন প্রক্রিয়া (Sidak) যে স্বাধীনতা অনুমান করে এবং আরো জোরালোভাবে যে ধৃষ্টতা অধীনে FWER নিয়ন্ত্রণ করবে। এই উত্তরের অন্যান্য নতুন দিকগুলি কিছুটা হালকা স্পর্শও ব্যবহার করতে পারে।
কার্ডিনাল

2
@ ক্রিসিসি এখনও আমি বুঝতে পারি না। "উপাদানগুলির মধ্যে কোভারিয়েন্স ম্যাট্রিক্স"? আমি পি মানগুলির একটি তালিকা দিয়ে শুরু করি এবং সিদ্ধান্ত নিতে চাই যে কোনটি "এফডিআর নিয়ন্ত্রিত সহ" অনুসরণ করার জন্য যথেষ্ট "আবিষ্কার" বলা উচিত। সমবায় ম্যাট্রিক্সের উপাদানগুলি কী কী? বলুন যে প্রতিটি পি মান গ্রুপের মধ্যে একটি নির্দিষ্ট জিনের প্রকাশের সাথে তুলনা করছে এবং এরকম অনেকগুলি জিন রয়েছে। প্রতিটি জিনের জন্য, পরীক্ষায় একটি গ্রুপ পদের তুলনায় পি মান হয় value এই পরিস্থিতিতে, "উপাদানগুলি এক সাথে আলাদা হতে পারে" বা "নিজের মধ্যে ইতিবাচক সম্পর্ক" থাকার অর্থ কী?
হার্ভি মোটুলস্কি

2
@ ক্রিসিস ধন্যবাদ এটি আরও স্পষ্ট হয়ে উঠেছে, তবে এই অনুমানের অর্থ কী তা আমি এখনও বুঝতে পারি না। পদ্ধতির পিছনে অনুমান সম্পর্কে জানার পুরো বিষয়টি হ'ল আপনি কখন এটি লঙ্ঘন করছেন বলে জানতে হবে। সুতরাং এটি এমন কিছু পরিস্থিতিতে তালিকা তৈরি করতে সহায়তা করবে যেখানে অনুমানটি সত্য নয়। নাল অনুমানের মিথ্যা হওয়ার উচ্চতর সম্ভাবনার সাথে যখন কম পি মান যুক্ত হবে না তখন?
হার্ভি মোটুলস্কি

1
এটি প্রশ্নের উত্তর দেয় না।
অ্যালেক্সিস

10

আমি এই প্রিন্টটি অর্থটি বোঝার জন্য সহায়ক বলে মনে করেছি। এটা বলা উচিত যে আমি এই উত্তরটি বিষয়টির বিশেষজ্ঞ হিসাবে নয়, বরং সম্প্রদায় দ্বারা পরীক্ষা ও বৈধ হওয়ার জন্য বোঝার চেষ্টা হিসাবে প্রস্তাব করছি offer

পিআরডি এবং পিআরডিএসের মধ্যে পার্থক্য সম্পর্কে খুব সহায়ক পর্যবেক্ষণের জন্য অ্যামিবার ধন্যবাদ, মন্তব্য দেখুন

pCpC

  1. qC
  2. rqrqri<qii
  3. rC

C

pp1...pn<B1...BnpCB1...Bn

pipipip1...pnp1...pnpi

p1...pn

pnpn<BBpn<Bpn<BB

যুক্ত করতে সম্পাদিত:

এখানে এমন একটি সিস্টেমের একটি পেশামূলক উদাহরণ যা পিআরডিএস নয় (নীচে আর কোড)। যুক্তিটি হ'ল যখন নমুনাগুলি a এবং b খুব সাদৃশ্যপূর্ণ হয় তখন তাদের পণ্যটি atypical হওয়ার সম্ভাবনা বেশি থাকে। আমি সন্দেহ করি যে এই প্রভাবটি (এবং (a*b), (c*d)তুলনার জন্য নালীর নীচে পি-মানগুলির অ-অভিন্নতা নয়) পি-মানগুলির মধ্যে নেতিবাচক সম্পর্ককে চালিত করছে, তবে আমি নিশ্চিত হতে পারি না। একই প্রভাবটি যদি আমরা দ্বিতীয় তুলনা (উইলকক্সন পরিবর্তে) এর জন্য টেস্ট-টেস্ট করি তবে উপস্থিত হবে, তবে পি-ভ্যালুগুলির বিতরণ এখনও অভিন্ন নয়, সম্ভবত স্বাভাবিকতা অনুমানের লঙ্ঘনের কারণে।

ab <- rep(NA, 100000)  # We'll repeat the comparison many times to assess the relationships among p-values.
abcd <- rep(NA, 100000)

for(i in 1:100000){
  a <- rnorm(10)    # Draw 4 samples from identical populations.
  b <- rnorm(10)
  c <- rnorm(10)
  d <- rnorm(10)

  ab[i] <- t.test(a,b)$p.value          # We perform 2 comparisons and extract p-values
  abcd[i] <- wilcox.test((a*b),(c*d))$p.value
}

summary(lm(abcd ~ ab))    # The p-values are negatively correlated

ks.test(ab, punif)    # The p-values are uniform for the first test
ks.test(abcd, punif)   # but non-uniform for the second test.
hist(abcd)

আমি দুঃখিত, কিন্তু আমি সত্যিই এটি অনুসরণ করি না।
হার্ভি মোটুলস্কি

নতুন চূড়ান্ত অনুচ্ছেদ কি এটিকে পুরোপুরি পরিষ্কার করে দেয়?
জ্যাকব সোলার

@ অ্যামিবা, হ্যাঁ, আমি মনে করি আপনি ঠিক বলেছেন। পূর্ববর্তী পোস্টারগুলিতে লিখিত ইয়েকুটিয়ালি কাগজপত্রগুলি পিআরডিএসের চিকিত্সা। আমি যতদূর বলতে পারি, পিআরডি একই সম্পত্তি, তবে সমস্ত পরীক্ষার পরিসংখ্যান জুড়ে (বা পি-ভ্যালু), কেবল সত্য নলের সাথে সম্পর্কিত সাবসেট নয়।
জ্যাকব সোলার

1
হ্যাঁ, আপনি একেবারে ঠিক বলেছেন। এখন সম্পাদনা করা হচ্ছে।
জ্যাকব সোলার

1
আকর্ষণীয় উদাহরণ, তবে এর প্রভাবটি অত্যন্ত দুর্বল: আমি -0.03 এর কাছাকাছি পারস্পরিক সম্পর্ক সহগ (আব এবং অ্যাবসিডি এর মধ্যে) পাই ... তবে আমি তা পাই না: আপনি কেন বলেন যে "যখন নমুনা a এবং b খুব একই রকম হয় , এটি সম্ভবত তাদের পণ্য "কমনীয়" হবে?
অ্যামিবা

4

তাদের কাগজে , বেঞ্জামিনি এবং ইয়েকুটিয়ালি কীভাবে ইতিবাচক রিগ্রেশন নির্ভরতা (পিআরডি) কেবল ইতিবাচকভাবে যুক্ত হওয়ার চেয়ে আলাদা তার কয়েকটি উদাহরণ সরবরাহ করে provide এফডিআর নিয়ন্ত্রণ পদ্ধতি PRD এর একটি দুর্বল রূপের উপর নির্ভর করে যা তারা PRDS বলে (অর্থাত্ ভেরিয়েবলের একটি উপসেট থেকে প্রত্যেকের উপর PRD)।

ইতিবাচক নির্ভরতা লেহম্যান দ্বারা দ্বিবিভক্ত বিন্যাসে প্রস্তাবিত হয়েছিল , তবে এই ধারণার বহুবিধ সংস্করণ, যা ইতিবাচক রিগ্রেশন নির্ভরতা নামে পরিচিত এটি একাধিক পরীক্ষার সাথে প্রাসঙ্গিক।

এখানে pg.6 থেকে একটি প্রাসঙ্গিক অংশ রয়েছে

X(X1,X2)Xh(X1)X2h(X1)


2

এই ক্ষেত্রে ধনাত্মক নির্ভরতা মানে পরীক্ষার সেটটি ইতিবাচকভাবে সম্পর্কিত হয়। তারপরে ধারণাটি হ'ল যে পরীক্ষাগুলির সেটের ভেরিয়েবলগুলি যেগুলির জন্য আপনার পি-মান রয়েছে তা ইতিবাচকভাবে সম্পর্কিত হয় তবে ভেরিয়েবলগুলির প্রতিটি স্বতন্ত্র নয়

আপনি যদি কোনও Bonferroni পি-মান সংশোধন সম্পর্কে ফিরে ভাবেন, উদাহরণস্বরূপ, আপনি গ্যারান্টি দিতে পারেন যে টাইপ 1 ত্রুটি হারটি আপনার তাত্পর্যটি প্রান্তিকতা 0.1 / 100 = 0.001 এ সেট করে 100 পরিসংখ্যানগতভাবে স্বতন্ত্র পরীক্ষা বলার চেয়ে 10% এরও কম is তবে, যদি এই 100 টির প্রত্যেকটিরই কোনও না কোনওভাবে একটি সম্পর্কিত হয়? তাহলে আপনি সত্যই 100 টি পৃথক পরীক্ষা করেন নি।

এফডিআর-তে, ধারণাটি বনফেরোনি সংশোধনের চেয়ে কিছুটা আলাদা। ধারণাটি গ্যারান্টিযুক্ত হ'ল যে আপনি যে উল্লেখযোগ্য বিষয় ঘোষণা করেছেন তার মধ্যে কেবল একটি নির্দিষ্ট শতাংশ (10% বলুন) মিথ্যাভাবে তাৎপর্যপূর্ণ বলে ঘোষণা করা হয়েছে। যদি আপনার ডেটাসেটে মার্কার (ইতিবাচক নির্ভরতা) সম্পর্কিত হয় তবে এফডিআর মানটি আপনি যে পরীক্ষাগুলি সম্পাদন করেন তার মোট সংখ্যা (তবে পরিসংখ্যানগতভাবে স্বতন্ত্র পরীক্ষার প্রকৃত সংখ্যাটি আরও কম) এর উপর ভিত্তি করে বেছে নেওয়া হয়। এই উপায়ে সিদ্ধান্ত নেওয়া আরও নিরাপদ যে মিথ্যা আবিষ্কারের হারটি আপনার পি-মানগুলির সেটগুলিতে পরীক্ষাগুলির 10% বা তারও কম তাত্ক্ষণিকভাবে মিথ্যা ঘোষণা করছে।

ইতিবাচক নির্ভরতা আলোচনার জন্য দয়া করে এই বইয়ের অধ্যায়টি দেখুন ।


2
আপনি এফডিআর বনাম বনফেরোনি ব্যাখ্যা করেছেন, তবে "পজিটিভ নির্ভরতা" সংজ্ঞায়িত করবেন না বরং এটি "ইতিবাচকভাবে সম্পর্কিত" হিসাবে লিখুন তবে আমি বুঝতে পারি না। বিবেচনা করুন যে আমার কাছে 1000 পি মান রয়েছে, যা কিছু রোগের সাথে বা তার সাথে লোকেরা তুলনা করে 1000 বিভিন্ন জিনের পরীক্ষার এক্সপ্রেশন। এই তুলনাগুলি "আবিষ্কার" কোনটি তা নির্ধারণ করার জন্য আমি বিএইচ পদ্ধতি ব্যবহার করি। এই প্রসঙ্গে "ইতিবাচক নির্ভরতা" এর অর্থ কী?
হার্ভে মোটুলস্কি

5
এই উত্তর ফ্ল্যাট আউট ভুল। ইতিবাচক রিগ্রেশন নির্ভরতা এবং ইতিবাচকভাবে যুক্ত হওয়া একে অপরের থেকে পৃথক। বেনজামিনী ইয়েকুটিয়ালি কাগজ এটি ব্যাখ্যা করে এবং রেফারেন্সও সরবরাহ করে। "তবুও, পিআরডিএস এবং ইতিবাচক সমিতি একে অপরকে বোঝায় না এবং পার্থক্যটি কিছুটা গুরুত্বের বিষয় For উদাহরণস্বরূপ, একটি বহুবিধ স্বাভাবিক বন্টন ইতিবাচকভাবে জড়িত যদি সমস্ত পারস্পরিক সম্পর্ক ননজিটিভেটিভ হয় PR পিআরডিএস সম্পত্তি ধরে রাখার জন্য সমস্ত পারস্পরিক সম্পর্ককে ননজিটিভ হওয়ার দরকার নেই () বিভাগের ৩.১ দেখুন, নীচে মামলা 1)। পৃষ্ঠা দেখুন। কাগজ 6।
ব্যবহারকারী3303
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.