বেনজামিনী এবং হচবার্গ (1995) এবং বেনজামিনী এবং ইয়েকুটিয়ালি (2001) মিথ্যা আবিষ্কারের হারের পদ্ধতির মধ্যে ব্যবহারিক পার্থক্য কী?


34

আমার পরিসংখ্যান প্রোগ্রাম বেনজামিনী এবং হচবার্গ (1995) এবং বেনজামিনী এবং ইয়েকুটিয়ালি (2001) মিথ্যা আবিষ্কারের হার (এফডিআর) উভয় পদ্ধতি প্রয়োগ করে। আমি পরবর্তী কাগজের মাধ্যমে পড়ার জন্য যথাসাধ্য চেষ্টা করেছি, তবে এটি বেশ গাণিতিকভাবে ঘন এবং আমি যথাযথভাবে নিশ্চিত নই যে আমি পদ্ধতিগুলির মধ্যে পার্থক্যটি বুঝতে পারি। আমি আমার পরিসংখ্যান প্রোগ্রামের অন্তর্নিহিত কোড থেকে দেখতে পাচ্ছি যে এগুলি সত্যই আলাদা এবং পরবর্তীটির মধ্যে এমন একটি পরিমাণযুক্ত কিউ রয়েছে যা আমি এফডিআর সম্পর্কিত উল্লেখ করেছি, তবে এর একটিও খুব বেশি উপলব্ধি নেই।

বেনজামিনী ও ইকুটিয়ালি (2001) পদ্ধতি বনাম বেঞ্জামিন ও হচবার্গ (1995) পদ্ধতিটি পছন্দ করার কোনও কারণ আছে কি? তাদের কি আলাদা ধারণা আছে? এই পদ্ধতির মধ্যে ব্যবহারিক পার্থক্য কি?

বেনজামিনী, ওয়াই, এবং হচবার্গ, ওয়াই (1995)। মিথ্যা আবিষ্কারের হার নিয়ন্ত্রণ করা: একাধিক পরীক্ষার জন্য ব্যবহারিক এবং শক্তিশালী পদ্ধতি approach রয়্যাল স্ট্যাটিস্টিকাল সোসাইটি সিরিজ বি এর জার্নাল, 57, 289–300।

বেনজামিনী, ওয়াই, এবং ইয়েকুটিয়ালি, ডি (2001)। নির্ভরতার অধীনে একাধিক পরীক্ষায় মিথ্যা আবিষ্কারের হারের নিয়ন্ত্রণ। পরিসংখ্যানসমূহের 29, 1165881188 এর বার্তা।

নীচের মন্তব্যে 1999 সালের কাগজটি উল্লেখ করা হয়েছে: ইয়েকুটিয়ালি, ডি, এবং বেনজামিনী, ওয়াই (1999)। সম্পর্কযুক্ত পরীক্ষার পরিসংখ্যানগুলির জন্য একাধিক পরীক্ষার পদ্ধতিগুলি নিয়ন্ত্রণ করে পুনরায় মডেলিং-ভিত্তিক ভুয়া আবিষ্কারের হার। পরিসংখ্যান পরিকল্পনা এবং অনুমান জার্নাল, 82 (1), 171-196।


আমি ভেবেছিলাম 2001 এর কাগজ নির্ভরতার অধীনে FDR (1995) এর বৈশিষ্ট্য প্রতিষ্ঠা করে। ইয়েকুটিয়ালি এবং বেনজামিনী (পরিসংখ্যান পরিকল্পনা এবং অনুক্রমের জার্নাল, 1999) একটি পৃথক এফডিআর পদ্ধতি স্থাপন করে। যে কোনও সুযোগটি আপনি খুঁজছেন তা কি?
জুলাইথ

@ জুলিয়েথ: একা একা অ্যাবস্ট্রাক্ট পড়ার পরে 2001 এর পেপারটি সম্পর্কে আমার এই ধারণাটি ছিল, তবে কাগজের সূত্রগুলিতে (যেমন 27 - 30) q হিসাবে উল্লেখ করা পরিমাণ যুক্ত বলে মনে হয়। তারপরে আবার, এই 1999 পত্রটি আপনি উদ্ধৃত করেছেন। যদিও আমার বোধগম্যতা হল যে 1999 এর কাগজটি পুনরায় স্যাম্পলিং পদ্ধতির প্রয়োগ করে যা স্পষ্টভাবে (কোডটি দেখানো থেকে) আমার পরিসংখ্যান প্রোগ্রামটি করছে না (আর; পি। অ্যাডজাস্ট) ... তবে আমি ভুল হতে পারি।
রাসেলপিয়ের্স

1
2001 এর কাগজের শেষে 1999 পত্রটি উদ্ধৃত করা হয়েছে এবং তারা বলেছে "শেষ পর্যন্ত, ইয়েকুটিয়ালি এবং বেঞ্জামিনি (1999) এর পুনরায় মডেলিং ভিত্তিক পদ্ধতিটি স্মরণ করুন, যা উপরের সমস্যাটি মোকাবেলা করার চেষ্টা করে এবং একই সাথে নির্ভরতা সম্পর্কে তথ্য ব্যবহার করে নমুনা থেকে উত্পন্ন কাঠামো। পুনরায় মডেলিং ভিত্তিক প্রক্রিয়া আরও শক্তিশালী, বৃহত্তর জটিলতা এবং কেবলমাত্র আনুমানিক এফডিআর নিয়ন্ত্রণের ব্যয়ে "" ... সুতরাং আমি মনে করি 2001 এর কাগজটি একটি বদ্ধ ফর্ম গণনার সমাধান সরবরাহ করেছে এবং এটিই আমার পরিসংখ্যান প্রোগ্রাম বাস্তবায়ন করছে।
রাসেলপিয়ের্স

1
ঠিক আছে, সুতরাং আপনি p.adjust ব্যবহার করছেন। 99 টি কাগজটি আপনি যেমন উল্লেখ করেছেন ঠিক তেমন আলাদা। আমি সর্বদা পি-অ্যাডজেটে বিওয়াই বিকল্পটি দেখেছি এবং মনোযোগ দিই নি। 2001 এর সেই কাগজটি সাধারণত এফডিআর এবং 'পজিটিভ রিগ্রেশন নির্ভরতা' প্রমাণের সাথে প্রমাণিত হয়। আমি এটি অন্য কোনও অনুমানের উদ্ধৃতি হিসাবে দেখিনি, তবে সম্ভবত এটি সেখানে রয়েছে। দেখে মনে হচ্ছে এটি আবার পড়তে হবে।
জুলাইথ

উত্তর:


21

বেনজামিনী এবং হচবার্গ (1995) মিথ্যা আবিষ্কারের হার প্রবর্তন করেছিল। বেনজামিনী এবং ইয়েকুটিয়ালি (2001) প্রমাণ করেছে যে অনুমানকারীটি নির্ভরশীলতার কয়েকটি ধরণের অধীনে বৈধ। নির্ভরতা নিম্নলিখিত হিসাবে উত্থাপিত হতে পারে। একটি টি-টেস্টে ব্যবহৃত অবিচ্ছিন্ন পরিবর্তনশীল এবং এর সাথে অন্য আরেকটি চলক বিবেচনা করুন; উদাহরণস্বরূপ, যদি বিএমআই দুটি গ্রুপে পৃথক হয় এবং যদি কোমরের পরিধি এই দুটি গ্রুপে পৃথক হয় তবে তা পরীক্ষা করা হচ্ছে। যেহেতু এই ভেরিয়েবলগুলি পারস্পরিক সম্পর্কযুক্ত, ফলস্বরূপ পি-মানগুলিও পারস্পরিক সম্পর্কযুক্ত হবে। ইয়েকুটিয়ালি এবং বেঞ্জামিনি (১৯৯৯) আরও একটি এফডিআর নিয়ন্ত্রণকারী পদ্ধতি তৈরি করেছে, যা সাধারণ নির্ভরতার অধীনে নাল বিতরণ পুনরায় মডেল করে ব্যবহার করা যেতে পারে। যেহেতু তুলনাটি নাল ক্রম বিভাজনের বিতরণের সাথে সম্পর্কিত, প্রকৃত ধনাত্মকতার মোট সংখ্যা বৃদ্ধি পাওয়ায় পদ্ধতিটি আরও রক্ষণশীল হয়ে ওঠে। দেখা যাচ্ছে যে সত্যিকারের ধনাত্মক সংখ্যা বাড়ার সাথে সাথে বিএইচ 1995 টিও রক্ষণশীল। এটিকে উন্নত করতে বেনজামিনী এবং হচবার্গ (২০০০) অভিযোজিত এফডিআর পদ্ধতিটি প্রবর্তন করেছিলেন। একটি প্যারামিটারের প্রয়োজনীয় অনুমান, নাল অনুপাত, যা স্টোরির পিএফডিআর অনুমানকারীতেও ব্যবহৃত হয়। স্টোরি তুলনা দেয় এবং যুক্তি দেয় যে তার পদ্ধতিটি আরও শক্তিশালী এবং 1995 পদ্ধতির রক্ষণশীল প্রকৃতির উপর জোর দেয়। স্টোরির নির্ভরতা অনুসারে ফলাফল এবং সিমুলেশনও রয়েছে।

উপরোক্ত সমস্ত পরীক্ষাগুলি স্বাধীনতার অধীনে বৈধ। এই অনুমানগুলি কীভাবে স্বাধীনতা থেকে বিদায় নেবে তা প্রশ্ন করতে পারে।

আমার বর্তমান চিন্তাভাবনাটি হ'ল আপনি যদি খুব বেশি সত্যিকারের ইতিবাচক প্রত্যাশা না করেন তবে বিওয়াই (1999) পদ্ধতিটি দুর্দান্ত কারণ এটি বিতরণের বৈশিষ্ট্য এবং নির্ভরতা অন্তর্ভুক্ত করে। যাইহোক, আমি একটি বাস্তবায়ন সম্পর্কে অসচেতন। স্টোরির পদ্ধতিটি কিছু নির্ভরতার সাথে অনেকগুলি সত্য ইতিবাচক জন্য ডিজাইন করা হয়েছিল। বিএইচ 1995 পরিবার-ভিত্তিক ত্রুটি হারের বিকল্প প্রস্তাব দেয় এবং এটি এখনও রক্ষণশীল।

বেনজামিনী, ওয়াই এবং ওয়াই হচবার্গ। স্বতন্ত্র পরিসংখ্যান সহ একাধিক পরীক্ষায় মিথ্যা আবিষ্কারের হারের অভিযোজিত নিয়ন্ত্রণে। শিক্ষা ও আচরণগত পরিসংখ্যান জার্নাল, 2000।


অনেক ধন্যবাদ! নিম্নলিখিত বিষয়গুলি / ইস্যুগুলি পরিষ্কার করতে আপনি কি আপনার প্রশ্নটি সংশোধন করতে পারবেন: "নাল ডিস্ট্রিবিউশনটির পুনরায় মডেলিং" 1999 এর কাগজ? আপনি দয়া করে 2000 কাগজের জন্য প্রশংসাপত্র প্রদান করবেন? আপনি পি। অ্যাডজাস্টের সাথে পরিচিত বলে মনে হয়েছিল, এটি কি আসলে বাইওয়াই পদ্ধতিটি বাস্তবায়ন করছে? হাইপোথিসিস পরীক্ষাগুলি নির্ভর না হলে একজনকে অবশ্যই বিএইচ ব্যবহার করা উচিত? অনুমানের পরীক্ষাগুলি নির্ভরশীল হিসাবে বিবেচিত হওয়ার কারণ কী? - দয়া করে আমাকে জানান, যদি এই প্রশ্নগুলির কোনও বর্তমানের পরিধি ছাড়িয়ে যায় এবং একটি নতুন প্রশ্ন জিজ্ঞাসা করা দরকার।
রাসেলপিয়ের্স

পি। অ্যাডজাস্টের উভয় (বিএইচ এবং বিওয়াই) বিকল্প রয়েছে। তবে আমি ভেবেছিলাম এগুলি একই, তাই আমি কিছু মিস করেছি।
জুলাইথ

এবং অন্তর্নিহিত কোডটিও আলাদা (আমি পরীক্ষা করে দেখেছি) যাতে তারা বিভিন্ন সংখ্যা তৈরি করে।
রাসেলপিয়ের্স

সুতরাং এটি কী পদ্ধতি বলে আপনি মনে করেন যে পি। অ্যাডজাস্ট বাই ওয়র্কটি নিয়ে কাজ করছেন? আমি মনে করি এটি 1999 এর পদ্ধতি নয়। অন্তর্নিহিত কোডটি পিমন (1, কামিন (কিউ * এন / আই * পি [ও])) [রো]। বিএইচ হ'ল পিমিন (1, কামমিন (এন / আই * পি [ও])) [রো]। সুতরাং এগুলি কেবলমাত্র Q এর সাথে পৃথক হয় যা যোগফল (1 / (1: n)) যেখানে এন = মানগুলির সংখ্যা। ও এবং রো কেবলমাত্র ফাংশনটির জন্য সংখ্যার
ক্রমকে

1
সুতরাং, যেহেতু কোনও নতুন উত্তর আসছে না, তাই আমি এই উত্তরটি গ্রহণ করব এবং আমার বোঝার সংক্ষিপ্তসার করব। পি। অ্যাডজাস্ট বিওয়াইয়ের জন্য ভুল ব্যবহার করতে পারে। যা সম্পাদিত হয় তা পুনরায় প্রতিস্থাপন নয়। বিএইচ, 2000 অ্যাডেটিভ এফডিআর প্রক্রিয়া প্রবর্তন করে এবং এর মধ্যে নাল অনুপাতের অনুমান জড়িত থাকে, যা বিওয়াই কোডে প্রদর্শিত Q হতে পারে। অন্তর্বর্তী সময়ে, বোধগম্য কাজটি করার দরকারটি হ'ল পি.এডজেস্টকে সরাসরি উল্লেখ করা যেমন আপনি "বাইওয়াই" বিকল্পটি ব্যবহার করার সময় ব্যবহৃত প্রকৃত পদ্ধতিটি প্রতিফলিত করে এবং কেবল সচেতন হন যে "বিওয়াই" আসলে বেনজামিনী ও হচবার্গ বাস্তবায়ন করতে পারে, 2000.
রাসেলপিয়ের্স

5

পি। অ্যাডজাস্ট বিওয়াইয়ের জন্য ভুল ব্যবহার করে না। কাগজটিতে উপপাদ্য 1.3 (p.1182 এর বিভাগ 5 এ প্রমাণ) এর উল্লেখ রয়েছে:

বেনজামিনী, ওয়াই, এবং ইয়েকুটিয়ালি, ডি (2001)। নির্ভরতার অধীনে একাধিক পরীক্ষায় মিথ্যা আবিষ্কারের হারের নিয়ন্ত্রণ। পরিসংখ্যানসমূহের 29, 1165881188 এর বার্তা।

এই কাগজটিতে বেশ কয়েকটি পৃথক সমন্বয় নিয়ে আলোচনা করা হয়েছে, পি-অ্যাডজাস্ট () এর জন্য সহায়তা পৃষ্ঠায় (লেখার সময়) উল্লেখটি কিছুটা অস্পষ্ট। পদ্ধতিটি সবচেয়ে সাধারণ নির্ভরতা কাঠামোর আওতায় নির্ধারিত হারে, এফডিআর নিয়ন্ত্রণ করার গ্যারান্টিযুক্ত। ক্রিস্টোফার জেনোভেসের স্লাইডগুলিতে তথ্যমূলক মন্তব্য রয়েছে: www.stat.cmu.edu/~genovese/talks/hannover1-04.pdf স্লাইড 37-তে মন্তব্যটি নোট করুন, বিওয়াই 2001 পত্রিকায় থিওরেম ১.৩ এর পদ্ধতি উল্লেখ করে [পদ্ধতি = 'বাই' দ্বারা পি। অ্যাডজাস্ট ()] যে: "দুর্ভাগ্যক্রমে, এটি সাধারণত খুব রক্ষণশীল, কখনও কখনও বনফেরনির চেয়েও বেশি" "

সংখ্যার উদাহরণ: method='BY' বনামmethod='BH'

নীচে বেনজামিনী এবং হচবার্গ (2000) কাগজের টেবিল 2 এর কলাম 2 থেকে পি-মানগুলির জন্য আর এর পি.এডজাস্ট () ফাংশনটি ব্যবহার করে, পদ্ধতি = 'বিএইচ' এর সাথে পদ্ধতি = 'বিওয়াই' এর সাথে তুলনা করা হয়েছে:

> p <-    c(0.85628,0.60282,0.44008,0.41998,0.3864,0.3689,0.31162,0.23522,0.20964,
0.19388,0.15872,0.14374,0.10026,0.08226,0.07912,0.0659,0.05802,0.05572,
0.0549,0.04678,0.0465,0.04104,0.02036,0.00964,0.00904,0.00748,0.00404,
0.00282,0.002,0.0018,2e-05,2e-05,2e-05,0)
> pmat <- rbind(p,p.adjust(p, method='BH'),p.adjust(p, method='BY'))
> rownames(pmat)<-c("pval","adj='BH","adj='BY'")
> round(pmat,4)

[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] pval 0.8563 0.6028 0.4401 0.4200 0.3864 0.3689 0.3116 0.2352 0.2096 adj='BH 0.8563 0.6211 0.4676 0.4606 0.4379 0.4325 0.3784 0.2962 0.2741 adj='BY' 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 [,10] [,11] [,12] [,13] [,14] [,15] [,16] [,17] [,18] pval 0.1939 0.1587 0.1437 0.1003 0.0823 0.0791 0.0659 0.0580 0.0557 adj='BH 0.2637 0.2249 0.2125 0.1549 0.1332 0.1332 0.1179 0.1096 0.1096 adj='BY' 1.0000 0.9260 0.8751 0.6381 0.5485 0.5485 0.4856 0.4513 0.4513 [,19] [,20] [,21] [,22] [,23] [,24] [,25] [,26] [,27] pval 0.0549 0.0468 0.0465 0.0410 0.0204 0.0096 0.0090 0.0075 0.0040 adj='BH 0.1096 0.1060 0.1060 0.1060 0.0577 0.0298 0.0298 0.0283 0.0172 adj='BY' 0.4513 0.4367 0.4367 0.4367 0.2376 0.1227 0.1227 0.1164 0.0707 [,28] [,29] [,30] [,31] [,32] [,33] [,34] pval 0.0028 0.0020 0.0018 0e+00 0e+00 0e+00 0 adj='BH 0.0137 0.0113 0.0113 2e-04 2e-04 2e-04 0 adj='BY' 0.0564 0.0467 0.0467 7e-04 7e-04 7e-04 0

i=1m(1/i)m

> mult <- sapply(c(11, 30, 34, 226, 1674, 12365), function(i)sum(1/(1:i)))

সেটনাম (বহু, পেস্ট (সি ('এম =', রেপ ('', 5)), সি (11, 30, 34, 226, 1674, 12365))) m = 11 30 34 226 1674 12365 3.020 3.995 4.118 6.000 8.000 10.000

m

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.