সিডাক নাকি বনফেরনি?


13

আমি 16 টি বিভিন্ন প্রজাতির গাছপালায় গড়ে উঠা শুঁয়োপোকা (নরমাল, টুইটে ডিস্ট্রিবিউশন ব্যবহার করে) এর গড় সংখ্যার পার্থক্যগুলি দেখতে এসপিএসএসে একটি সাধারণ রৈখিক মডেল ব্যবহার করছি।

আমি একাধিক তুলনা চালাতে চাই তবে আমি সিডাক বা বনফেরোনি সংশোধন পরীক্ষা ব্যবহার করব কিনা তা নিশ্চিত নই। দুটি পরীক্ষার মধ্যে পার্থক্য কী? এক অন্য চেয়ে ভাল?


1
আমি এই সত্যটি ঘৃণা করি যে প্রায়শই স্ট্যান্ডার্ড ঘনত্ববাদী অনুমানের পরীক্ষার সাথে এই ধরনের সংশোধন করা প্রয়োজন এবং আমি বায়সিয়ান কৌশলগুলি বেশি পছন্দ করি। এটি বলেছিল, আমি সিডাক সংশোধনকে কম ঘৃণা করি কারণ এটি কম অ্যাডহক বলে মনে হয় (আপনি যদি স্বাধীনতার ধারণা গ্রহণ করতে রাজি হন)। এটি বেশিরভাগই কেবল ব্যক্তিগত পছন্দ তবে এটি একটি উত্তরের পরিবর্তে আমি একটি মন্তব্য করেছি।
মাইকেল ম্যাকগোয়ান

1
@ মিশেলম্যাকগোয়ান: কেবল কৌতূহলী, তবে, আপনি কোনও বনফেরনি সংশোধন সম্পর্কে " অ্যাডহক " কে কী বিবেচনা করেন ?
কার্ডিনাল

@ কার্ডিনাল দুঃখিত, এটি সম্ভবত শব্দের সেরা পছন্দ ছিল না। আরও শক্তিশালী অনুমানের প্রয়োজনে (আমি সেই ব্যয়টিকে তুচ্ছ করতে চাই না), সিডাক সংশোধন আরও গুণগত অর্থের সাথে সীমাবদ্ধ করে। বুলের অসমতা অনুসারে বাউন্ডারোনি সংশোধনে বাউন্ডটি কীভাবে বাজে বাছাইয়ের ক্ষেত্রে বাধার প্রতিনিধিত্ব করে তা সত্যই আমি গুণগতভাবে ব্যাখ্যা করতে পারি না।
মাইকেল ম্যাকগোয়ান

@ মিশেলম্যাকগোয়ান: আহ, ঠিক আছে। আমি দেখি. আমি অনুমান করি যে বনফেরোনি সম্পর্কে কেউ বলতে পারে এমন কয়েকটি গুণগত গুণ রয়েছে: (ক) শূন্যের অধীনে পৃথক পরীক্ষার পরিসংখ্যানের মধ্যে নির্ভরতা নির্বিশেষে এটি পারিবারিক দিকের ত্রুটি হারের বিরুদ্ধে গ্যারান্টিযুক্ত সুরক্ষা সরবরাহ করে এবং (খ) এটি ঠিক সঠিক সংশোধন তৈরি করার জন্য যখন পৃথক অনুমানের পরীক্ষার প্রত্যাখাত অঞ্চলগুলি যুগলভাবে পৃথক হয়।
কার্ডিনাল

1
একটি পরীক্ষার জন্য প্রথম ধরণের ত্রুটির সম্ভাবনা অন্য পরীক্ষার সাথে সম্পর্কিত হলে দুটি পরীক্ষা স্বাধীন হয় না। উদাহরণস্বরূপ, ধরুন আপনি একটি নিয়ন্ত্রণ শর্ত এবং দুটি পরীক্ষার শর্ত সহ একটি পরীক্ষা চালাচ্ছেন। দুটি পরীক্ষার প্রতিটি পরীক্ষার শর্তটিকে নিয়ন্ত্রণের শর্তের সাথে তুলনা করে স্বতন্ত্র নয়। আপনি যদি সুযোগের সাথে নিয়ন্ত্রণ শর্তের জন্য চূড়ান্ত মান পান তবে কী হয় তা বিবেচনা করে আপনি এটি দেখতে পারেন। এটি দুটি পরীক্ষার উভয়ই পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হওয়ার সম্ভাবনা তৈরি করে।

উত্তর:


20

আপনি যদি স্বতন্ত্র পরিসংখ্যান পরীক্ষা করে থাকেন আপনার তাত্পর্য স্তর হিসাবে ব্যবহার করে , এবং নাল প্রতিটি ক্ষেত্রেই অর্জন করে , আপনি 'তাত্পর্য' খুঁজে পাবেন কি না তা কেবল একটি এলোমেলো ভেরিয়েবলের একটি অঙ্কন। বিশেষত, এটি এবং দিয়ে দ্বিপদী বিতরণ থেকে নেওয়া হয় । উদাহরণস্বরূপ, যদি আপনি ব্যবহার করে 3 টি পরীক্ষা চালানোর পরিকল্পনা করেন এবং (আপনার অজানা) প্রতিটি ক্ষেত্রেই আসলে কোনও তফাত নেই, তবে প্রতিটি পরীক্ষায় একটি গুরুত্বপূর্ণ ফলাফল খুঁজে পাওয়ার 5% সম্ভাবনা রয়েছে। এইভাবে, টাইপ আই ত্রুটির হারটিα পি = α এন = কে α = .05 α α α α α n ডব্লিউkαp=αn=kα=.05αপৃথকভাবে পরীক্ষাগুলির জন্য, তবে 3 টি পরীক্ষার সেট জুড়ে দীর্ঘমেয়াদী ধরণের I ত্রুটির হার বেশি হবে। আপনি বিশ্বাস করেন যে এটা গ্রুপে অর্থপূর্ণ হয়, তাহলে / একসঙ্গে এই 3 পরীক্ষার মনে করি, তারপর তোমার দিকে টাইপ আমি ভুল হার রাখা করতে পারেন সেট সামগ্রিকভাবে শুধু পৃথকভাবে চেয়ে বরং। আপনি কিভাবে এই সম্পর্কে যেতে হবে? মূল (অর্থাত্, ) থেকে নতুন মানে স্থানান্তরিত করার জন্য দুটি কেন্দ্র রয়েছে (যেমন, ):αααoαnew

Bonferroni: সমন্বয় 'তাত্পর্য' যেমন যে মূল্যায়ন করার জন্য ব্যবহৃতα

αnew=αok

ডান-সিডাক: ব্যবহার করে সামঞ্জস্যα

αnew=1(1αo)1/k

(দ্রষ্টব্য যে ডান-সিডাক ধার্য করেছেন যে সেটের মধ্যে থাকা সমস্ত পরীক্ষাগুলি একে অপরের থেকে স্বতন্ত্র এবং পারিবারিকভাবে টাইপ আই ত্রুটি মুদ্রাস্ফীতি দিতে পারে যদি সেই ধারনা না ধরে থাকে।)

এটা খেয়াল করা জরুরী যে, যখন পরীক্ষা চালাবে, আছে ত্রুটি দুই ধরণের যে আপনি এড়াতে চান, আমি (অর্থাত, বলার অপেক্ষা রাখে না সেখানে লেখার হয় একটি পার্থক্য আছে যখন এক নয়) এবং টাইপ -২ (অর্থাত, বলার অপেক্ষা রাখে না সেখানে নয় আসলে একটি পার্থক্য আছে)। সাধারণত, লোকেরা যখন এই বিষয়টি নিয়ে আলোচনা করেন, তখন তারা কেবল আলোচনা করেন — এবং কেবল — প্রকারের ত্রুটিগুলি সম্পর্কে সচেতন / সচেতন বলে মনে হয়। তদাতিরিক্ত, লোকেরা প্রায়শই উল্লেখ করতে অবহেলা করেন যে সমস্ত নাল সত্য হলেই গণনা করা ত্রুটি হারটি ধরে রাখবে । এটা তুচ্ছভাবে স্পষ্ট যে নাল অনুমানটি মিথ্যা হলে আপনি টাইপ আই ত্রুটি করতে পারবেন না, তবে এই বিষয়টি নিয়ে আলোচনা করার সময় এই বিষয়টিকে স্পষ্টভাবে মনে রাখা গুরুত্বপূর্ণ।

আমি এটিকে সামনে এনেছি কারণ এই তথ্যের প্রভাব রয়েছে যা প্রায়শই অযৌক্তিক বলে মনে হয়। প্রথমত, , ডান-সিডাক পদ্ধতির উচ্চতর পাওয়ার প্রস্তাব করা হবে (যদিও পার্থক্যটি ছোট দিয়ে যথেষ্ট ছোট হতে পারে ) এবং তাই সর্বদা পছন্দ করা উচিত (যখন প্রযোজ্য)) দ্বিতীয়ত, একটি 'স্টেপ-ডাউন' পদ্ধতির ব্যবহার করা উচিত। এটি হ'ল প্রথমে সবচেয়ে বড় প্রভাব পরীক্ষা করুন; আপনি যদি নিশ্চিত হন যে নালটি সেই ক্ষেত্রে পাওয়া যায় না, তবে সর্বাধিক সম্ভাব্য সংখ্যার ধরণের নম্বর , সুতরাং পরবর্তী পরীক্ষাটি সেই অনুযায়ী সামঞ্জস্য করা উচিত, ইত্যাদি। (এটি প্রায়শই মানুষকে অস্বস্তি করে এবং মাছ ধরার মতো দেখায় তবে তা হয় নাকে কে - 1 αk>1kk1ফিশিং যেমন পরীক্ষাগুলি স্বতন্ত্র থাকে এবং আপনি ডেটা দেখার আগে আপনি সেগুলি পরিচালনা করার পরিকল্পনা করেছিলেন। এটি সর্বোত্তমভাবে সামঞ্জস্য করার একটি উপায় ) α

আপনি দ্বিতীয় টাইপের ত্রুটির সাথে তুলনা করে টাইপ আইটিকে কীভাবে মূল্য দেবেন তা উপরে উপরের বিষয়গুলি ধারণ করে। যাইহোক, প্রথম -প্রীতিটি বিশ্বাস করার কোনও কারণ নেই যে টাইপ আই ত্রুটিগুলি টাইপ II এর চেয়েও খারাপ (এটি সত্ত্বেও সবাই মনে হয়)। পরিবর্তে, এটি একটি সিদ্ধান্ত যা অবশ্যই গবেষক দ্বারা নেওয়া উচিত, এবং অবশ্যই সেই পরিস্থিতির সাথে সুনির্দিষ্ট হতে হবে। ব্যক্তিগতভাবে, আমি যদি তাত্ত্বিকভাবে প্রস্তাবিত, একটি-অগ্রাধিকার , অরথোগোনাল বিপরীতে চলে তবে আমি সাধারণত ঠিক করি না ।α

(এবং এটি আবার উল্লেখ করার জন্য, কারণ এটি গুরুত্বপূর্ণ, উপরের সমস্তগুলি পরীক্ষাগুলি স্বতন্ত্র বলে ধরে নিয়েছে the যদি বিপরীতগুলি স্বতন্ত্র না হয়, যেমন যখন বিভিন্ন চিকিত্সা প্রতিটি একই নিয়ন্ত্রণের সাথে তুলনা করা হয়, সামঞ্জস্যের চেয়ে আলাদা পদ্ধতি যেমন ডানেটের পরীক্ষা ব্যবহার করা উচিত)) α


+1 টি। আপনি যেটিকে বনফেরনির জন্য "স্টেপ-ডাউন" পন্থা বলছেন হোল-বনফেরোনি পদ্ধতি হিসাবে পরিচিত তার ঠিক সমান? যদি হ্যাঁ, তবে ডান-সিডাকের ক্ষেত্রে একই যুক্তিটির কোনও নাম আছে?
অ্যামিবা 22

1
@ অ্যামিবা, হ্যাঁ এটিকে কখনও কখনও "হল্মের পদ্ধতি" বলা হয়, সুতরাং হোল-বোনফেরোনি বা হলম-সিডাক।
গুং - মনিকা পুনরায়

αα

@ অ্যামিবা, ৩ টি প্রাক-প্রাইমারী চালাচ্ছেন, 1 টি গবেষণায় অরথোগোনাল বিপরীতে 3 টি ভিন্ন স্টাডির প্রতিটিতে 1-প্রাইমারি কনট্রাস্ট চালানোর চেয়ে আলাদা নয়। যেহেতু কেউ যুক্তি দেয় না যে পরবর্তী পরিবারগুলির জন্য আপনার পারিবারিকভাবে সংশোধন প্রয়োজন, তাই পূর্বেরগুলির জন্য এগুলির প্রয়োজনীয়তার কোনও সুসংগত কারণ নেই। আপনার অন্য উদাহরণে, যদি কন্ট্রোল গ্রুপটি একা সুযোগে কম বাউন্স করে তবে আপনার 5 টি বিপরীতে প্রতিটি ভাল দেখবে; তবে আপনি 5 টি স্বতন্ত্র পড়াশোনা চালিয়ে গেলে এমনটি হওয়ার সম্ভাবনা নেই। আপনার সত্যিই কিছু ফর্ম সমন্বয় করা উচিত, বা আপনি ডানেট পরীক্ষা ব্যবহার করতে পারেন ।
গুং - মনিকা পুনরায়

N(0,1)n=10α=0.05
অ্যামিবা পুনর্বহাল মনিকা বলেছেন

6

ααnα=α/nα=1(1α)1/n

α/n<1(1α)1/n , সিডাক সংশোধনটি আরও কিছুটা শক্তিশালী (যেমন আপনি আরও সহজেই উল্লেখযোগ্য ফলাফল পান) তবে Bonferroni সামলানো একটু সহজ।

আপনার যদি আরও শক্তিশালী পদ্ধতির প্রয়োজন হয় তবে আপনি Bonferroni-Holm পদ্ধতিটি ব্যবহার করতে পারেন।


বনফেরনি হ্যান্ডেল করা সহজ কেন?
এমিলি

3
αn1(1α)1/n

@ মোমো কম্পিউটারগুলি পাটিগণিতের ক্ষেত্রে সত্যই ভাল, তাই সরলতার যুক্তি খুব জোরালো মনে করি না। একশো বছর আগে যখন হাতে হাতে গণনা করা হচ্ছিল অবশ্যই একটি খুব ভিন্ন গল্প।
মাইকেল ম্যাকগোয়ান

আমার উত্তরটির সাথে তুলনা করে +1, এটি যথেষ্ট সংক্ষেপে ;-) এ পৌঁছে যায়।
গুং - মনিকা পুনরায়

হাহা এটাই আমি ভেবেছিলাম তুমি বোঝাতে চেয়েছিলে! অনেক ধন্যবাদ!
এমিলি

5

সিডাক সংশোধন পৃথক পরীক্ষা পরিসংখ্যানগতভাবে স্বতন্ত্র। বনফেরনি সংশোধন এটি ধরে নেয় না।


এর অর্থ কি বনফেরনি কেবল আরও রক্ষণশীল পরীক্ষা?
এমিলি

1
উভয় পরীক্ষা যথাযথ হলে বনফেরনি আরও রক্ষণশীল। তবে যদি আপনার পরীক্ষাগুলি স্বতন্ত্র না হয় তবে আপনার সিডাক ব্যবহার করা উচিত নয়।
onestop

2
+1 যে বনফেরোনি সংশোধনের জন্য পরীক্ষাগুলি স্বাধীন হওয়ার প্রয়োজন হয় না এটি একটি ভাল পয়েন্ট যা আমি কভার করি নি।
গুং - মনিকা পুনরায়

@ আনস্টপ: পরীক্ষাগুলি স্বতন্ত্র হওয়ার অর্থ কী? আপনি সম্ভবত একটি উদাহরণ দিতে পারেন?
গুনহিল্ড

1
সিডাক সংশোধনের স্বাধীনতার দরকার নেই। এটি কেবল ধরে নেয় পরীক্ষাগুলি নেতিবাচকভাবে নির্ভর করে না। ইতিবাচক নির্ভরতা ঠিক আছে।
বনফেরোনি

4

সিডাক এবং বনফেরোনি এতটাই সমান যে আপনি কোন পদ্ধতি ব্যবহার করবেন না কেন আপনি সম্ভবত একই ফলাফল পাবেন। বোনফেরোনি সিডাকের চেয়ে সামান্য বেশি রক্ষণশীল। উদাহরণস্বরূপ, 2 তুলনা এবং .05 এর পারিবারিকভাবে আলফা জন্য, সিডাক প্রতিটি পরীক্ষা .0253 এবং বোনফেরনির প্রতিটি পরীক্ষা .0250 এ অনুষ্ঠিত হবে।

এই সাইটের অনেক মন্তব্যকারী বলেছেন যে সিডাক কেবল তখনই বৈধ যখন আপনার তুলনাগুলির পরীক্ষার পরিসংখ্যানগুলি স্বাধীন। এটা সত্যি না. সিডাক পারিবারিক দিকের ত্রুটি হারের সামান্য মূল্যবৃদ্ধির অনুমতি দেয় যখন পরীক্ষার পরিসংখ্যানগুলি নেতিবাচকভাবে নির্ভরশীল হয়, তবে আপনি যদি দ্বিমুখী পরীক্ষা করে থাকেন তবে নেতিবাচক নির্ভরতা সাধারণত উদ্বেগের বিষয় নয়। অ-নেতিবাচক নির্ভরতার অধীনে, সিডাক আসলে পারিবারিক দিকের ত্রুটি হারের উপরের একটি আবদ্ধ সরবরাহ করে। এটি বলেছিল, এমন অন্যান্য পদ্ধতি রয়েছে যা এই জাতীয় সীমাবদ্ধ করে এবং সিডাকের চেয়ে বেশি পরিসংখ্যানিক শক্তি ধরে রাখে। তাই সিডাক সম্ভবত সেরা পছন্দ নয়।

বনফেরোনি পদ্ধতিটি যে জিনিস সরবরাহ করে (তা সিডাক তা নয়) হ'ল টাইপ আই ত্রুটির প্রত্যাশিত সংখ্যার কঠোর নিয়ন্ত্রণ - তথাকথিত "প্রতি পরিবার ত্রুটির হার," যা পারিবারিকভাবে ত্রুটি হারের চেয়ে রক্ষণশীল। আরও তথ্যের জন্য, দেখুন: ফ্রান্সে, এভি (2015) "প্রতি পরিবার টাইপ আই ত্রুটির হার সামাজিক এবং আচরণগত বিজ্ঞানের সাথে সম্পর্কিত কিনা?" আধুনিক প্রয়োগিত পরিসংখ্যান পদ্ধতি জার্নাল 14 (1), 12-23।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.