ফিশারের সঠিক পরীক্ষার বিষয়ে: মহিলা যদি দুধের প্রথম কাপের সংখ্যা না জানতেন তবে কোন পরীক্ষাটি উপযুক্ত হত?


18

আর এ ফিশারের বিখ্যাত লেডি টেস্টিং চায়ের পরীক্ষায় , মহিলাটিকে কত দুধের প্রথম / চা-প্রথম কাপ (8 কাপের মধ্যে প্রতিটি জন্য 4) তা জানানো হয়। এটি ফিশারের সঠিক পরীক্ষার স্থির প্রান্তিক মোট অনুমানকে সম্মান করে।

আমি আমার বন্ধুর সাথে এই পরীক্ষাটি করার কথা ভাবছিলাম, কিন্তু ভাবনাটি আমাকে ধাক্কা দিয়েছে। ভদ্রমহিলা যদি সত্যিই দুধের প্রথম এবং চা-প্রথম কাপের মধ্যে পার্থক্য বলতে পারে, তবে তার উচিত দুধের প্রথম / চা-প্রথম কাপের প্রান্তিক মোট পরিমাণ এবং সেইগুলি কী ones

সুতরাং এখানে প্রশ্নটি রয়েছে: আরএ ফিশার মোট দুধ-প্রথম এবং চা-প্রথম কাপের সংখ্যার কথা মহিলাটিকে না জানালে কোন পরীক্ষা করা যেত?


4
কেউ কেউ যুক্তি দেখিয়েছিলেন যে এমনকি দ্বিতীয় মার্জিন ডিজাইনের দ্বারা স্থির না করা সত্ত্বেও, এটি মহিলার বৈষম্য করার ক্ষমতা সম্পর্কে সামান্য তথ্য বহন করে (যেমন এটি প্রায় আনুষঙ্গিক) এবং শর্তযুক্ত হওয়া উচিত। সঠিক শর্তহীন পরীক্ষা (আমার মনে হয় প্রথম বার্নার্ড প্রস্তাবিত) আরও জটিল কারণ আপনাকে কোনও উপদ্রব প্যারামিটারের সমস্ত সম্ভাব্য মানের চেয়ে সর্বাধিক পি-মান গণনা করতে হবে।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন


@ স্কোর্টচি আরও কি বলার আছে? আমি এতে কিছু যুক্ত করব না (বা আমি এটি এত পরিষ্কার এবং সংক্ষেপে বলতে পারব না) manage আপনার দুটি মতামত জুড়ে আমি মনে করি আপনার কাছে সেখানে উত্তম উত্তর রয়েছে।
গ্লেন_বি -রিনস্টেট মনিকা

1
ইয়েটস, এফ (১৯৮৪) " রয়্যাল স্ট্যাটিস্টিকাল সোসাইটির জার্নাল " 2 Contin 2 কন্টিজেন্সি টেবিলের জন্য গুরুত্বপূর্ণ টেস্টগুলির "টেস্টগুলিতে (কাগজ এবং আলোচনাকারীদের উভয়ের মধ্যে) দেখার মতো কিছু আলোচনা রয়েছে সিরিজ এ (সাধারণ) , খণ্ড। 147, নং 3, পিপি 426-463।
গ্লেন_বি -রিনস্টেট মনিকা

1
কেবল গড়ে, দুধের সাথে 4 কাপের বেশি চা এবং 4 ছাড়াই, আমরা বলতে পারি যে তিনি 1 এর সম্ভাবনা121212

উত্তর:


16

কেউ কেউ যুক্তি দেখিয়েছিলেন যে এমনকি দ্বিতীয় মার্জিন ডিজাইনের দ্বারা স্থির না করা সত্ত্বেও, এটি মহিলার বৈষম্য করার ক্ষমতা সম্পর্কে সামান্য তথ্য বহন করে (যেমন এটি প্রায় আনুষঙ্গিক) এবং শর্তযুক্ত হওয়া উচিত। সঠিক শর্তহীন পরীক্ষা (প্রথমে বার্নার্ড প্রস্তাবিত ) আরও জটিল কারণ আপনাকে ন্যূনত অনুমানের অধীনে সাধারণ বার্নোল্লি সম্ভাবনা যেমন একটি উপদ্রব প্যারামিটারের সমস্ত সম্ভাব্য মানের চেয়ে সর্বাধিক পি-মান গণনা করতে হবে। সাম্প্রতিককালে, উপদ্রব প্যারামিটারের জন্য একটি আত্মবিশ্বাসের ব্যবধানে পি-মান সর্বাধিক করার প্রস্তাব দেওয়া হয়েছে: বার্জার (1996) দেখুন, "আত্মবিশ্বাসের ব্যবধানের মানগুলি থেকে আরও শক্তিশালী পরীক্ষা", আমেরিকান পরিসংখ্যানবিদ , 50 , 4; সঠিক ধারণা থাকা সঠিক পরীক্ষাগুলি এই ধারণাটি ব্যবহার করে তৈরি করা যেতে পারে।

এশিংটনের অর্থে ফিশারের নির্ভুল পরীক্ষাটিও এলোমেলোভাবে পরীক্ষা হিসাবে দেখা দেয়: পরীক্ষামূলক চিকিত্সার একটি এলোমেলো অ্যাসাইনমেন্ট পরীক্ষার পরিসংখ্যানগুলির বিতরণকে এই অ্যাসাইনমেন্টগুলির ক্রমবর্ধনের উপর নাল অনুমানের পরীক্ষা করার জন্য ব্যবহার করতে দেয় allows এই পদ্ধতির মধ্যে ভদ্রমহিলার নির্ধারণগুলি স্থির হিসাবে বিবেচিত হয় (এবং প্রান্তিক মোট দুধ-প্রথম এবং চা-প্রথম কাপগুলি অবশ্যই অনুমতি ছাড়াই সংরক্ষণ করা হয়)।


পারি Barnard::barnardw.test()এখানে ব্যবহার করা? অনুশীলনে গণ্য জটিলতায় কী পার্থক্য আশা করা যায়?
krlMLr

আমি সেই প্যাকেজটির সাথে পরিচিত নই, তবে আপনি যে পৃষ্ঠার সাথে কথা বলছিলাম ঠিক সেই রেফারেন্সের সাথে আপনি যে সহায়তা পৃষ্ঠাটি লিঙ্ক করছেন সেটি। এছাড়াও দেখুন Exact। গণনামূলক জটিলতা হিসাবে, আমি জানি না - এটি ব্যবহৃত সর্বাধিককরণ অ্যালগরিদমের উপর নির্ভর করে।
স্কোর্টচি - মনিকা পুনরায় ইনস্টল করুন

2

আজ, আমি আর এ ফিশারের "ডিজাইন অব এক্সপেরিমেন্টস" এর প্রথম অধ্যায়গুলি পড়েছি এবং একটি অনুচ্ছেদে আমার প্রশ্নের মৌলিক ত্রুটিটি অনুধাবন করেছে।

এটি হ'ল, এমনকি যদি মহিলাটি দুধের প্রথম এবং চা-প্রথম কাপগুলির মধ্যে পার্থক্যটি বলতে পারে , আমি কখনই প্রমাণ করতে পারি না যে "কোনও সীমিত পরিমাণে পরীক্ষার দ্বারা" তার সেই ক্ষমতা আছে। এই কারণে, একজন পরীক্ষক হিসাবে, আমার এই ধারণাটি শুরু করা উচিত যে তার কোনও দক্ষতা (নাল অনুমান) নেই এবং এটি অস্বীকার করার চেষ্টা করা উচিত। এবং আসল পরীক্ষার নকশা (ফিশারের নির্ভুল পরীক্ষা) এটি করার জন্য যথেষ্ট, দক্ষ এবং ন্যায়সঙ্গত পদ্ধতি procedure

এখানে আরএ ফিশারের "ডিজাইন অব এক্সপেরিমেন্টস" এর একটি অংশ রয়েছে:

এটি যুক্তিযুক্ত হতে পারে যে কোনও পরীক্ষা যদি এই অনুমানটিকে অস্বীকার করতে পারে যে বিষয়টিতে দুটি ভিন্ন ধরণের বস্তুর মধ্যে সংবেদনশীল বৈষম্য নেই, তবে অবশ্যই বিপরীত অনুমানটি প্রমাণ করতে সক্ষম হতে হবে যে সে এই জাতীয় কিছু বৈষম্য তৈরি করতে পারে। তবে এই শেষ অনুমানটি যদিও যুক্তিযুক্ত বা সত্য হতে পারে তবে পরীক্ষার দ্বারা পরীক্ষা করার জন্য নাল অনুমান হিসাবে এটি অযোগ্য, কারণ এটি অনর্থক। যদি এটি দৃ were়রূপে বলা হয় যে বিষয়টি তার রায়গুলিতে কখনই ভুল হবে না তবে আমাদের কাছে আবার একটি সঠিক অনুমান রয়েছে, এবং এটি সহজেই অনুমান করা যায় যে এই অনুমানটি একক ব্যর্থতার দ্বারা অস্বীকার করা যেতে পারে তবে কোনও পরিসীমা পরীক্ষা-নিরীক্ষার মাধ্যমে প্রমাণ করা যায় না


1

নাল অনুমানের অধীনে উপদ্রব পরামিতি অজানা থাকলে বার্নার্ডের পরীক্ষা ব্যবহার করা হয়।

তবে ভদ্রমহিলা টেস্টিং পরীক্ষায় আপনি যুক্তি দিতে পারেন যে নাল অনুমানের অধীনে উপদ্রব পরামিতিটি 0.5 এ সেট করা যেতে পারে (অজানা মহিলার কাপের সঠিকভাবে অনুমান করার 50% সম্ভাবনা রয়েছে)।

তারপরে নাল অনুমানের অধীনে সঠিক অনুমানের সংখ্যাটি দ্বিপদী বিতরণে পরিণত হয়: প্রতিটি কাপের 50% সম্ভাবনা সহ 8 কাপ অনুমান করা।


অন্যান্য ক্ষেত্রে আপনার নাল অনুমানের জন্য এই তুচ্ছ 50% সম্ভাবনা নাও থাকতে পারে। এবং স্থির মার্জিন ছাড়া আপনি সম্ভবত জানেন না যে সম্ভাবনাটি কী হওয়া উচিত। সেক্ষেত্রে আপনার বার্নার্ডের পরীক্ষা দরকার।


এমনকি আপনি যদি চা পরীক্ষার ভদ্রমহিলার স্বাদ গ্রহণের বিষয়ে বার্নার্ড পরীক্ষা করেন, তবে এটি 50% হয়ে উঠবে (যদি ফলাফলটি সমস্ত সঠিক অনুমান হয়) যেহেতু সর্বাধিক পি-মান সহ উপদ্রব পরামিতি 0.5 হয় এবং তুচ্ছ দ্বিপদী পরীক্ষার ফলস্বরূপ ( এটি আসলে চারটি দুধের প্রথম কাপের জন্য দুটি দ্বি-দ্বি পরীক্ষার সংমিশ্রণ এবং চার টি প্রথম কাপের জন্য একটি)।

> library(Barnard)
> barnard.test(4,0,0,4)

Barnard's Unconditional Test

           Treatment I Treatment II
Outcome I            4            0
Outcome II           0            4

Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -2.82843
Nuisance parameter = 0.5 (One sided), 0.5 (Two sided)
P-value = 0.00390625 (One sided), 0.0078125 (Two sided)

> dbinom(8,8,0.5)
[1] 0.00390625

> dbinom(4,4,0.5)^2
[1] 0.00390625

নীচে এটি কীভাবে আরও জটিল ফলাফলের দিকে যাবে (যদি সমস্ত অনুমানগুলি সঠিক না হয় উদাহরণস্বরূপ 2 2 বনাম 4), তবে কী এবং চরম কী নয় তার গণনা কিছুটা আরও কঠিন হয়ে যায়

(নোট পাশাপাশি পরীক্ষা করে দেখুন যে বার্নার্ডের পরীক্ষার ক্ষেত্রে 4-2 ফলাফলের ক্ষেত্রে একটি উপদ্রব পরামিতি পি = 0.686 যা আপনি যুক্তি দিতে পারেন তা সঠিক নয়, 'চায়ে প্রথমে' উত্তর দেওয়ার 50% সম্ভাবনার পি-মান 0.08203125 হবে)। ওয়াল্ডের পরিসংখ্যানের ভিত্তিতে একটি আলাদা অঞ্চল বিবেচনা করার সময় এটি আরও ছোট হয়ে যায়, যদিও অঞ্চলটি নির্ধারণ করা এত সহজ নয় )

out <- rep(0,1000)
for (k in 1:1000) {
  p <- k/1000
  ps <- matrix(rep(0,25),5)   # probability for outcome i,j
  ts <- matrix(rep(0,25),5)   # distance of outcome i,j (using wald statistic)
  for (i in 0:4) {
    for (j in 0:4) {
      ps[i+1,j+1]  <- dbinom(i,4,p)*dbinom(j,4,p)
      pt <- (i+j)/8
      p1 <- i/4
      p2 <- j/4
      ts[i+1,j+1] <- (p2-p1)/sqrt(pt*(1-pt)*(0.25+0.25))
    }
  } 
  cases <- ts < ts[2+1,4+1]
  cases[1,1] = TRUE
  cases[5,5] = TRUE
  ps
  out[k] <- 1-sum(ps[cases])
}

> max(out)
[1] 0.08926748
> barnard.test(4,2,0,2)

Barnard's Unconditional Test

           Treatment I Treatment II
Outcome I            4            2
Outcome II           0            2

Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -1.63299
Nuisance parameter = 0.686 (One sided), 0.314 (Two sided)
P-value = 0.0892675 (One sided), 0.178535 (Two sided)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.