আমরা যদি জোড় করা টি-টেস্ট পরিচালনা করতে চাই তবে প্রয়োজনীয়তাটি (যদি আমি সঠিকভাবে বুঝতে পারি) তবে পরিমাপের মিলিত ইউনিটগুলির মধ্যে গড় পার্থক্যটি সাধারণত বিতরণ করা হবে।
জোড়াযুক্ত টি-টেস্টে, পরিমাপের মিলিত ইউনিটগুলির মধ্যে পার্থক্যটি সাধারণত বিতরণ করা হবে (এই দুইটি তুলনামূলক দলের প্রত্যেকের বিতরণ স্বাভাবিক না হলেও) এই দাবিটি স্পষ্ট করে বলা হয় (এএফএআইকি)।
যাইহোক, একটি অবিচ্ছিন্ন টি-টেস্টে আমরা মিলিত ইউনিটগুলির মধ্যে পার্থক্য সম্পর্কে কথা বলতে পারি না, সুতরাং আমাদের দুটি গ্রুপের পর্যবেক্ষণগুলি স্বাভাবিক হওয়া প্রয়োজন যাতে তাদের গড়ের পার্থক্যটি স্বাভাবিক হয়ে যায়। যা আমাকে আমার প্রশ্নের দিকে নিয়ে যায়:
দুইটি অপ্রয়োজনীয় বিতরণের পক্ষে কি সম্ভব যাতে তাদের উপায়গুলির পার্থক্যটি সাধারণত বিতরণ করা হয়? (এবং এইভাবে, তাদের উপর একটি অযৌক্তিক টি-পরীক্ষা করার জন্য আমাদের প্রয়োজনীয় প্রয়োজনীয়তাটি পূরণ করুন - আবার - যতদূর আমি বুঝতে পারি))
আপডেট: (উত্তরের জন্য আপনাকে সবাইকে ধন্যবাদ) আমি দেখতে পাচ্ছি যে সাধারণ নিয়ম আমরা সন্ধান করছি তা হ'ল সিএলটি-এর কারণে উপায়গুলির পার্থক্যটি স্বাভাবিক হবে, যা একটি ভাল অনুমান (মনে হয় যথেষ্ট বড় এন এর অধীনে) বলে মনে হচ্ছে। এটি আমার জন্য আশ্চর্যজনক (আশ্চর্যজনক নয়, কেবল আশ্চর্যজনক নয়) যেমন এটি অযৌক্তিক টি-টেস্টের জন্য কীভাবে কাজ করে তবে একক নমুনা টি-পরীক্ষার জন্য এটিও কাজ করবে না। চিত্রিত করার জন্য এখানে কিছু আর কোড রয়েছে:
n1 <- 10
n2 <- 10
mean1 <- 50
mean2 <- 50
R <- 10000
# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
# hist(diffs)
P <- numeric(R)
MEAN <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
y2 <- runif(n2, 0, 2*mean2)
MEAN[i] <- mean(y1) - mean(y2)
P[i] <- t.test(y1,y2)$p.value
}
# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
par(mfrow = c(1,2))
hist(P)
qqplot(P, runif(R)); abline(0,1)
sum(P<.05) / R # for n1=n2=10 -> 0.0715 # wrong type I error, but only for small n1 and n2 (for larger ones, this effect disappears)
n1 <- 100
mean1 <- 50
R <- 10000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
par(mfrow = c(1,2))
hist(P_y1)
qqplot(P_y1, runif(R)); abline(0,1)
sum(P_y1<.05) / R # for n1=n2=10 -> 0.057 # "wrong" type I error
ধন্যবাদ।