আন-পেয়ারড টি-টেস্টের জন্য কোন স্বাভাবিকতা অনুমানের প্রয়োজন? এবং কখন তাদের সাথে দেখা হয়?


12

আমরা যদি জোড় করা টি-টেস্ট পরিচালনা করতে চাই তবে প্রয়োজনীয়তাটি (যদি আমি সঠিকভাবে বুঝতে পারি) তবে পরিমাপের মিলিত ইউনিটগুলির মধ্যে গড় পার্থক্যটি সাধারণত বিতরণ করা হবে।

জোড়াযুক্ত টি-টেস্টে, পরিমাপের মিলিত ইউনিটগুলির মধ্যে পার্থক্যটি সাধারণত বিতরণ করা হবে (এই দুইটি তুলনামূলক দলের প্রত্যেকের বিতরণ স্বাভাবিক না হলেও) এই দাবিটি স্পষ্ট করে বলা হয় (এএফএআইকি)।

যাইহোক, একটি অবিচ্ছিন্ন টি-টেস্টে আমরা মিলিত ইউনিটগুলির মধ্যে পার্থক্য সম্পর্কে কথা বলতে পারি না, সুতরাং আমাদের দুটি গ্রুপের পর্যবেক্ষণগুলি স্বাভাবিক হওয়া প্রয়োজন যাতে তাদের গড়ের পার্থক্যটি স্বাভাবিক হয়ে যায়। যা আমাকে আমার প্রশ্নের দিকে নিয়ে যায়:

দুইটি অপ্রয়োজনীয় বিতরণের পক্ষে কি সম্ভব যাতে তাদের উপায়গুলির পার্থক্যটি সাধারণত বিতরণ করা হয়? (এবং এইভাবে, তাদের উপর একটি অযৌক্তিক টি-পরীক্ষা করার জন্য আমাদের প্রয়োজনীয় প্রয়োজনীয়তাটি পূরণ করুন - আবার - যতদূর আমি বুঝতে পারি))

আপডেট: (উত্তরের জন্য আপনাকে সবাইকে ধন্যবাদ) আমি দেখতে পাচ্ছি যে সাধারণ নিয়ম আমরা সন্ধান করছি তা হ'ল সিএলটি-এর কারণে উপায়গুলির পার্থক্যটি স্বাভাবিক হবে, যা একটি ভাল অনুমান (মনে হয় যথেষ্ট বড় এন এর অধীনে) বলে মনে হচ্ছে। এটি আমার জন্য আশ্চর্যজনক (আশ্চর্যজনক নয়, কেবল আশ্চর্যজনক নয়) যেমন এটি অযৌক্তিক টি-টেস্টের জন্য কীভাবে কাজ করে তবে একক নমুনা টি-পরীক্ষার জন্য এটিও কাজ করবে না। চিত্রিত করার জন্য এখানে কিছু আর কোড রয়েছে:

n1 <- 10
n2 <- 10
mean1 <- 50
mean2 <- 50
R <- 10000

# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
# hist(diffs)

P <- numeric(R)
MEAN <- numeric(R)
for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    y2 <- runif(n2, 0, 2*mean2)
    MEAN[i] <- mean(y1) - mean(y2)
    P[i] <- t.test(y1,y2)$p.value
}
# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
par(mfrow = c(1,2))
hist(P)
qqplot(P, runif(R)); abline(0,1)
sum(P<.05) / R # for n1=n2=10 -> 0.0715 # wrong type I error, but only for small n1 and n2 (for larger ones, this effect disappears)



n1 <- 100
mean1 <- 50
R <- 10000
P_y1 <- numeric(R)

for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}

par(mfrow = c(1,2))
hist(P_y1)
qqplot(P_y1, runif(R)); abline(0,1)
sum(P_y1<.05) / R # for n1=n2=10 -> 0.057  # "wrong" type I error

ধন্যবাদ।


5
অবশ্যই । যাক আপনার IID bivariate নমুনা দেখুন। যাক একটি আছে নির্বিচারে বন্টন এবং নিতে যেখানে হয় IID । এক্স আই এফ ওয়াই আই = এক্স আই + জেড আই { জেড আই } এন ( 0 , σ 2 )(Xi,Yi)XiFYi=Xi+Zi{Zi}N(0,σ2)
কার্ডিনাল

উত্তর:


17

অনুশীলনে, কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য আমাদের আশ্বাস দেয় যে বিস্তৃত অনুমানের অধীনে, দুটি নমুনার বিতরণ পরীক্ষা করা হচ্ছে যার ফলে নমুনার আকারগুলি বড় আকারের হয়ে ওঠার সাথে সাথে তারা সাধারণ বিতরণে পৌঁছবে (ধারণাটি এখানে আসে) অন্তর্নিহিত তথ্য বিতরণ। ফলস্বরূপ, নমুনার আকারটি আরও বড় হওয়ার সাথে সাথে, উপায়গুলির পার্থক্যটি সাধারণত বিতরণ হয়ে যায় এবং নামমাত্র টি বিতরণ করার জন্য একটি অযৌক্তিক টি-টেস্টের টি-স্ট্যাটিস্টিকের প্রয়োজনীয়তাগুলি সন্তুষ্ট হয়। সুতরাং, আরও ব্যবহারিকভাবে প্রয়োগযোগ্য প্রশ্ন হতে পারে, পরিসংখ্যানের আসল বিতরণ এবং টি বিতরণের মধ্যে পার্থক্যটি নিরাপদে উপেক্ষা করার আগে নমুনার আকারটি কত বড় হতে হবে?

অনেক ক্ষেত্রে, উত্তরটি "খুব বড় নয়", বিশেষত যখন অন্তর্নিহিত বিতরণগুলি প্রতিসমের খুব কাছাকাছি থাকে। উদাহরণস্বরূপ, আমি দুটি ইউনিফর্ম (0,1) ডিস্ট্রিবিউশনের মাধ্যমের তুলনা করে 100,000 পরীক্ষা সিমুলেটেড করেছি, প্রত্যেকটি নমুনা আকারের 10, এবং যখন আত্মবিশ্বাসের 95% স্তরে পরীক্ষা করেছিলাম, তখন সময়টির নাল 5.19% প্রত্যাখ্যান করেছিল - খুব কমই আলাদা নামমাত্র 5% প্রত্যাখ্যান হার থেকে আমরা আশা করছি (যদিও এটি 5% এর উপরে প্রায় 2.7 স্ট্যান্ডার্ড বিচ্যুতি))

এই কারণেই লোকেরা সমস্ত ধরণের পরিস্থিতিতে টি-টেস্ট ব্যবহার করে যেখানে অন্তর্নিহিত অনুমানগুলি বাস্তবে পূরণ হয় না, তবে অবশ্যই আপনার সমস্যার স্পেসিফিকেশনের উপর নির্ভর করে আপনার মাইলেজটি আলাদা হতে পারে। যাইহোক, অন্যান্য পরীক্ষা রয়েছে যা উইলকক্সন পরীক্ষার মতো সাধারণতার প্রয়োজন হয় না, যা তথ্য সাধারণত বিতরণ করা হয়, তবুও অসমোহিতভাবে, টি-টেস্টের মতো প্রায় 95% দক্ষ (যেমন, একটি নমুনার আকারের প্রয়োজন হয়) N / 0.95 এর সাথে N এর নমুনা আকারের টি-টেস্টের মতো একই শক্তি থাকতে পারে, যেমন N অনন্ততায় যায়)। যখন ডেটা সাধারণত বিতরণ করা হয় না, এটি টি-পরীক্ষার চেয়ে অনেক ভাল হতে পারে (অগত্যা হবে না)।


6
আমার অভিজ্ঞতায় বিতরণের সঠিক হওয়ার জন্য প্রয়োজনীয় নমুনার আকারটি প্রায়শই হাতের নমুনার আকারের চেয়ে বড়। উইলকক্সন স্বাক্ষরিত-র‌্যাঙ্ক পরীক্ষাটি আপনার দক্ষতা অনুসারে অত্যন্ত দক্ষ এবং এটি দৃ rob়, তাই আমি প্রায় সবসময়ই এটি পরীক্ষার চেয়ে বেশি পছন্দ করি । ttt
ফ্র্যাঙ্ক হ্যারেল

ধন্যবাদ ফ্র্যাঙ্ক - আপনার মন্তব্য আমাকে এমন প্রশ্ন উত্থাপন করতে সাহায্য করেছে যা আমি পরে যা করছি তার কাছাকাছি: stats.stackexchange.com/questions/19681/…
তাল

1

অবশ্যই. যদি এটি না হয় তবে স্বাধীন নমুনা টি-পরীক্ষা খুব বেশি কাজে আসবে না। আমাদের সত্যিকারের চেয়ে বড় আকারের নমুনার আকার প্রয়োজন কারণ আমাদের সিএলটি-তে আবেদন করার প্রয়োজন দুটি অ-সাধারণ জনগোষ্ঠীর মধ্যে পার্থক্যের জন্য পরীক্ষা করার জন্য।

দ্রুত উদাহরণের জন্য ধরে নেওয়া যাক আমাদের জনসংখ্যা 1 জন ঘনঘনকারী থেকে এসেছে যার গড় 25 এবং জনসংখ্যা 2 গড় 30 দিয়ে সমানভাবে বিতরণ করা হচ্ছে We আমরা এমনকি তাদের বিভিন্ন নমুনার আকার দেব। আমরা পরীক্ষা করতে পারি যে নমুনার পার্থক্যের বিতরণটির অর্থ অনুলিপি ফাংশনটি তুলনামূলকভাবে সহজেই আর ব্যবহারের মতো দেখায় looks

n1 <- 30
n2 <- 25
mean1 <- 25
mean2 <- 30

diffs <- replicate(10000, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
hist(diffs)

নমুনা আকারের সাথে চারপাশে খেলে বোঝা যাবে যে কম নমুনা আকারে আমাদের সত্যিকার অর্থে স্বাভাবিকতা নেই তবে নমুনার আকার বাড়ানো আমাদের তারতম্যের জন্য আরও সাধারণ দেখতে স্যাম্পলিং বিতরণ দেয়। অবশ্যই আপনি আরও অনুসন্ধান করতে এই উদাহরণে ব্যবহৃত বিতরণগুলি পরিবর্তন করতে পারেন। হিস্ট (diffs)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.