আপনার ডেটা বিতরণ স্বাভাবিক হওয়ার দরকার নেই, এটি স্যাম্পলিং বিতরণ যা প্রায় স্বাভাবিক হতে হবে। যদি আপনার নমুনার আকারটি যথেষ্ট পরিমাণে বড় হয় তবে কেন্দ্রীয় সীমিত উপপাদ্যের কারণে ল্যান্ডাউ বিতরণ থেকে অর্থের নমুনা বিতরণ প্রায় স্বাভাবিক হওয়া উচিত ।
সুতরাং এর অর্থ হ'ল আপনার ডেটা দিয়ে নিরাপদে টি-টেস্ট ব্যবহার করতে সক্ষম হওয়া উচিত।
উদাহরণ
আসুন এই উদাহরণটি বিবেচনা করুন: ধরুন আমাদের লগন্যমাল বন্টন মিউ = 0 এবং এসডি = 0.5 এর সাথে জনসংখ্যা রয়েছে (এটি ল্যান্ডোর সাথে কিছুটা মিল দেখাচ্ছে)
সুতরাং আমরা প্রতিবার নমুনার গড় গণনা করে এই বিতরণ থেকে 5000 টি পর্যবেক্ষণ নমুনা করি
এবং এটি আমরা পাই
বেশ স্বাভাবিক দেখাচ্ছে, তাই না? আমরা যদি নমুনার আকার বাড়িয়ে তুলি তবে এটি আরও স্পষ্ট
আর কোড
x = seq(0, 4, 0.05)
y = dlnorm(x, mean=0, sd=0.5)
plot(x, y, type='l', bty='n')
n = 30
m = 1000
set.seed(0)
samp = rep(NA, m)
for (i in 1:m) {
samp[i] = mean(rlnorm(n, mean=0, sd=0.5))
}
hist(samp, col='orange', probability=T, breaks=25, main='sample size = 30')
x = seq(0.5, 1.5, 0.01)
lines(x, dnorm(x, mean=mean(samp), sd=sd(samp)))
n = 300
samp = rep(NA, m)
for (i in 1:m) {
samp[i] = mean(rlnorm(n, mean=0, sd=0.5))
}
hist(samp, col='orange', probability=T, breaks=25, main='sample size = 300')
x = seq(1, 1.25, 0.005)
lines(x, dnorm(x, mean=mean(samp), sd=sd(samp)))