সাধারণভাবে, সিএলটি আনুমানিকতা ভাল হওয়ার জন্য প্রতিটি নমুনার আকার এরও বেশি হওয়া উচিত । থাম্বের একটি নিয়ম বা ততোধিক আকারের একটি নমুনা । তবে, আপনার প্রথম উদাহরণের জনসংখ্যার সাথে ঠিক আছে।5305
pop <- c(4, 3, 5, 6, 5, 3, 4, 2, 5, 4, 3, 6, 5)
N <- 10^5
n <- 5
x <- matrix(sample(pop, size = N*n, replace = TRUE), nrow = N)
x_bar <- rowMeans(x)
hist(x_bar, freq = FALSE, col = "cyan")
f <- function(t) dnorm(t, mean = mean(pop), sd = sd(pop)/sqrt(n))
curve(f, add = TRUE, lwd = 2, col = "red")
আপনার দ্বিতীয় উদাহরণে, জনসংখ্যা বিতরণের আকারের কারণে (একটি জিনিসের জন্য এটি খুব বেশি স্কিউড; লোক এবং গ্লেন_ বি বেলো মন্তব্যগুলি পড়ুন ), এমনকি মাপের নমুনাগুলি আপনাকে বিতরণের জন্য একটি ভাল অনুমান দেয় না নমুনা মানে সিএলটি ব্যবহার করা।30
pop <- c(4, 3, 5, 6, 5, 3, 10000000, 2, 5, 4, 3, 6, 5)
N <- 10^5
n <- 30
x <- matrix(sample(pop, size = N*n, replace = TRUE), nrow = N)
x_bar <- rowMeans(x)
hist(x_bar, freq = FALSE, col = "cyan")
f <- function(t) dnorm(t, mean = mean(pop), sd = sd(pop)/sqrt(n))
curve(f, add = TRUE, lwd = 2, col = "red")
তবে, এই দ্বিতীয় জনসংখ্যার সাথে, বলুন, আকারের নমুনা ভাল।100
pop <- c(4, 3, 5, 6, 5, 3, 10000000, 2, 5, 4, 3, 6, 5)
N <- 10^5
n <- 100
x <- matrix(sample(pop, size = N*n, replace = TRUE), nrow = N)
x_bar <- rowMeans(x)
hist(x_bar, freq = FALSE, col = "cyan")
f <- function(t) dnorm(t, mean = mean(pop), sd = sd(pop)/sqrt(n))
curve(f, add = TRUE, lwd = 2, col = "red")