Nn
শক্তি সম্পর্কে আমার বক্তব্য পরিষ্কার করতে, এখানে একটি খুব সহজ সিমুলেশন র জন্য লেখা হয়েছে:
set.seed(9) # this makes the simulation exactly reproducible
power5050 = vector(length=10000) # these will store the p-values from each
power7525 = vector(length=10000) # simulated test to keep track of how many
power9010 = vector(length=10000) # are 'significant'
for(i in 1:10000){ # I run the following procedure 10k times
n1a = rnorm(50, mean=0, sd=1) # I'm drawing 2 samples of size 50 from 2 normal
n2a = rnorm(50, mean=.5, sd=1) # distributions w/ dif means, but equal SDs
n1b = rnorm(75, mean=0, sd=1) # this version has group sizes of 75 & 25
n2b = rnorm(25, mean=.5, sd=1)
n1c = rnorm(90, mean=0, sd=1) # this one has 90 & 10
n2c = rnorm(10, mean=.5, sd=1)
power5050[i] = t.test(n1a, n2a, var.equal=T)$p.value # here t-tests are run &
power7525[i] = t.test(n1b, n2b, var.equal=T)$p.value # the p-values are stored
power9010[i] = t.test(n1c, n2c, var.equal=T)$p.value # for each version
}
mean(power5050<.05) # this code counts how many of the p-values for
[1] 0.7019 # each of the versions are less than .05 &
mean(power7525<.05) # divides the number by 10k to compute the %
[1] 0.5648 # of times the results were 'significant'. That
mean(power9010<.05) # gives an estimate of the power
[1] 0.3261
N=100n1=50n2=50n1=75n2=25n1=90n2=10। আরও দ্রষ্টব্য যে স্ট্যান্ডার্ডাইজড গড় পার্থক্য / ডেটা উত্পন্নকরণ প্রক্রিয়া সমস্ত ক্ষেত্রে একই ছিল। তবে, পরীক্ষাটি 50-50 নমুনার জন্য 70% সময় ছিল 'উল্লেখযোগ্য', যখন গ্রুপের আকার 90-10 ছিল তখন শক্তি ছিল 75% এবং কেবলমাত্র 33% ছিল।
আমি এটি সাদৃশ্য দিয়ে মনে করি। যদি আপনি একটি আয়তক্ষেত্রের ক্ষেত্রের ক্ষেত্রটি জানতে চান, এবং ঘেরটি ঠিক করা হয়েছে, তবে দৈর্ঘ্য এবং প্রস্থ সমান হলে (ক্ষেত্রফলটি যদি আয়তক্ষেত্রটি একটি বর্গক্ষেত্র ) হয় তবে অঞ্চলটি সর্বাধিক করা হবে । অন্যদিকে, দৈর্ঘ্য এবং প্রস্থের বিভাজন (আয়তক্ষেত্রটি প্রসারিত হওয়ার সাথে সাথে) অঞ্চল সঙ্কুচিত হয়।