আমি গত সপ্তাহে সোসাইটি ফর পার্সোনালিটি অ্যান্ড সোশ্যাল সাইকোলজির একটি সভায় অংশ নিয়েছি যেখানে আমি উরি সিমোনসোহনের এই বক্তব্যের ভিত্তিতে একটি বক্তৃতা দেখেছি যে নমুনা আকার নির্ধারণের জন্য একটি অগ্রাধিকার শক্তি বিশ্লেষণ ব্যবহার করা মূলত অকেজো কারণ এর ফলাফলগুলি অনুমানের প্রতি এত সংবেদনশীল।
অবশ্যই, এই দাবিটি আমার পদ্ধতিগুলির ক্লাসে আমাকে যা শেখানো হয়েছিল তার বিরুদ্ধে এবং অনেক বিশিষ্ট পদ্ধতিবিজ্ঞানীদের (সবচেয়ে উল্লেখযোগ্যভাবে কোহেন, 1992 ) এর বিপরীতে রয়েছে , তাই উরি তার দাবির উপর নির্ভর করে কিছু প্রমাণ উপস্থাপন করেছিলেন। আমি নীচে এই প্রমাণ কিছু পুনরায় তৈরি করার চেষ্টা করেছি।
সরলতার জন্য, এর একটি অবস্থা যেখানে আপনি পর্যবেক্ষণ দুই দলের আছে এবং অনুমান যে প্রভাব আকার (যেমন আদর্শায়িত গড় পার্থক্য দ্বারা পরিমাপ করা) হল কল্পনা করা যাক । একটি স্ট্যান্ডার্ড পাওয়ার গণনা ( নীচের প্যাকেজটি ব্যবহার করে করা হয়েছে ) আপনাকে বলবে যে এই নকশার সাহায্যে 80% শক্তি পাওয়ার জন্য আপনার পর্যবেক্ষণের প্রয়োজন হবে ।128R
pwr
require(pwr)
size <- .5
# Note that the output from this function tells you the required observations per group
# rather than the total observations required
pwr.t.test(d = size,
sig.level = .05,
power = .80,
type = "two.sample",
alternative = "two.sided")
সাধারণত, তবে, প্রভাবটির প্রত্যাশিত আকার সম্পর্কে আমাদের অনুমানগুলি (কমপক্ষে সামাজিক বিজ্ঞানে যা আমার পড়াশোনার ক্ষেত্র) এটি কেবলমাত্র - খুব রুক্ষ অনুমান। তাহলে কী হবে যদি আমাদের অনুমানের আকার সম্পর্কে কিছুটা বন্ধ হয়? একটি দ্রুত পাওয়ার গণনা আপনাকে জানায় যে যদি প্রভাবটির আকার পরিবর্তে হয় তবে আপনার পর্যবেক্ষণ প্রয়োজন - সংখ্যার গুণ যা আপনার প্রভাবের আকারের জন্য পর্যাপ্ত শক্তি থাকা প্রয়োজন । তেমনিভাবে, যদি প্রভাবটির আকার আপনার কেবল পর্যবেক্ষণ প্রয়োজন, আপনার % এর প্রভাবের আকারটি সনাক্ত করার জন্য পর্যাপ্ত শক্তি থাকতে হবে তার 70%.5 200 1.56 .5 .6 90 .50 90 200। ব্যবহারিকভাবে বলতে গেলে, অনুমান করা পর্যবেক্ষণগুলির পরিসীমাটি বেশ বড় - থেকে ।
এই সমস্যার একটি প্রতিক্রিয়া হ'ল, প্রভাবটির আকারটি কী হতে পারে সে সম্পর্কে নির্ভুল অনুমানের পরিবর্তে, আপনি পূর্ববর্তী সাহিত্যের মাধ্যমে বা পাইলট পরীক্ষার মাধ্যমে প্রভাবটির আকার সম্পর্কে প্রমাণ সংগ্রহ করেন। অবশ্যই, আপনি যদি পাইলট টেস্টিং করেন, আপনি চাইবেন যে আপনার পাইলট পরীক্ষাটি যথেষ্ট ছোট হোক যে আপনি কেবল অধ্যয়ন পরিচালনার জন্য প্রয়োজনীয় নমুনার আকার নির্ধারণ করার জন্য আপনার অধ্যয়নের কোনও সংস্করণ চালাচ্ছেন না (যেমন, আপনি চান পাইলট পরীক্ষায় ব্যবহৃত নমুনার আকারটি আপনার অধ্যয়নের নমুনা আকারের চেয়ে ছোট হওয়া চাই)।
উরি সিমোনসোহান যুক্তি দিয়েছিলেন যে আপনার শক্তি বিশ্লেষণে ব্যবহৃত প্রভাবের আকার নির্ধারণের উদ্দেশ্যে পাইলট পরীক্ষা নিরর্থক। নিম্নলিখিত সিমুলেশন বিবেচনা করুন যে আমি দৌড়েছিলাম R
। এই সিমুলেশন ধরে নেয় যে জনসংখ্যা প্রভাব আকার । এটি 40 মাপের "পাইলট পরীক্ষা" পরিচালনা করে এবং 10000 পাইলট পরীক্ষার প্রতিটি থেকে প্রস্তাবিত ট্যাবলেট করে ।1000 এন
set.seed(12415)
reps <- 1000
pop_size <- .5
pilot_n_per_group <- 20
ns <- numeric(length = reps)
for(i in 1:reps)
{
x <- rep(c(-.5, .5), pilot_n_per_group)
y <- pop_size * x + rnorm(pilot_n_per_group * 2, sd = 1)
# Calculate the standardized mean difference
size <- (mean(y[x == -.5]) - mean(y[x == .5])) /
sqrt((sd(y[x == -.5])^2 + sd(y[x ==.5])^2) / 2)
n <- 2 * pwr.t.test(d = size,
sig.level = .05,
power = .80,
type = "two.sample",
alternative = "two.sided")$n
ns[i] <- n
}
নীচে এই সিমুলেশন ভিত্তিক একটি ঘনত্বের প্লট রয়েছে। চিত্রটি আরও ব্যাখ্যাযোগ্য করে তোলার জন্য আমি পাইলট পরীক্ষাগুলির বাদ দিয়েছি যা উপরে বিভিন্ন পর্যবেক্ষণের সুপারিশ করেছে । এমনকি সিমুলেশনের কম চরম ফলাফলগুলিতে আলোকপাত করেও , পাইলট পরীক্ষাগুলি দ্বারা প্রস্তাবিত প্রচুর প্রকরণ রয়েছে ।500 এন এস 1000
অবশ্যই, আমি নিশ্চিত যে অনুমানগুলির সমস্যার সংবেদনশীলতা কেবলমাত্র তার ডিজাইন আরও জটিল হওয়ার সাথে সাথে আরও খারাপ হয়। উদাহরণস্বরূপ, একটি র্যান্ডম এফেক্ট স্ট্রাকচারের স্পেসিফিকেশন প্রয়োজন এমন একটি ডিজাইনে, এলোমেলো প্রভাবগুলির কাঠামোর প্রকৃতির ডিজাইনের শক্তির জন্য নাটকীয় জড়িত থাকতে হবে।
সুতরাং, আপনারা এই যুক্তিটি সম্পর্কে কী ভাবেন? একটি অগ্রণী শক্তি বিশ্লেষণ মূলত অকেজো? যদি তা হয় তবে গবেষকরা তাদের পড়াশোনার আকার কীভাবে পরিকল্পনা করবেন?