তাত্পর্যপূর্ণ স্কেল-শিফ্ট বিকল্পগুলির বিরুদ্ধে শক্তি সন্ধান করা যুক্তিসঙ্গতভাবে সহজ ward
তবে, আমি জানি না যে শক্তিটি কী হতে পারে তা কাজ করার জন্য আপনার ডেটা থেকে গণনা করা মানগুলি ব্যবহার করা উচিত । এই ধরণের পোস্ট হকের শক্তি গণনার ফলাফল পাল্টা-স্বজ্ঞাত (এবং সম্ভবত বিভ্রান্তিমূলক) উপসংহারে ঝোঁক।
শক্তি, তাত্পর্য স্তরের মতো, ঘটনাটির আগে আপনি যে ঘটনাটি মোকাবেলা করেছেন; বিবেচনার জন্য বিকল্পগুলির একটি যুক্তিসঙ্গত সেট এবং পছন্দসই প্রভাবের আকারের বিষয়ে সিদ্ধান্ত নিতে আপনি অগ্রাধিকার বোঝার (তত্ত্ব, যুক্তি বা কোনও পূর্ববর্তী অধ্যয়ন সহ) ব্যবহার করবেন
আপনি বিভিন্ন অন্যান্য বিকল্পের জন্যও বিবেচনা করতে পারেন (উদাহরণস্বরূপ আপনি গামা পরিবারের অভ্যন্তরে ক্ষতিকারককে আরও কম সংখ্যক স্কিউ ক্ষেত্রে প্রভাব বিবেচনা করতে এম্বেড করতে পারেন)।
বিদ্যুত বিশ্লেষণের মাধ্যমে যে সাধারণ প্রশ্নগুলির উত্তর দেওয়ার চেষ্টা করা যেতে পারে তা হ'ল:
1) কোনও প্রভাব আকার বা এফেক্ট মাপের সেট * প্রদত্ত নমুনা আকারের জন্য শক্তিটি কী?
2) একটি নমুনা আকার এবং শক্তি দেওয়া, একটি প্রভাব সনাক্তকরণযোগ্য কত বড়?
3) একটি নির্দিষ্ট প্রভাব আকারের জন্য একটি কাঙ্ক্ষিত শক্তি দেওয়া, কোন নমুনা আকার প্রয়োজন হবে?
* (এখানে 'এফেক্ট সাইজ' জেনারিকভাবে উদ্দেশ্যে করা হয়েছে, এবং উদাহরণস্বরূপ, উপায়গুলির একটি নির্দিষ্ট অনুপাত, বা উপায়ের পার্থক্য, অগত্যা মানসম্মত নয়)।
স্পষ্টতই আপনার কাছে ইতিমধ্যে একটি নমুনা আকার রয়েছে, সুতরাং আপনি ক্ষেত্রে (3) নন। আপনি যুক্তিসঙ্গতভাবে কেস (2) বা কেস (1) বিবেচনা করতে পারেন।
আমি কেস (1) (যা কেস (2)) এর সাথে ডিল করার জন্য একটি উপায়ও প্রস্তাব দেব।
কেসের (1) পদ্ধতির চিত্রিত করার জন্য এবং এটি কেস (2) এর সাথে কীভাবে সম্পর্কিত, তা দেখার জন্য আসুন একটি নির্দিষ্ট উদাহরণ বিবেচনা করুন:
নমুনার আকারগুলি পৃথক হওয়ার কারণে, আমাদের কেসটি বিবেচনা করতে হবে যেখানে নমুনাগুলির একটিতে প্রাসঙ্গিক ছড়িয়ে থাকা 1 টির চেয়ে ছোট এবং বড় উভয় (যদি সেগুলি একই আকারের হয়, তবে প্রতিসম বিবেচনার ফলে কেবল একটি পক্ষ বিবেচনা করা সম্ভব হয়েছিল)। তবে, তারা একই আকারের খুব কাছাকাছি থাকার কারণে, প্রভাবটি খুব কম small যাই হোক না কেন, নমুনাগুলির একটির জন্য প্যারামিটারটি ঠিক করুন এবং অন্যটিতে পৃথক করুন।
সুতরাং এক যা করে তা হ'ল:
পূর্বেই:
choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1
গণনা করতে:
for each possible scale multiplier, kappa
repeat nsim times
generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
perform the test
compute the rejection rate across nsim tests at this kappa
আর-তে, আমি এটি করেছি:
alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s) # also below and at 1
rr = array(NA,length(s)) # to hold rejection rates
for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
)
plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last
abline(h=alpha,col=8,lty=2) # draw in alpha
যা নিম্নলিখিত শক্তিটিকে "বক্ররেখা" দেয়
এক্স-অক্ষটি লগ-স্কেলে রয়েছে, y- অক্ষটি প্রত্যাখ্যান হার।
এটি এখানে বলা শক্ত, তবে কালো পয়েন্টগুলি ডানদিকের চেয়ে বাম দিকে কিছুটা বেশি (অর্থাত্ বৃহত্তর নমুনাটি যখন ছোট স্কেল করে তখন ভগ্নাংশে আরও বেশি শক্তি থাকে)।
প্রত্যাখ্যান হারের রূপান্তর হিসাবে বিপরীত সাধারণ সিডিএফ ব্যবহার করে, আমরা রূপান্তরিত প্রত্যাখ্যান হার এবং লগ কাপা (কাপা s
প্লটে রয়েছি , তবে এক্স-অক্ষটি লগ-স্কেলড) এর মধ্যে প্রায় লিনিয়ার (প্রায় 0 টি বাদে) সম্পর্ক স্থাপন করতে পারি ), এবং সিমুলেশনগুলির সংখ্যা যথেষ্ট বেশি ছিল যে শব্দটি খুব কম - আমরা কেবলমাত্র বর্তমান উদ্দেশ্যে এটি উপেক্ষা করতে পারি।
সুতরাং আমরা কেবল লিনিয়ার ইন্টারপোলেশন ব্যবহার করতে পারি। আপনার নমুনা আকারে 50% এবং 80% পাওয়ারের জন্য আনুমানিক প্রভাব আকারগুলি নীচে দেখানো হয়েছে:
অন্যদিকে প্রভাব আকারগুলি (বৃহত্তর গোষ্ঠীর আরও ছোট স্কেল রয়েছে) কেবল এটি থেকে সামান্য স্থানান্তরিত হয় (ভগ্নাংশের চেয়ে ছোট প্রভাবের আকার তুলতে পারে) তবে এতে কিছুটা পার্থক্য আসে, সুতরাং আমি বিন্দুটি পরিশ্রম করব না।
সুতরাং পরীক্ষাটি যথেষ্ট পার্থক্য গ্রহণ করবে (1 এর স্কেলগুলির অনুপাত থেকে), তবে একটি ছোট নয়।
এখন কিছু মন্তব্যের জন্য: আমি মনে করি না অনুমানের পরীক্ষাগুলি আগ্রহের অন্তর্নিহিত প্রশ্নের সাথে বিশেষভাবে প্রাসঙ্গিক ( তারা কি যথেষ্ট মিল? ) এবং ফলস্বরূপ এই শক্তি গণনাগুলি আমাদের সেই প্রশ্নের সাথে সরাসরি প্রাসঙ্গিক কিছু বলে না।
আমি মনে করি আপনি "মূলত একই" হিসাবে কী বোঝেন তার পূর্বনির্ধারনের মাধ্যমে আপনি আরও কার্যকর প্রশ্নটির সমাধান করেছেন যা কার্যত কার্যকর হয়। এটি - একটি পরিসংখ্যানগত ক্রিয়াকলাপের জন্য যৌক্তিকভাবে অনুসরণ করা - এর ফলে ডেটাগুলির অর্থপূর্ণ বিশ্লেষণের দিকে নিয়ে যাওয়া উচিত।