preliminaries:
জি * পাওয়ার ম্যানুয়ালটিতে আলোচিত হিসাবে , আপনি কী সমাধান করতে চান তার উপর নির্ভর করে বিভিন্ন ধরণের পাওয়ার বিশ্লেষণ রয়েছে। (এটি, , এফেক্ট আকারের , এবং পাওয়ার একে অপরের সাথে সম্পর্কযুক্ত; এর মধ্যে তিনটি নির্দিষ্ট করে দেওয়া আপনাকে চতুর্থটির জন্য সমাধান করতে দেবে)) ই এস αএনইএসα
- আপনার বিবরণে, আপনি , এবং পাওয়ার = 80% দিয়ে নির্দিষ্ট করেছেন প্রতিক্রিয়া হারগুলি ক্যাপচার করতে আপনি উপযুক্ত জানতে চান । এটি একটি অগ্রাধিকার শক্তি । α = .05এনα = .05
- আমরা ধারণ -পরবর্তী শক্তি দিয়ে শুরু করতে পারি (প্রদত্ত , প্রতিক্রিয়া হার এবং আলফা প্রদত্ত শক্তি নির্ধারণ করুন ) কারণ এটি ধারণাটি সহজতর, এবং তারপরে উপরের দিকে সরানো যেতে পারেএন
@ গ্রেগসনোর দুর্দান্ত পোস্টের পাশাপাশি , সিভিতে সিমুলেশন-ভিত্তিক পাওয়ার বিশ্লেষণের জন্য আরও একটি দুর্দান্ত গাইড এখানে পাওয়া যাবে: পরিসংখ্যানগত শক্তির গণনা করা । প্রাথমিক ধারণাগুলির সংক্ষিপ্তসার হিসাবে:
- আপনি সনাক্ত করতে সক্ষম হতে চান প্রভাব চিহ্নিত করুন
- সেই সম্ভাব্য পৃথিবী থেকে এন ডেটা তৈরি করুন
- সেই ভুল তথ্যকে নিয়ে পরিচালনা করার আপনি যে বিশ্লেষণটি চালাচ্ছেন তা চালান
- ফলাফলগুলি আপনার নির্বাচিত আলফা অনুযায়ী 'তাৎপর্যপূর্ণ' কিনা তা সঞ্চয় করুন
- অনেকগুলি ( ) বার পুনরাবৃত্তি করুন এবং সেই এর (উত্তর-পরবর্তী) পাওয়ার অনুমান হিসাবে% 'উল্লেখযোগ্য' ব্যবহার করুনএনB ইংরেজী বর্ণমালার দ্বিতীয় অক্ষরN
- প্রাক-অগ্রাধিকার শক্তি নির্ধারণ করতে, আপনার কাঙ্ক্ষিত শক্তি উত্পাদন করে এমন মান খুঁজে পেতে সম্ভাব্য এর অনুসন্ধান করুন N
আপনি যদি কোনও নির্দিষ্ট পুনরাবৃত্তির উপর তাত্পর্য খুঁজে পাবেন কিনা তা সম্ভাব্যতা (যেখানে হল শক্তি) দিয়ে বার্নোল্লি পরীক্ষার ফলাফল হিসাবে বোঝা যাবে । পুনরাবৃত্তির উপর যে অনুপাত পাওয়া যায় তা আমাদের সত্যিকারের অনুমান করতে দেয় । আরও ভাল অনুমানের জন্য, আমরা বাড়াতে পারি , যদিও এটি সিমুলেশনটি আরও বেশি সময় নিতে পারে। পি বি পি বিppBpB
আর-তে, 'সাফল্যের' প্রদত্ত সম্ভাব্যতা সহ বাইনারি ডেটা উত্পন্ন করার প্রাথমিক উপায় হ'ল rbinom
- উদাহরণস্বরূপ, সম্ভাব্যতা পি সহ 10 বার্নোল্লি ট্রায়ালের মধ্যে সাফল্যের সংখ্যা পেতে কোডটি হবে
rbinom(n=10, size=1, prob=p)
, (আপনি সম্ভবত ফলাফলটি কোনও পরিবর্তনশীলকে স্টোরেজের জন্য নির্ধারণ করতে চাইবেন)
- আপনি যেমন রনিফ , উদাহরণস্বরূপ, ব্যবহার করে কম মার্জিতভাবে এ জাতীয় ডেটা তৈরি করতে পারেন ,
ifelse(runif(1)<=p, 1, 0)
- যদি আপনি বিশ্বাস করেন যে ফলাফলগুলি একটি সুপ্ত গাউসিয়ান ভেরিয়েবল দ্বারা মধ্যস্থতা লাভ করে, আপনি ? rnorm দিয়ে আপনার covariates এর একটি ফাংশন হিসাবে সুপ্ত পরিবর্তনশীল তৈরি করতে পারেন এবং তারপরে সেগুলি সম্ভাব্যতায় রূপান্তর করতে
pnorm()
পারেন এবং আপনার কোডটিতে সেগুলি ব্যবহার করতে পারেন rbinom()
।
আপনি উল্লেখ করেছেন যে কোনও বক্রতার জন্য অ্যাকাউন্টে আপনি "বহুবচনীয় শব্দ ভার 1 * ভার 1 অন্তর্ভুক্ত করবেন"। এখানে একটা বিভ্রান্তি রয়েছে; বহুবর্ষীয় পদগুলি বক্রতার জন্য অ্যাকাউন্টে সহায়তা করতে পারে তবে এটি একটি ইন্টারঅ্যাকশন শব্দ - এটি আমাদের এইভাবে সহায়তা করবে না। তবুও, আপনার প্রতিক্রিয়া হারগুলির জন্য আমাদের মডেলটিতে স্কোয়ার শর্তাদি এবং ইন্টারঅ্যাকশন শর্তাদি উভয়ই অন্তর্ভুক্ত করা প্রয়োজন। বিশেষত, আপনার মডেলটির মূল শর্তগুলি ছাড়িয়ে : , , এবং অন্তর্ভুক্ত করতে হবে । v a r 1 ∗ v a r 2 v a r 1 2 ∗ v a r 2var12var1∗var2var12∗var2
- যদিও একটি ভিন্ন প্রশ্নের প্রসঙ্গে লেখা হয়েছে, আমার উত্তর এখানে: লজিট এবং প্রবিট মডেলগুলির মধ্যে পার্থক্য নিয়ে এই ধরণের মডেলগুলির সম্পর্কে প্রচুর প্রাথমিক তথ্য রয়েছে।
ঠিক যেমন বিভিন্ন ধরণের আছে প্রকার আমি ভুল হার যখন সেখানে একাধিক অনুমানের (যেমন, হয় প্রতি-এর বিপরীতে ত্রুটি হার , familywise ত্রুটি হার , & প্রতি পরিবার ত্রুটি হার ), তাই (শক্তি * এর বিভিন্ন ধরণের যেমন, জন্য একটি একক প্রাক-নির্দিষ্ট প্রভাব , কোনও প্রভাবের জন্য এবং সমস্ত প্রভাবের জন্য )। আপনি প্রভাবগুলির একটি নির্দিষ্ট সংমিশ্রণ সনাক্ত করতে বা সামগ্রিকভাবে মডেলের একসাথে পরীক্ষার শক্তির জন্যও অনুসন্ধান করতে পারেন। আপনার এসএএস কোড সম্পর্কে আপনার বর্ণনা থেকে আমার ধারণা এটি পরবর্তীটির সন্ধান করছে। তবে আপনার অবস্থার বর্ণনা থেকে আমি ধরে নিচ্ছি যে আপনি কমপক্ষে ইন্টারঅ্যাকশন প্রভাবগুলি সনাক্ত করতে চান।
- * রেফারেন্স: ম্যাক্সওয়েল, এসই (2004)। মনস্তাত্ত্বিক গবেষণায় নিম্ন বিদ্যুতের অধ্যয়নের জেদ: কারণ, পরিণতি এবং প্রতিকার ies মানসিক পদ্ধতি , 9 , 2 , পৃষ্ঠা 147-163।
- আপনার প্রভাবগুলি খুব ছোট (কম প্রতিক্রিয়া হারের সাথে বিভ্রান্ত হওয়ার দরকার নেই), সুতরাং আমরা ভাল শক্তি অর্জন করতে অসুবিধে করব।
- দ্রষ্টব্য, যদিও এই সমস্তগুলি মোটামুটি একইরকম, তবে এগুলি খুব বেশি একই নয় (উদাহরণস্বরূপ, কোনও উল্লেখযোগ্য প্রভাব ছাড়াই একটি উল্লেখযোগ্য মডেল পাওয়া খুব সম্ভব - এখানে আলোচনা করা হয়েছে: কীভাবে কোনও রিগ্রেশন তাৎপর্যপূর্ণ হতে পারে তবে সমস্ত ভবিষ্যদ্বাণীকারী অ- উল্লেখযোগ্য?, বা উল্লেখযোগ্য প্রভাব তবে যেখানে মডেলটি তাত্পর্যপূর্ণ নয় - এখানে আলোচনা করা হয়েছে: রৈখিক প্রতিরোধের সহগের তাত্পর্য: উল্লেখযোগ্য টি-পরীক্ষা বনাম অ-উল্লেখযোগ্য এফ-স্ট্যাটিস্টিক ), যা নীচে চিত্রিত হবে।
পাওয়ার সম্পর্কিত সমস্যাগুলি সম্পর্কে চিন্তাভাবনা করার জন্য, আমার উত্তরটি এখানে দেখুন: নমুনার আকারকে ন্যায্য প্রমাণের প্রসঙ্গে পারস্পরিক সম্পর্কের অনুমানের ক্ষেত্রে সাধারণ নির্ভুলতার প্রতিবেদন কীভাবে করা যায়।
আর-তে লজিস্টিক রিগ্রেশনের জন্য সাধারণ পোস্ট-হক শক্তি:
ধরা যাক আপনার পোস্ট হওয়া প্রতিক্রিয়া হার বিশ্বের সত্যিকারের পরিস্থিতিকে উপস্থাপন করে এবং আপনি 10,000 টি চিঠি প্রেরণ করেছিলেন। এই প্রভাবগুলি সনাক্ত করার শক্তি কী? (নোট করুন যে আমি "কমিক্যালি অদক্ষ" কোড লেখার জন্য বিখ্যাত, নিম্নলিখিতটি দক্ষতার জন্য অনুকূলিত না হয়ে অনুসরণ করা সহজতর উদ্দেশ্য; বাস্তবে এটি বেশ ধীর গতির)
set.seed(1)
repetitions = 1000
N = 10000
n = N/8
var1 = c( .03, .03, .03, .03, .06, .06, .09, .09)
var2 = c( 0, 0, 0, 1, 0, 1, 0, 1)
rates = c(0.0025, 0.0025, 0.0025, 0.00395, 0.003, 0.0042, 0.0035, 0.002)
var1 = rep(var1, times=n)
var2 = rep(var2, times=n)
var12 = var1**2
var1x2 = var1 *var2
var12x2 = var12*var2
significant = matrix(nrow=repetitions, ncol=7)
startT = proc.time()[3]
for(i in 1:repetitions){
responses = rbinom(n=N, size=1, prob=rates)
model = glm(responses~var1+var2+var12+var1x2+var12x2,
family=binomial(link="logit"))
significant[i,1:5] = (summary(model)$coefficients[2:6,4]<.05)
significant[i,6] = sum(significant[i,1:5])
modelDev = model$null.deviance-model$deviance
significant[i,7] = (1-pchisq(modelDev, 5))<.05
}
endT = proc.time()[3]
endT-startT
sum(significant[,1])/repetitions # pre-specified effect power for var1
[1] 0.042
sum(significant[,2])/repetitions # pre-specified effect power for var2
[1] 0.017
sum(significant[,3])/repetitions # pre-specified effect power for var12
[1] 0.035
sum(significant[,4])/repetitions # pre-specified effect power for var1X2
[1] 0.019
sum(significant[,5])/repetitions # pre-specified effect power for var12X2
[1] 0.022
sum(significant[,7])/repetitions # power for likelihood ratio test of model
[1] 0.168
sum(significant[,6]==5)/repetitions # all effects power
[1] 0.001
sum(significant[,6]>0)/repetitions # any effect power
[1] 0.065
sum(significant[,4]&significant[,5])/repetitions # power for interaction terms
[1] 0.017
সুতরাং আমরা দেখতে পাই যে 10,000 টি বর্ণচিহ্ন এই প্রতিক্রিয়া হারগুলি সনাক্ত করতে সত্যই 80% শক্তি (কোনও ধরণের) অর্জন করে না। (এসএএস কোডটি এই পদ্ধতির মধ্যে সম্পূর্ণ তাত্পর্যটি ব্যাখ্যা করতে সক্ষম হওয়ায় আমি যথেষ্ট পরিমাণে নিশ্চিত নই, তবে এই কোডটি ধারণাগতভাবে সোজা - যদি ধীর হয় - এবং আমি এটি যাচাই করতে কিছুটা সময় ব্যয় করেছি এবং আমার মনে হয় এগুলি ফলাফল যুক্তিসঙ্গত।)
লজিস্টিক রিগ্রেশনটির জন্য সিমুলেশন-ভিত্তিক একটি-প্রাইমারী শক্তি:
এখান থেকে ধারণাটি কেবল সম্ভাব্য অনুসন্ধান অনুসন্ধান করা যতক্ষণ না আমরা এমন কোনও মান খুঁজে পাই যা আপনি আগ্রহী সে ধরণের পাওয়ারের পছন্দসই স্তরটি প্রদান করে। এটির সাথে কাজ করার জন্য যে কোনও অনুসন্ধান কৌশল আপনি কোড আপ করতে পারেন তা ঠিক থাকবে (মধ্যে তত্ত্ব)। প্রদত্ত এর যে এই ধরনের ছোট প্রভাব ক্যাপচার করার প্রয়োজন হতে করতে যাচ্ছি, তা কিভাবে এই আরো দক্ষতার সঙ্গে কাজ করতে সম্পর্কে মূল্য চিন্তা হয়। আমার সাধারণ পদ্ধতিটি কেবল নিষ্ঠুর শক্তি, অর্থাত্ প্রতিটি মূল্যায়ন করার জন্য যা আমি যুক্তিযুক্তভাবে বিবেচনা করতে পারি। (তবে নোট করুন, আমি সাধারণত কেবল একটি ছোট পরিসীমা বিবেচনা করব এবং আমি খুব কম সাথে কাজ করছি - কমপক্ষে এর তুলনায়।) এন এন এনNNNN
পরিবর্তে, এখানে আমার কৌশলটি ছিল সম্ভাব্য এর ব্র্যাককেট করার জন্য ক্ষমতার পরিসীমা কী হবে তা উপলব্ধি করা। সুতরাং, আমি 500,000 এর একটি বেছে নিয়েছি এবং কোডটি পুনরায় চালিয়েছি (একই বীজের সূচনা করে, এনবি এটি চালাতে দেড় ঘন্টা সময় নিয়েছিল)। ফলাফল এখানে: এনNN
sum(significant[,1])/repetitions # pre-specified effect power for var1
[1] 0.115
sum(significant[,2])/repetitions # pre-specified effect power for var2
[1] 0.091
sum(significant[,3])/repetitions # pre-specified effect power for var12
[1] 0.059
sum(significant[,4])/repetitions # pre-specified effect power for var1X2
[1] 0.606
sum(significant[,5])/repetitions # pre-specified effect power for var12X2
[1] 0.913
sum(significant[,7])/repetitions # power for likelihood ratio test of model
[1] 1
sum(significant[,6]==5)/repetitions # all effects power
[1] 0.005
sum(significant[,6]>0)/repetitions # any effect power
[1] 0.96
sum(significant[,4]&significant[,5])/repetitions # power for interaction terms
[1] 0.606
আমরা এগুলি থেকে দেখতে পাচ্ছি যে আপনার প্রভাবগুলির মাত্রার পরিমাণে যথেষ্ট পরিমাণে পার্থক্য রয়েছে এবং এইভাবে এগুলি সনাক্ত করার আপনার ক্ষমতা বিভিন্ন হয়। উদাহরণস্বরূপ, এর প্রভাবটি সনাক্ত করা বিশেষত কঠিন, অর্ধ মিলিয়ন অক্ষর সহকারে কেবলমাত্র 6% সময় উল্লেখযোগ্য। অন্যদিকে, সামগ্রিকভাবে মডেলটি নাল মডেলের চেয়ে সর্বদা উল্লেখযোগ্যভাবে ভাল ছিল। অন্যান্য সম্ভাবনাগুলি মাঝখানে সাজানো আছে। যদিও প্রতিটি পুনরাবৃত্তির উপরে বেশিরভাগ 'ডেটা' ফেলে দেওয়া হয়, তবুও বেশ কিছু ভাল অনুসন্ধান এখনও সম্ভব। উদাহরণস্বরূপ, আমরা ম্যাট্রিক্সটি বিভিন্ন ভেরিয়েবলের সম্ভাব্যতার মধ্যে পারস্পরিক সম্পর্কের তাৎপর্যগুলি মূল্যায়নের জন্য মূল্যায়ন করতে পারি। var12significant
আমার উপসংহারে উল্লেখ করা উচিত, আপনার পরিস্থিতিতে জটিলতা এবং বৃহত্তর জড়িত থাকার কারণে, এটি আমার প্রাথমিক মন্তব্যে সন্দেহ / দাবি করার মতো সহজ ছিল না। যাইহোক, আমি কীভাবে এখানে রেখেছি তা থেকে কীভাবে এটি সাধারণভাবে করা যায় এবং শক্তি বিশ্লেষণে জড়িত সমস্যাগুলি সম্পর্কে আপনি অবশ্যই ধারণা পেতে পারেন। আছে HTH। N