স্টিফান কোলাসার পোস্টটি অনুসরণ করে (আমি এটিকে কোনও মন্তব্য হিসাবে যুক্ত করতে পারি না), সিমুলেশনের জন্য আমার কাছে কিছু বিকল্প কোড রয়েছে। এটি একই বেসিক কাঠামোটি ব্যবহার করে তবে এটি আরও কিছুটা বিস্ফোরিত হয়, তাই সম্ভবত এটি পড়া সহজ। এটি লজিস্টিক রিগ্রেশন অনুকরণ করার জন্য ক্লিনম্যান এবং হর্টনের কোডের উপর ভিত্তি করে ।
নমুনা মধ্যে এনএন হয়। কোভেরিয়েটটি নিয়মিতভাবে বিতরণ করা উচিত এবং 0 এবং এসডি 1 মানে মানিক করা উচিত We আমরা এটি তৈরি করতে rnorm (nn) ব্যবহার করি। আমরা একটি বিজোড় অনুপাত নির্বাচন করি এবং এটি বিজোড়.রেটিওতে সঞ্চয় করি। আমরা ইন্টারসেপ্টের জন্য একটি সংখ্যা বাছাই করি। এই সংখ্যার পছন্দ "ইভেন্ট" এর নমুনার অনুপাতের অনুপাতটি নিয়ন্ত্রণ করে (উদাহরণস্বরূপ, 0.1, 0.4, 0.5)। আপনি সঠিক অনুপাত না পাওয়া পর্যন্ত আপনাকে এই সংখ্যাটি নিয়ে খেলতে হবে। নিম্নলিখিত কোডটি আপনাকে 950 এর একটি নমুনা আকার এবং 1.5 এর একটি ওআর সঙ্গে 0.1 অনুপাত দেয়:
nn <- 950
runs <- 10000
intercept <- log(9)
odds.ratio <- 1.5
beta <- log(odds.ratio)
proportion <- replicate(
n = runs,
expr = {
xtest <- rnorm(nn)
linpred <- intercept + (xtest * beta)
prob <- exp(linpred)/(1 + exp(linpred))
runis <- runif(length(xtest),0,1)
ytest <- ifelse(runis < prob,1,0)
prop <- length(which(ytest <= 0.5))/length(ytest)
}
)
summary(proportion)
সারাংশ (অনুপাত) নিশ্চিত করে যে অনুপাতটি 0.1 ডলার
তারপরে একই ভেরিয়েবলগুলি ব্যবহার করে পাওয়ারটি 10000 রানের বেশি গণনা করা হয়:
result <- replicate(
n = runs,
expr = {
xtest <- rnorm(nn)
linpred <- intercept + (xtest * beta)
prob <- exp(linpred)/(1 + exp(linpred))
runis <- runif(length(xtest),0,1)
ytest <- ifelse(runis < prob,1,0)
summary(model <- glm(ytest ~ xtest, family = "binomial"))$coefficients[2,4] < .05
}
)
print(sum(result)/runs)
আমি মনে করি যে এই কোডটি সঠিক - আমি ১৯৯৯ সালে সিসিহ (টেবিল ২) এ দেওয়া উদাহরণগুলির বিরুদ্ধে এটি পরীক্ষা করে দেখেছি এবং এটি সেখানে দেওয়া তিনটি উদাহরণের সাথে একমত বলে মনে হচ্ছে। আমি হোসমার এবং লেমেশোর পৃষ্ঠা 342 - 343-তে উদাহরণটির বিপরীতেও এটি পরীক্ষা করেছি, যেখানে এটি 0.75 পাওয়ার (হোসমার এবং লেমেশোর ০.৮ এর তুলনায়) পাওয়া গেছে। সুতরাং এটি হতে পারে যে কিছু পরিস্থিতিতে এই পদ্ধতির ক্ষমতাকে অবমূল্যায়ন করা হয়। যাইহোক, যখন আমি এই অন-লাইন ক্যালকুলেটরে একই উদাহরণটি চালিয়েছি , আমি দেখতে পেয়েছি যে এটি আমার সাথে একমত এবং হোসমার এবং লেমশোতে ফলাফল নয়।
কেস কেন এটি আমাদের যদি বলতে পারেন তবে আমি তা জানতে আগ্রহী।