@ অ্যাক্রামের পদ্ধতি অবশ্যই কার্যকর হবে। নির্ভরতা বৈশিষ্ট্যের ক্ষেত্রে এটি যদিও কিছুটা সীমাবদ্ধ।
আর একটি পদ্ধতি হ'ল যৌথ বিতরণ করার জন্য একটি কপুলা ব্যবহার করা। আপনি সাফল্য এবং বয়সের জন্য প্রান্তিক বিতরণ নির্দিষ্ট করতে পারেন (যদি আপনার বিদ্যমান ডেটা থাকে তবে এটি বিশেষত সহজ) এবং একটি কপুলার পরিবার। কোপুলার প্যারামিটারগুলি পরিবর্তিত করা নির্ভরশীলতার বিভিন্ন ডিগ্রি অর্জন করবে এবং বিভিন্ন কপুলার পরিবার আপনাকে বিভিন্ন নির্ভরতা সম্পর্ক দেবে (যেমন শক্তিশালী উপরের লেজের নির্ভরতা)।
কপুলা প্যাকেজের মাধ্যমে আর-এ এটি করার সাম্প্রতিক একটি সংক্ষিপ্ত বিবরণ এখানে উপলভ্য । অতিরিক্ত প্যাকেজগুলির জন্য সেই কাগজে আলোচনাটি দেখুন।
আপনার অগত্যা পুরো প্যাকেজটির প্রয়োজন নেই; গাউসিয়ান কপুলা, প্রান্তিক সাফল্যের সম্ভাবনা 0.6 এবং গামা বিতরণকৃত বয়সগুলি ব্যবহার করে এখানে একটি সাধারণ উদাহরণ। নির্ভরতা নিয়ন্ত্রণ করতে বিভিন্ন পরিবর্তিত হয়।
r = 0.8 # correlation coefficient
sigma = matrix(c(1,r,r,1), ncol=2)
s = chol(sigma)
n = 10000
z = s%*%matrix(rnorm(n*2), nrow=2)
u = pnorm(z)
age = qgamma(u[1,], 15, 0.5)
age_bracket = cut(age, breaks = seq(0,max(age), by=5))
success = u[2,]>0.4
round(prop.table(table(age_bracket, success)),2)
plot(density(age[!success]), main="Age by Success", xlab="age")
lines(density(age[success]), lty=2)
legend('topright', c("Failure", "Success"), lty=c(1,2))
আউটপুট:
টেবিল:
success
age_bracket FALSE TRUE
(0,5] 0.00 0.00
(5,10] 0.00 0.00
(10,15] 0.03 0.00
(15,20] 0.07 0.03
(20,25] 0.10 0.09
(25,30] 0.07 0.13
(30,35] 0.04 0.14
(35,40] 0.02 0.11
(40,45] 0.01 0.07
(45,50] 0.00 0.04
(50,55] 0.00 0.02
(55,60] 0.00 0.01
(60,65] 0.00 0.00
(65,70] 0.00 0.00
(70,75] 0.00 0.00
(75,80] 0.00 0.00