দ্বিপদী ভেরিয়েবলগুলি সাধারণত স্বতন্ত্র বার্নোল্লি ভেরিয়েবলগুলি যোগ করে তৈরি হয়। আসুন আমরা দেখুন যে আমরা কোনও জোড়া লাগানো বার্নোল্লি ভেরিয়েবল দিয়ে শুরু করতে পারি এবং একই জিনিসটি করতে পারি।(X,Y)
ধরা যাক একটি বার্নোল্লি ( পি ) ভেরিয়েবল ( অর্থাত্ প্রি ( এক্স = 1 ) = পি এবং জনসংযোগ ( এক্স = 0 ) = 1 - পি ) এবং ওয়াই একটি বার্নোল্লি ( কিউ ) পরিবর্তনশীল। তাদের যৌথ বিতরণটি পিন করতে আমাদের ফলাফলের চারটি সংমিশ্রণ নির্দিষ্ট করতে হবে। লেখার জন্য প্রি ( ( এক্স , ওয়াই ) = ( 0 , 0 ) ) =X(p)Pr(X=1)=pPr(X=0)=1−pY(q) আমরা সম্ভাব্যতার অক্ষগুলি থেকে সহজেই বাকীগুলি বের করতে পারি: প্রি ( ( এক্স , ওয়াই ) = ( 1 , 0 ) ) = 1 - কিউ - এ ,
জনসংযোগ ( ( এক্স, Y) = ( 0 , 0 ) ) = ক ,
জনসংযোগ ( ( এক্স, Y) = ( 1 , 0 ) ) = 1 - কিউ- ক ,জনসংযোগ ( ( এক্স, Y) = ( 0 , 1 ) ) = 1 - পি - এ ,জনসংযোগ ( ( এক্স, Y) = ( 1 , 1 ) ) = এ + পি + কিউ- 1।
পারস্পরিক সম্পর্কের সহগের জন্য সূত্র এই প্লাগিং এবং সমাধানে দেয় একটি = ( 1 - পি ) ( 1 - কুই ) + + ρ √ρ
a = ( 1 - পি ) ( 1 - কিউ )) + ρ পি কিউ( 1 - পি ) ( 1 - কিউ)-------------√।(1)
প্রদত্ত চারটি সম্ভাব্যতা নেতিবাচক নয়, এটি একটি বৈধ যৌথ বন্টন দেবে - এবং এই সমাধানটি সমস্ত বিভাজনীয় বার্নোল্লি বিতরণকে প্যারামিটারাইজ করে । (যখন , 1 - 1 এবং 1 এর মধ্যে সমস্ত গাণিতিক অর্থপূর্ণ পারস্পরিক সম্পর্কগুলির জন্য একটি সমাধান রয়েছে )) আমরা যখন এই ভেরিয়েবলগুলির n যোগ করি তখন পারস্পরিক সম্পর্ক একই থাকে - তবে এখন প্রান্তিক বিতরণগুলি দ্বিপদী ( এন , পি ) এবং দ্বিপদী ( এন , কিউ ) , পছন্দসই হিসাবে।p = q- 11এন( এন , পি )( এন , কিউ))
উদাহরণ
n = 10পি = 1 / 3কুই= 3 / 4ρ = - 4 / 5( 1 )a = 0.003367350,2470,6630,0871000
লাল রেখাগুলি নমুনার মাধ্যমকে নির্দেশ করে এবং বিন্দুযুক্ত রেখাটি হল রিগ্রেশন লাইন। এগুলি সমস্ত তাদের উদ্দেশ্যযুক্ত মানগুলির কাছাকাছি। ওভারল্যাপগুলি সমাধান করার জন্য পয়েন্টগুলিতে এ চিত্রটিতে এলোমেলোভাবে ঝাঁকুনি দেওয়া হয়েছে: সর্বোপরি, দ্বিপদী বিতরণগুলি কেবলমাত্র অবিচ্ছেদ্য মানগুলি তৈরি করে, তাই সেখানে প্রচুর পরিমাণে ওভারপ্লোটিং হবে।
এন{ 1 , 2 , 3 , 4 }1( 0 , 0 )2( 1 , 0 )3( 0 , 1 )4( 1 , 1 )( এক্স, Y)
কোড
এখানে একটি R
বাস্তবায়ন।
#
# Compute Pr(0,0) from rho, p=Pr(X=1), and q=Pr(Y=1).
#
a <- function(rho, p, q) {
rho * sqrt(p*q*(1-p)*(1-q)) + (1-p)*(1-q)
}
#
# Specify the parameters.
#
n <- 10
p <- 1/3
q <- 3/4
rho <- -4/5
#
# Compute the four probabilities for the joint distribution.
#
a.0 <- a(rho, p, q)
prob <- c(`(0,0)`=a.0, `(1,0)`=1-q-a.0, `(0,1)`=1-p-a.0, `(1,1)`=a.0+p+q-1)
if (min(prob) < 0) {
print(prob)
stop("Error: a probability is negative.")
}
#
# Illustrate generation of correlated Binomial variables.
#
set.seed(17)
n.sim <- 1000
u <- sample.int(4, n.sim * n, replace=TRUE, prob=prob)
y <- floor((u-1)/2)
x <- 1 - u %% 2
x <- colSums(matrix(x, nrow=n)) # Sum in groups of `n`
y <- colSums(matrix(y, nrow=n)) # Sum in groups of `n`
#
# Plot the empirical bivariate distribution.
#
plot(x+rnorm(length(x), sd=1/8), y+rnorm(length(y), sd=1/8),
pch=19, cex=1/2, col="#00000010",
xlab="X", ylab="Y",
main=paste("Correlation is", signif(cor(x,y), 3)))
abline(v=mean(x), h=mean(y), col="Red")
abline(lm(y ~ x), lwd=2, lty=3)