তলদেশের সরুরেখা
সত্য (পিয়ারসন) পারস্পরিক সম্পর্কের সহগটি নমুনার আকার বৃদ্ধির সাথে সাথে শূন্যের তুলনায় শূন্যের এই অনুমানটিকে প্রত্যাখ্যান করার জন্য প্রয়োজনীয় নমুনা পারস্পরিক সম্পর্কের সহগটি হ'ল। সুতরাং, সাধারণভাবে, না, আপনি একই সাথে একটি বৃহত ( প্রস্থে ) পারস্পরিক সম্পর্ক সহগ এবং একসাথে বড় মূল্য রাখতে পারবেন নাপি ।
শীর্ষ লাইন (বিশদ)
ফাংশনে পিয়ারসন পারস্পরিক সম্পর্কের সহগের জন্য ব্যবহৃত পরীক্ষাটি আমি নীচে আলোচনা করা পদ্ধতির একটি খুব সামান্য পরিবর্তিত সংস্করণ।আরcor.test
ধরুন পারস্পরিক সম্পর্ক সঙ্গে IID bivariate স্বাভাবিক র্যান্ডম ভেক্টর হয় ρ । আমরা নাল কল্পনা পরীক্ষা করতে চাই যে ρ = 0 বনাম ρ ≠ 0 । যাক দ নমুনা পারস্পরিক সম্পর্কের সহগের হও। স্ট্যান্ডার্ড লিনিয়ার-রিগ্রেশন তত্ত্বটি ব্যবহার করে, পরীক্ষার পরিসংখ্যান, T = r show দেখানো কঠিন নয়
√( এক্স1, Y1) , ( এক্স2, Y2) , … , ( এক্সএন, Yএন)ρ। = 0। ≠ 0R নাল অনুমানের অধীনে
একটিটিn-2বিতরণ রয়েছে। বড়এন এর জন্য,টিএন-2বিতরণটি স্ট্যান্ডার্ড স্বাভাবিকের কাছে চলে আসে। অতএবটি2প্রায় এক ডিগ্রি স্বাধীনতার সাথে চি-স্কোয়ার বিতরণ করা হয়। (অনুমানের অধীনে আমরা তৈরি করেছি,টি2~এফ1,এন-2বাস্তবতা কিন্তুχ21পড়তা পরিষ্কার করে তোলে কি, চলছে আমার মনে হয়।)
টি= আর এন - 2-----√( 1 - আর2)------√
টিn - 2এনটিn - 2টি2টি2। চ1 , এন - 2χ21
সুতরাং,
যেখানে কুই 1 - α হয় ( 1 - α ) স্বাধীনতার এক ডিগ্রি সঙ্গে একটি চি-স্কোয়ারড বিতরণের সমাংশক।
পি ( আর21 - আর2( n - 2 ) ≥ কিউ1 - α) ≈α,
কুই1 - α( 1 - α )
এখন লক্ষ করুন যে r 2 বৃদ্ধি পাওয়ার সাথে সাথে বৃদ্ধি পাচ্ছে । সম্ভাব্যতা বিবৃতিতে পরিমাণ পুনরায় সজ্জিত করা, আমরা যে আছে সব জন্য
| r | । 1R2/ (1- আর2)R2
আমরা পর্যায়ে নাল হাইপোথিসিস একটি প্রত্যাখ্যানের পাবেনα। স্পষ্টতই ডান হাতnসহ হ্রাস পায়।
| r | । 11 + ( এন - 2 ) / কিউ1 - α-------------√
αএন
একটি জমি
এখানে প্রত্যাখ্যানের অঞ্চলের একটা চক্রান্ত নমুনা আকার একটি ফাংশন হিসাবে। সুতরাং, উদাহরণস্বরূপ, যখন নমুনার আকার 100 এর বেশি হয়ে যায়, তখন absolute = 0.05 স্তরে নালটিকে প্রত্যাখ্যান করার জন্য (নিরঙ্কুশ) পারস্পরিক সম্পর্ক প্রায় 0.2 হতে হবে ।| r |। = 0.05
একটি অনুকরণ
সঠিক পারস্পরিক সম্পর্ক সহগের সাথে শূন্য-গড় ভেক্টরগুলির একটি জোড়া উত্পন্ন করার জন্য আমরা একটি সাধারণ সিমুলেশন করতে পারি । নীচে কোড দেওয়া আছে। এটি থেকে আমরা এর আউটপুট দেখতে পারি cor.test
।
k <- 100
n <- 4*k
# Correlation that gives an approximate p-value of 0.05
# Change 0.05 to some other desired p-value to get a different curve
pval <- 0.05
qval <- qchisq(pval,1,lower.tail=F)
rho <- 1/sqrt(1+(n-2)/qval)
# Zero-mean orthogonal basis vectors
b1 <- rep(c(1,-1),n/2)
b2 <- rep(c(1,1,-1,-1),n/4)
# Construct x and y vectors with mean zero and an empirical
# correlation of *exactly* rho
x <- b1
y <- rho * b1 + sqrt(1-rho^2) * b2
# Do test
ctst <- cor.test(x,y)
মন্তব্যে অনুরোধ করা হয়েছে, এখানে প্লটটি পুনরুত্পাদন করার কোড রয়েছে যা উপরের কোডটি অনুসরণ করে অবিলম্বে চালানো যেতে পারে (এবং সেখানে বর্ণিত কয়েকটি ভেরিয়েবল ব্যবহার করে)।
png("cortest.png", height=600, width=600)
m <- 3:1000
yy <- 1/sqrt(1+(m-2)/qval)
plot(m, yy, type="l", lwd=3, ylim=c(0,1),
xlab="sample size", ylab="correlation")
polygon( c(m[1],m,rev(m)[1]), c(1,yy,1), col="lightblue2", border=NA)
lines(m,yy,lwd=2)
text(500, 0.5, "p < 0.05", cex=1.5 )
dev.off()