একটি উচ্চ পি মান সহ দৃ strong় সম্পর্কের সহগের উদাহরণ


21

আমি ভাবছিলাম, একটি উচ্চ পি মান (বলুন .25 বা উচ্চতর) দিয়ে খুব শক্তিশালী পারস্পরিক সম্পর্ক সহগ (বলুন .9 বা উচ্চতর) পাওয়া কি সম্ভব?

এখানে একটি উচ্চ পি মান সহ একটি স্বল্প সম্পর্কের সহগের উদাহরণ:

set.seed(10)
y <- rnorm(100)
x <- rnorm(100)+.1*y
cor.test(x,y)

কর = 0.03908927, পি = 0.6994

উচ্চ সম্পর্কের সহগ, কম পি মান:

y <- rnorm(100)
x <- rnorm(100)+2*y
cor.test(x,y)

কর = 0.8807809, পি = 2.2 ই -16

নিম্ন সম্পর্কের সহগ, কম পি মান:

y <- rnorm(100000)
x <- rnorm(100000)+.1*y
cor.test(x,y)

কর = 0.1035018, পি = 2.2 ই -16

উচ্চ সম্পর্কের সহগ, উচ্চ পি মান: ???

উত্তর:


36

তলদেশের সরুরেখা

সত্য (পিয়ারসন) পারস্পরিক সম্পর্কের সহগটি নমুনার আকার বৃদ্ধির সাথে সাথে শূন্যের তুলনায় শূন্যের এই অনুমানটিকে প্রত্যাখ্যান করার জন্য প্রয়োজনীয় নমুনা পারস্পরিক সম্পর্কের সহগটি হ'ল। সুতরাং, সাধারণভাবে, না, আপনি একই সাথে একটি বৃহত ( প্রস্থে ) পারস্পরিক সম্পর্ক সহগ এবং একসাথে বড় মূল্য রাখতে পারবেন নাপি

শীর্ষ লাইন (বিশদ)

ফাংশনে পিয়ারসন পারস্পরিক সম্পর্কের সহগের জন্য ব্যবহৃত পরীক্ষাটি আমি নীচে আলোচনা করা পদ্ধতির একটি খুব সামান্য পরিবর্তিত সংস্করণ।আরcor.test

ধরুন পারস্পরিক সম্পর্ক সঙ্গে IID bivariate স্বাভাবিক র্যান্ডম ভেক্টর হয় ρ । আমরা নাল কল্পনা পরীক্ষা করতে চাই যে ρ = 0 বনাম ρ 0 । যাক নমুনা পারস্পরিক সম্পর্কের সহগের হও। স্ট্যান্ডার্ড লিনিয়ার-রিগ্রেশন তত্ত্বটি ব্যবহার করে, পরীক্ষার পরিসংখ্যান, T = r show দেখানো কঠিন নয় (এক্স1,ওয়াই1),(এক্স2,ওয়াই2),...,(এক্সএন,ওয়াইএন)ρρ=0ρ0R নাল অনুমানের অধীনে একটিটিn-2বিতরণ রয়েছে। বড়এন এর জন্য,টিএন-2বিতরণটি স্ট্যান্ডার্ড স্বাভাবিকের কাছে চলে আসে। অতএবটি2প্রায় এক ডিগ্রি স্বাধীনতার সাথে চি-স্কোয়ার বিতরণ করা হয়। (অনুমানের অধীনে আমরা তৈরি করেছি,টি2~এফ1,এন-2বাস্তবতা কিন্তুχ21পড়তা পরিষ্কার করে তোলে কি, চলছে আমার মনে হয়।)

টি=Rএন-2(1-R2)
টিএন-2এনটিএন-2টি2টি2~এফ1,এন-2χ12

সুতরাং, যেখানে কুই 1 - α হয় ( 1 - α ) স্বাধীনতার এক ডিগ্রি সঙ্গে একটি চি-স্কোয়ারড বিতরণের সমাংশক।

পি(R21-R2(এন-2)কুই1-α)α,
কুই1-α(1-α)

এখন লক্ষ করুন যে r 2 বৃদ্ধি পাওয়ার সাথে সাথে বৃদ্ধি পাচ্ছে । সম্ভাব্যতা বিবৃতিতে পরিমাণ পুনরায় সজ্জিত করা, আমরা যে আছে সব জন্য | r | 1R2/(1-R2)R2 আমরা পর্যায়ে নাল হাইপোথিসিস একটি প্রত্যাখ্যানের পাবেনα। স্পষ্টতই ডান হাতnসহ হ্রাস পায়।

|R|11+ +(এন-2)/কুই1-α
αএন

একটি জমি

এখানে প্রত্যাখ্যানের অঞ্চলের একটা চক্রান্ত নমুনা আকার একটি ফাংশন হিসাবে। সুতরাং, উদাহরণস্বরূপ, যখন নমুনার আকার 100 এর বেশি হয়ে যায়, তখন absolute = 0.05 স্তরে নালটিকে প্রত্যাখ্যান করার জন্য (নিরঙ্কুশ) পারস্পরিক সম্পর্ক প্রায় 0.2 হতে হবে ।|R|α=0.05

একটি অনুকরণ

সঠিক পারস্পরিক সম্পর্ক সহগের সাথে শূন্য-গড় ভেক্টরগুলির একটি জোড়া উত্পন্ন করার জন্য আমরা একটি সাধারণ সিমুলেশন করতে পারি । নীচে কোড দেওয়া আছে। এটি থেকে আমরা এর আউটপুট দেখতে পারি cor.test

k <- 100
n <- 4*k

# Correlation that gives an approximate p-value of 0.05
# Change 0.05 to some other desired p-value to get a different curve
pval <- 0.05
qval <- qchisq(pval,1,lower.tail=F)
rho  <- 1/sqrt(1+(n-2)/qval)

# Zero-mean orthogonal basis vectors
b1 <- rep(c(1,-1),n/2)
b2 <- rep(c(1,1,-1,-1),n/4)

# Construct x and y vectors with mean zero and an empirical
# correlation of *exactly* rho
x <- b1
y <- rho * b1 + sqrt(1-rho^2) * b2

# Do test
ctst <- cor.test(x,y)

মন্তব্যে অনুরোধ করা হয়েছে, এখানে প্লটটি পুনরুত্পাদন করার কোড রয়েছে যা উপরের কোডটি অনুসরণ করে অবিলম্বে চালানো যেতে পারে (এবং সেখানে বর্ণিত কয়েকটি ভেরিয়েবল ব্যবহার করে)।

png("cortest.png", height=600, width=600)
m  <- 3:1000
yy <- 1/sqrt(1+(m-2)/qval)
plot(m, yy, type="l", lwd=3, ylim=c(0,1),
     xlab="sample size", ylab="correlation")
polygon( c(m[1],m,rev(m)[1]), c(1,yy,1), col="lightblue2", border=NA)
lines(m,yy,lwd=2)
text(500, 0.5, "p < 0.05", cex=1.5 )
dev.off()

1
তো - নীচের লাইনটি কী? আমি মনে করি আপনি বলছেন যে, নমুনার আকারটি ছোট না হওয়া পর্যন্ত একটি উচ্চ সম্পর্কের মান একটি কম পি-মান বোঝায় - তবে আমি মনে করি এটি স্পষ্টভাবে বানান করতে সহায়তা করবে।
ডিডব্লিউ

পি

@ কার্ডিনাল, আপনি কি দয়া করে আপনার তৈরি গ্রাফের জন্য উত্স কোড পোস্ট করতে পারেন?
aL3xa

@ ডিডাব্লু, আমি আপনার উদ্বেগের সমাধান করার চেষ্টা করেছি। আপনি যদি উন্নতি করতে পারেন যা তৈরি হতে পারে তবে দয়া করে আমাকে জানান know
কার্ডিনাল

1
@ aL3xa: আমি ব্যবহৃত প্লটিং কোড যুক্ত করেছি। আশাকরি এটা সাহায্য করবে.
কার্ডিনাল

17
cor.test(c(1,2,3),c(1,2,2))

কর = 0.866, পি = 0.333


6
@ জ্যাচ: দয়া করে এখন আপনার চেকটি পুনর্বিবেচনা করতে দ্বিধা বোধ করবেন যে কার্ডিনাল এবং শ্যাবিচেফ পুরো উত্তর দেওয়ার জন্য সময় নিয়েছে।
অ্যারন - মনিকা 18 ই

11

উচ্চ পি-ভ্যালু সহ সম্পর্কের সহগের একটি উচ্চতর অনুমান কেবল খুব সামান্য নমুনার আকারের সাথেই ঘটতে পারে। আমি একটি উদাহরণ প্রদান করতে চলেছিলাম, কিন্তু হারুন সবেমাত্র তা করেছে!


9

1/এন-3ρ^>0পি

পি=2-2Φ(ATANH(ρ^)এন-3),
Φএইচ0:ρ=0

এনρ^পি

 #get n for sample correlation and p-value, 2-sided test of 0 correlation
 n.size <- function(rho.hat,p.val) {
   n <- 3 + ((qnorm(1 - 0.5 * p.val)) / atanh(rho.hat))^2
 }

ρ^=0.5পি=0.2

print(n.size(0.5,0.2))

[1] 8.443062

এন,পিρ^


1

হ্যাঁ। একটি পি-মান নমুনার আকারের উপর নির্ভর করে, তাই একটি ছোট নমুনা এটি দিতে পারে।

বলুন সত্যিকারের প্রভাবের আকারটি খুব ছোট ছিল এবং আপনি একটি ছোট নমুনা আঁকেন। ভাগ্যক্রমে, আপনি খুব উচ্চ সম্পর্কের সাথে কয়েকটি ডেটা পয়েন্ট পান। পি-মানটি উচ্চতর হবে, এটি হওয়া উচিত। পারস্পরিক সম্পর্ক বেশি তবে এটি খুব নির্ভরযোগ্য ফলাফল নয়।

আর এর কর () থেকে নমুনা পারস্পরিক সম্পর্ক আপনাকে সম্পর্কের সর্বোত্তম অনুমান (নমুনা দেওয়া) বলবে। পি-মানটি পারস্পরিক সম্পর্কের শক্তি পরিমাপ করে না। নমুনার আকার বিবেচনা করে বাস্তবে কোনও প্রভাব না পড়লে এটি কীভাবে উত্থাপিত হতে পারে তা পরিমাপ করে।

এটি দেখার আরেকটি উপায়: আপনার যদি একই প্রভাবের আকার থাকে তবে আরও নমুনা পান, পি-মান সর্বদা শূন্যে চলে যায়।

(যদি আপনি আনুমানিক প্রভাবের আকার এবং অনুমান সম্পর্কে আত্মবিশ্বাসের ধারণাগুলি আরও ঘনিষ্ঠভাবে সংহত করতে চান তবে আত্মবিশ্বাসের ব্যবধানগুলি ব্যবহার করা ভাল বা বায়েশিয়ান কৌশলগুলি ব্যবহার করা ভাল use)


α=0.05x <- seq(0,4); y <- seq(0,4) + rnorm(5); cor.test(x,y)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.