আমার প্রশ্নটি @ হুবারের সাথে একটি পৃথক প্রশ্নের মন্তব্যে আলোচনার মধ্য দিয়ে বেড়েছে ।
বিশেষত, @ ভোবারের মন্তব্যটি নীচে ছিল:
এটি আপনাকে বিস্মিত করার একটি কারণ হ'ল পারস্পরিক সম্পর্ক পরীক্ষা এবং রিগ্রেশন স্লোপ টেস্টের অন্তর্নিহিত অনুমানগুলি আলাদা - তাই আমরা যখন বুঝতে পারি যে পরস্পর সম্পর্ক এবং opeাল সত্যই একই জিনিসটি পরিমাপ করছে, তখন কেন তাদের পি-মানগুলি একই হওয়া উচিত? এটি দেখায় যে এই সমস্যাগুলি কীভাবে এবং সংখ্যার সমান হওয়া উচিত তার চেয়ে আরও গভীরতর হয়।
এটি সম্পর্কে আমার চিন্তাভাবনা পেয়েছে এবং আমি বিভিন্ন আকর্ষণীয় উত্তর পেয়েছি। উদাহরণস্বরূপ, আমি এই প্রশ্নটি পেয়েছি " পারস্পরিক সম্পর্কের গুণাবলীর অনুমান " তবে এটি উপরের মন্তব্যটি কীভাবে পরিষ্কার করবে তা দেখতে পাচ্ছি না।
আমি পিয়ারসন এর সম্পর্ক আরো আকর্ষণীয় উত্তর পাওয়া যায় নি এবং ঢাল একটি সহজ রৈখিক রিগ্রেশনে (দেখুন এখানে এবং এখানে উদাহরণস্বরূপ) কিন্তু তাদের কেউ কি @whuber তার মন্তব্যে উল্লেখ হয়েছিল (অন্তত আপাত না উত্তর বলে মনে হচ্ছে আমাকে).
প্রশ্ন 1: একটি সম্পর্ক সম্পর্কিত পরীক্ষা এবং একটি রিগ্রেশন opeাল পরীক্ষা অন্তর্নিহিত অনুমানগুলি কি কি?
আমার দ্বিতীয় প্রশ্নের জন্য নিম্নলিখিত ফলাফলগুলি বিবেচনা করুন R
:
model <- lm(Employed ~ Population, data = longley)
summary(model)
Call:
lm(formula = Employed ~ Population, data = longley)
Residuals:
Min 1Q Median 3Q Max
-1.4362 -0.9740 0.2021 0.5531 1.9048
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.3807 4.4224 1.895 0.0789 .
Population 0.4849 0.0376 12.896 3.69e-09 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.013 on 14 degrees of freedom
Multiple R-squared: 0.9224, Adjusted R-squared: 0.9168
F-statistic: 166.3 on 1 and 14 DF, p-value: 3.693e-09
এবং cor.test()
ফাংশনের আউটপুট :
with(longley, cor.test(Population, Employed))
Pearson's product-moment correlation
data: Population and Employed
t = 12.8956, df = 14, p-value = 3.693e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.8869236 0.9864676
sample estimates:
cor
0.9603906
যেমন lm()
এবং cov.test()
আউটপুট দ্বারা দেখা যায় , পিয়ারসনের পারস্পরিক সম্পর্ক সহগ এবং অনুমান ( ) যথাক্রমে 0.96 বনাম , তবে টি-মান এবং পি-মানগুলি একই।
তারপরে আমি এটিও চেষ্টা করেছিলাম যে আমি এবং এর টি-মান গণনা করতে সক্ষম , যা এবং ভিন্ন হওয়া সত্ত্বেও একইএবং এটিই আমি আটকে যাই, কমপক্ষে জন্য :
X এবং y এর মোট বর্গের মোট যোগফল ব্যবহার করে াল ( reg 1 ) কে এক সরল রৈখিক প্রতিরোধে গণনা করুন :
x <- longley$Population; y <- longley$Employed
xbar <- mean(x); ybar <- mean(y)
ss.x <- sum((x-xbar)^2)
ss.y <- sum((y-ybar)^2)
ss.xy <- sum((x-xbar)*(y-ybar))
রিগ্রেশন opeালের সর্বনিম্ন-বর্গের অনুমান গণনা করুন, ( ক্রোলির আর বুক 1 ম সংস্করণে 393 পৃষ্ঠাতে এর প্রমাণ রয়েছে ):
b1 <- ss.xy/ss.x
b1
# [1] 0.4848781
জন্য স্ট্যান্ডার্ড ত্রুটি গণনা করুন :
ss.residual <- sum((y-model$fitted)^2)
n <- length(x) # SAMPLE SIZE
k <- length(model$coef) # NUMBER OF MODEL PARAMETER (i.e. b0 and b1)
df.residual <- n-k
ms.residual <- ss.residual/df.residual # RESIDUAL MEAN SQUARE
se.b1 <- sqrt(ms.residual/ss.x)
se.b1
# [1] 0.03760029
আর এর জন্য টি-মান এবং P-মান :
t.b1 <- b1/se.b1
p.b1 <- 2*pt(-abs(t.b1), df=n-2)
t.b1
# [1] 12.89559
p.b1
# [1] 3.693245e-09
আমি এই মুহুর্তে যা জানি না, এবং এটি হল প্রশ্ন 2 , কীভাবে β 1 এর পরিবর্তে ব্যবহার করে একই টি-মান গণনা করতে হবে (সম্ভবত শিশুর পদক্ষেপে)?
আমি অনুমান যে যেহেতু cor.test()
এর বিকল্প হাইপোথিসিস কিনা তা ব্যবহারকারীকে সত্য পারস্পরিক সম্পর্ক 0 সমান নয় (দেখুন cor.test()
উপরে আউটপুট), আমি পিয়ারসন পারস্পরিক সম্পর্কের সহগের ভালো কিছু আশা "পিয়ারসন পারস্পরিক সম্পর্কের সহগের মান ত্রুটি" দ্বারা বিভক্ত (অনুরূপ উপরে) ?! তবে সেই স্ট্যান্ডার্ড ত্রুটিটি কী হবে এবং কেন?b1/se.b1
পারস্পরিক সম্পর্ক পরীক্ষা এবং রিগ্রেশন স্লোপ টেস্টের অন্তর্নিহিত পূর্বোক্ত অনুমানগুলির সাথে এর কিছু যুক্ত হতে পারে ?!
সম্পাদনা (২--জুলাই -২০১)): যদিও @ হুবুবার প্রশ্ন 1 (এবং আংশিক প্রশ্ন 2 ) এর জন্য খুব বিশদ ব্যাখ্যা দিয়েছেন , আমি আরও কিছু খনন করেছি এবং দেখতে পেয়েছি যে এই দুটি পোস্ট ( এখানে এবং এখানে ) করছে একটি নির্দিষ্ট দেন মান ত্রুটি জন্য , যা উত্তর দিতে ভাল কাজ করে প্রশ্ন 2 , টি-মান দেওয়া হয়েছে পুনর্গঠন করা হয় যে দ :
r <- 0.9603906
# n <- 16
r.se <- sqrt((1-r^2)/(n-2))
r/r.se
# [1] 12.8956