মার্ক হোয়াইটের কাছ থেকে সহায়ক প্রতিক্রিয়ার পরে সম্পাদিত (আপনাকে ধন্যবাদ!)
একটি বিকল্প হ'ল উভয় সম্পর্ককে (এ-এর সাথে বি 1, এবং এ-এর সাথে বি 2) গণনা করা যা তাদের মধ্যে পার্থক্যটিও অনুমান করে। একাধিক রিগ্রেশন সহ এটি করা সহজ । আপনি নির্ভরশীল ভেরিয়েবল হিসাবে এ এর সাথে একটি মডেল চালাতেন, এবং তারপরে বি 1 এবং বি 2 এর জন্য সমস্ত স্কোর সহ একটানা চলমান চলক, এটি একটি চলক পরিবর্তনশীল যা এটি পরিবর্তনশীল (বি 1 বা বি 2), এবং তাদের মধ্যে মিথস্ক্রিয়া নির্দেশ করে। র মধ্যে:
> set.seed(24601)
>
> library(tidyverse)
> library(mvtnorm)
> cov <- matrix(c(1, .4, .16,.4, 1, .4, .16, .4, 1), ncol=3, byrow=TRUE)
> mydata <- rmvnorm(n=100, sigma = cov)
> colnames(mydata) = c("A", "B1", "B2")
> head(mydata)
A B1 B2
[1,] -0.1046382 0.6031253 0.5641158
[2,] -1.9303293 -0.7663828 -0.7921836
[3,] 0.1244192 -0.4413581 -1.2376256
[4,] -3.2822601 -1.2512055 -0.5586773
[5,] -0.9543368 -0.1743740 1.1884185
[6,] -0.4843183 -0.2612668 -0.7161938
আমি উত্পন্ন ডেটা থেকে পারস্পরিক সম্পর্ক এখানে:
> cor(mydata)
A B1 B2
A 1.0000000 0.4726093 0.3043496
B1 0.4726093 1.0000000 0.3779376
B2 0.3043496 0.3779376 1.0000000
>
মডেলের প্রয়োজনীয়তা পূরণের জন্য ডেটা ফর্ম্যাট পরিবর্তন করা ("দীর্ঘ" এ পুনরায় ফর্ম্যাট করা):
> mydata <- as.data.frame(mydata) %>%
+ gather("var", "value", B1, B2)
>
মডেলটি এখানে:
সংক্ষিপ্তসার (lm (A var value * var, ডেটা = মাইডাটা))
Call:
lm(formula = A ~ value * var, data = mydata)
Residuals:
Min 1Q Median 3Q Max
-2.89310 -0.52638 0.02998 0.64424 2.85747
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.09699 0.09014 -1.076 0.283
value 0.47445 0.09305 5.099 8.03e-07 ***
varB2 -0.10117 0.12711 -0.796 0.427
value:varB2 -0.13256 0.13965 -0.949 0.344
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.891 on 196 degrees of freedom
Multiple R-squared: 0.158, Adjusted R-squared: 0.1451
F-statistic: 12.26 on 3 and 196 DF, p-value: 2.194e-07
এখানকার ফলাফলগুলি (আমার তৈরি তথ্য থেকে) বোঝায় যে বি 1 এবং এ এর মধ্যে একটি গুরুত্বপূর্ণ সম্পর্ক রয়েছে ("মান" সহগের পরীক্ষা, যেহেতু বি 1 "" বর্ণ "সহগের জন্য রেফারেন্স গ্রুপ) তবে পার্থক্যটি A এর সাথে B1 সম্পর্ক এবং A এর সাথে B2 সম্পর্ক উল্লেখযোগ্য নয় ("মান: varB2" সহগের পরীক্ষা)।
আপনি যদি রিগ্রেশন সহগের তুলনায় পারস্পরিক সম্পর্কের দিক থেকে চিন্তা করতে চান তবে মডেলটি চালানোর আগে আপনার সমস্ত ভেরিয়েবলগুলি (এ, বি 1, এবং বি 2) মানিক করুন এবং আপনি যে রিগ্রেশন সহগগুলি পাবেন তা মানদণ্ডী হয়ে উঠবে (একেবারে একই জিনিস নয়) জিরো-অর্ডার পারস্পরিক সম্পর্ক, তবে ব্যাখ্যার ক্ষেত্রে অনেক বেশি কাছাকাছি)।
এছাড়াও মনে রাখবেন যে এটি আপনার বিশ্লেষণকে কেবলমাত্র B1 এবং B2 উভয় ক্ষেত্রে ( তালিকা অনুযায়ী মুছে ফেলা ) সীমাবদ্ধ করবে । যতক্ষণ না এটি আপনাকে আন্ডার পাওয়ার না করার জন্য পর্যাপ্ত ডেটা রেখে দেয় এবং যতক্ষণ না অনুপস্থিত তথ্য এলোমেলোভাবে অনুপস্থিত হয় (বা মোট তথ্যের একটি সামান্য পরিমাণ অনুপস্থিত থাকলেও তারা অযৌক্তরূপে নিখোঁজ থাকলেও খুব বেশি কিছু আসে না), তবে এটি ঠিক আছে।
আপনি যে বি 1 এবং বি 2 উভয়েরই প্রভাব অনুমানের জন্য একই বিশ্লেষণকে একই ডেটাसेटে সীমাবদ্ধ করে রেখেছেন (গুমের বিভিন্ন ধরণের ভিত্তিতে কিছুটা আলাদা ডেটাসেট ব্যবহার না করে) কিছুটা হলেও পারস্পরিক পার্থক্যের পার্থক্যটির ব্যাখ্যা করার সুবিধা রয়েছে আরও সোজা। যদি আপনি প্রতিটিটির জন্য পৃথকভাবে পৃথক পৃথক গণনা করে থাকেন এবং তারপরে পার্থক্যটি পরীক্ষা করেন তবে আপনি এই সমস্যাটিতে ছুঁড়েছেন যে অন্তর্নিহিত তথ্য প্রতিটি ক্ষেত্রেই কিছুটা আলাদা --- আপনি যে কোনও পার্থক্য দেখেন নমুনাগুলির পার্থক্যের কারণে তত বেশি পার্থক্য থাকতে পারে ভেরিয়েবলের মধ্যে প্রকৃত সম্পর্কের মধ্যে।