একাধিক প্রতিরোধের সহগ খুঁজে পেতে কোভেরিয়েন্স ম্যাট্রিক্স ব্যবহার করার কোনও উপায় আছে কি?


23

সাধারণ লিনিয়ার রিগ্রেশন এর জন্য, রিগ্রেশন সহগ সরাসরি সি ডি , দ্বারা ভেরিয়েন্স-কোভারিয়েন্স ম্যাট্রিক্স থেকে গণনাযোগ্য isC

Cd,eCe,e
যেখানেdনির্ভরশীল ভেরিয়েবলের সূচক এবংeহ'ল ব্যাখ্যামূলক ভেরিয়েবলের সূচক।

যদি কারও কাছে কেবল কোভারিয়েন্স ম্যাট্রিক্স থাকে তবে একাধিক ব্যাখ্যামূলক ভেরিয়েবলগুলির সাথে মডেলটির সহগগুলি গণনা করা কি সম্ভব?

ইটিএ: দুটি ব্যাখ্যামূলক ভেরিয়েবলের জন্য, এটি প্রদর্শিত হবে যে এবং আনুষাঙ্গিকভাবেβ2 এর জন্য। আমি কীভাবে এটি তিন বা ততোধিক ভেরিয়েবলের মধ্যে প্রসারিত করব তা তাত্ক্ষণিকভাবে দেখছি না।

β1=Cov(y,x1)var(x2)Cov(y,x2)Cov(x1,x2)var(x1)var(x2)Cov(x1,x2)2
β2

3
সহগ ভেক্টর β সমাধান এক্স ' ওয়াই = ( এক্সβ^ । কিছু বীজগণিত কারসাজি প্রকাশ করে যে এটি আসলে 2-সহগ ক্ষেত্রে আপনি যে সূত্রটি দিয়েছেন তার মতোই। এখানে সুন্দরভাবে সাজানো হয়েছে:stat.purdue.edu/~jennings/stat514/stat512notes/topic3.pdf। নিশ্চিত না যে এটি আদৌ সহায়তা করে। তবে আমি অনুমান করার উদ্যোগ নেব যে সূত্রের ভিত্তিতে এটি সাধারণভাবে অসম্ভব। XY=(XX)1β
ছায়াছবির 13

1
@ ডেভিড আপনি কীভাবে ব্যাখ্যা করতে পারেন যে এটি কীভাবে ব্যাখ্যাযোগ্য ভেরিয়েবলের (2 এর বাইরে) স্বেচ্ছাসেবীর সংখ্যাতে প্রসারিত করা যায়? আমার প্রকাশ দরকার।
জেন ওয়েইন

1
@ জেনওয়েেন আমি নিশ্চিত না আমি আপনার প্রশ্নটি বুঝতে পেরেছি: হোবার ম্যাট্রিক্স ফর্ম, সি - 1 ( কোভ ( নীচে) নীচে সমাধানটি দিয়েছেনC1(Cov(Xi,y))
ডেভিড

1
হ্যাঁ আমি এটি অধ্যয়ন করেছি এবং সে ঠিক আছে।
জেন ওয়েন

উত্তর:


36

হ্যাঁ, সমস্ত ভেরিয়েবলের কোভারিয়েন্স ম্যাট্রিক্স - ব্যাখ্যামূলক এবং প্রতিক্রিয়া - সমস্ত সহগ খুঁজে পাওয়ার জন্য প্রয়োজনীয় তথ্য ধারণ করে, যদি একটি ইন্টারসেপ্ট (ধ্রুবক) পদটি মডেলের অন্তর্ভুক্ত থাকে। (যদিও সমবায়ীরা ধ্রুবক শব্দ সম্পর্কে কোনও তথ্য না দেয়, তথ্যের মাধ্যম থেকে এটি পাওয়া যায়))


বিশ্লেষণ

বর্ণনামূলক ভেরিয়েবলের জন্য ডেটা ডাইমেনশনাল কলাম ভেক্টর x 1 , x 2 , , এক্স পি হিসাবে সাড়াতে দেওয়া উচিত এবং প্রতিক্রিয়া ভেরিয়েবলটি এলোমেলো ভেরিয়েবল ওয়াইয়ের উপলব্ধি হিসাবে বিবেচিত কলাম ভেক্টর y হতে পারেnx1,x2,,xpyY । সাধারণ লিস্ট স্কোয়ার অনুমান বিটা মডেল কোফিসিয়েন্টস এরβ^

E(Y)=α+Xβ

একত্রিতকরনের দ্বারা প্রাপ্ত হয় কলাম ভেক্টর এক্স 0 = ( 1 , 1 , ... , 1 ) ' , এক্স 1 , ... , এক্স পি একটি মধ্যে এন × পি + + 1 অ্যারে এক্স এবং লিনিয়ার সমীকরণের পদ্ধতি সমাধানেp+1X0=(1,1,,1),X1,,Xpn×p+1X

XXβ^=Xy.

এটি সিস্টেমের সমতুল্য

1nXXβ^=1nXy.

গাউসিয়ান নির্মূল এই ব্যবস্থাটি সমাধান করবে। এটি ম্যাট্রিক্স 1 সংযুক্ত করে এগিয়ে যায়p+1×p+1এবংপি+1-ভেক্টর11nXXp+1কেপি+1×পি+2অ্যারেএবং সারি-হ্রাস করে। 1nXyp+1×p+2A

প্রথম পদক্ষেপটি পরিদর্শন করবে । এই অশূন্য হতে খোঁজা, এটা প্রথম সারি যথাযথ গুণিতক বিয়োগ করতে আয়একটিআউট তার প্রথম কলামে অবশিষ্ট এন্ট্রি শূন্য করার জন্য অবশিষ্ট সারি থেকে। এই গুণগুলি হবে11n(XX)11=1nX0X0=1Aএবং এন্ট্রিi+1থেকে বিয়োগ করা সংখ্যা,জে+1=এক্সআই এক্সজে ¯ এক্স আই ¯ এক্স জেসমান হবে। এটি কেবলএক্সiএবংএক্সজে এরসমবায় জন্য সূত্র। অধিকন্তু, সংখ্যা বামআমি+ +1,পৃ+ +2অবস্থান সমান11nX0Xi=X¯iAi+1,j+1=XiXjX¯iX¯jXiXji+1,p+2 , কোভ্যারিয়েন্সএক্সআমিসঙ্গেY1nXiyXi¯y¯Xiy

সুতরাং, গাউসিয়ান নির্মূলের প্রথম পদক্ষেপের পরে সিস্টেমটি সমাধান হ্রাস পাবে

Cβ^=(Cov(Xi,y))

এবং স্পষ্টতই - যেহেতু সমস্ত সহগ সহকারী হয় - সুতরাং সমাধানটি সমস্ত ভেরিয়েবলের কোভারিয়েন্স ম্যাট্রিক্স থেকে পাওয়া যায়।

( যখন অবিচ্ছিন্ন থাকে তখন সমাধানটি সি - ( কোভ ( এক্স আই , ওয়াই ) লেখা যেতে পারে ) । প্রশ্নে প্রদত্ত সূত্রগুলি এর বিশেষ ক্ষেত্রে যখন পি = 1 এবং পি = 2 such এই জাতীয় সূত্রগুলি স্পষ্টভাবে লিখলে পি বাড়ার সাথে সাথে আরও জটিল হয়ে ওঠে Moreover তদুপরি, এগুলি সংখ্যার গণনার জন্য নিকৃষ্ট, যা ম্যাট্রিক্স সি বিবর্তনের পরিবর্তে সমীকরণের সিস্টেমটি সমাধান করে সর্বোত্তমভাবে পরিচালিত হয় ))CC1(Cov(Xi,y))p=1p=2pC

ধ্রুব মেয়াদ গড় মধ্যে পার্থক্য হতে হবে এবং মধ্যবর্তি মাপটা অনুমান থেকে পূর্বাভাস এক্স βyXβ^


উদাহরণ

উদাহরণস্বরূপ, নিম্নলিখিত Rকোডটি কিছু তথ্য তৈরি করে, তাদের সমবায়গুলি গণনা করে এবং সেই তথ্য থেকে সম্পূর্ণরূপে ন্যূনতম স্কোয়ার সহগ অনুমান করে। এটি তাদের সর্বনিম্ন-স্কোয়ারের অনুমানকারী থেকে প্রাপ্ত অনুমানের সাথে তুলনা করে lm

#
# 1. Generate some data.
#
n <- 10        # Data set size
p <- 2         # Number of regressors
set.seed(17)
z <- matrix(rnorm(n*(p+1)), nrow=n, dimnames=list(NULL, paste0("x", 1:(p+1))))
y <- z[, p+1]
x <- z[, -(p+1), drop=FALSE]; 
#
# 2. Find the OLS coefficients from the covariances only.
#
a <- cov(x)
b <- cov(x,y)
beta.hat <- solve(a, b)[, 1]  # Coefficients from the covariance matrix
#
# 2a. Find the intercept from the means and coefficients.
#
y.bar <- mean(y)
x.bar <- colMeans(x)
intercept <- y.bar - x.bar %*% beta.hat  

আউটপুট দুটি পদ্ধতির মধ্যে চুক্তি দেখায়:

(rbind(`From covariances` = c(`(Intercept)`=intercept, beta.hat),
       `From data via OLS` = coef(lm(y ~ x))))
                  (Intercept)        x1        x2
From covariances     0.946155 -0.424551 -1.006675
From data via OLS    0.946155 -0.424551 -1.006675

1
Xcov(z)

7
Answers like this raise the bar of this Cross Validated
jpmuc

@whuber আপনার উদাহরণে, আপনার কাছ থেকে পথিমধ্যে নির্ণিত yএবং xএবং beta.hatyএবং xমূল ডেটা অংশ। কোভরিয়েন্স ম্যাট্রিক্স এবং একা অর্থের মধ্য দিয়ে কি এই বিরতি নেওয়া সম্ভব? আপনি দয়া করে স্বরলিপি প্রদান করতে পারেন?
জেন ওয়েইন

@ জেন কেবলমাত্র উপায় দিয়েছেন এক্স¯, আবেদন β^ তাদেরকে:
এক্স¯β^=এক্সβ^¯
আমি এটি প্রতিফলিত করতে কোড পরিবর্তন করেছি।
হোবার

কোডের জন্য খুব সহায়ক +1
মাইকেল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.