লিনিয়ার রিগ্রেশন-এ সহগের বৈচিত্র্য-কোভেরিয়েন্স ম্যাট্রিক্স কীভাবে প্রাপ্ত করবেন


36

আমি লিনিয়ার রিগ্রেশন সম্পর্কিত একটি বই পড়ছি এবং of এর ভেরিয়েন্স-কোভারিয়েন্স ম্যাট্রিক্স বুঝতে কিছু সমস্যা হচ্ছে :b

এখানে চিত্র বর্ণনা লিখুন

তির্যক আইটেমগুলি যথেষ্ট সহজ, তবে বন্ধ কিছুটা বেশি কঠিন, আমার কী ধাঁধাটি সে

σ(b0,b1)=E(b0b1)E(b0)E(b1)=E(b0b1)β0β1

তবে এখানে এবং এর কোনও চিহ্ন নেই।β0β1


3
সংশ্লিষ্ট প্রশ্ন: stats.stackexchange.com/questions/44838/...
ocram


। Neter এট, ফলিত লিনিয়ার রিগ্রেশন মডেল, 1983, পৃষ্ঠা 216. আপনি ফলিত লিনিয়ার পরিসংখ্যানগত মডেল একই উপাদান খুঁজে পেতে পারেন, 5 ম সংস্করণ, পৃষ্ঠা 207.
akavalar

উত্তর:


53

এটি প্রকৃতপক্ষে একটি দুর্দান্ত প্রশ্ন যা আপনার প্রতিরোধের প্রাথমিক ধারণাটি চ্যালেঞ্জ করে।

প্রথমে স্বরলিপি সম্পর্কে কোনও প্রাথমিক বিভ্রান্তি প্রকাশ করুন। আমরা নিগ্রহের দিকে তাকিয়ে আছি:

y=b0+b1x+u^

যেখানে b0 এবং b1 সত্য estimators হয় β0 এবং β1 , এবং তোমার দর্শন লগ করা রিগ্রেশন এর অবশিষ্টাংশ হয়। মনে রাখবেন যে অন্তর্নিহিত সত্য এবং অব্যবহৃত রিগ্রেশনকে এভাবে চিহ্নিত করা হয়েছে:u^

y=β0+β1x+u

E[u]=0 এবং বৈকল্পিক E[u2]=σ2 এর প্রত্যাশা সহ । কিছু বই বোঝাতে b যেমন β এবং আমরা এখানে এই সম্মেলন খাপ খাওয়ানো। আমরা ম্যাট্রিক্স স্বরলিপি, যেখানে ব্যবহার করা 2x1 ভেক্টর যে estimators ঝুলিতে β = [ β 0 , β 1 ] ' , যথা = [ 0 , বো 1 ] 'β^β=[β0,β1]b=[b0,b1]। (এছাড়াও স্পষ্টতার খাতিরে আমি X কে নিম্নলিখিত গণনায় স্থির করে রেখেছি))

এখন আপনার প্রশ্ন। Ovক্যবদ্ধতার জন্য আপনার সূত্রটি সত্যই সঠিক, তা হ'ল:

σ(b0,b1)=E(b0b1)E(b0)E(b1)=E(b0b1)β0β1

আমি মনে করি আপনি জানতে চান কীভাবে আমাদের এই সূত্রটিতে সত্য সংরক্ষণযোগ্য সহগ β0,β1 রয়েছে? সূত্রটি প্রসারিত করে যদি আমরা এটিকে আরও একধাপ এগিয়ে নিয়ে যাই তবে এগুলি আসলে বাতিল হয়ে যায় । এটি দেখতে, নোট করুন যে অনুমানেরটির জনসংখ্যার বৈকল্পিক নীচে দেওয়া হয়েছে:

Var(β^)=σ2(XX)1

এই ম্যাট্রিক্সটি তির্যক উপাদানগুলির মধ্যে বৈকল্পিক এবং অফ-তির্যক উপাদানগুলির সমবায়িকাকে ধারণ করে।

উপরের সূত্রে পৌঁছতে, আসুন ম্যাট্রিক্স স্বরলিপি ব্যবহার করে আপনার দাবিটিকে সাধারণীকরণ করুন। আমাদের সাথে তাই বোঝাতে ভ্যারিয়েন্স যাক Var[] এবং প্রত্যাশা E[]

Var[b]=E[b2]E[b]E[b]

মূলত আমাদের কাছে সাধারণ বৈকল্পিক সূত্র রয়েছে, কেবলমাত্র ম্যাট্রিক্স স্বরলিপি ব্যবহার করে। সমীকরণ সমাধান করা যখন মূল্নির্ধারক জন্য আদর্শ এক্সপ্রেশনে বদলে b=(XX)1Xy । এছাড়াও অনুমান E[b]=β একটি পক্ষপাতিত্বহীন মূল্নির্ধারক হচ্ছে। সুতরাং, আমরা প্রাপ্ত:

E[((XX)1Xy)2]β22×2

নোট করুন যে আমাদের ডানদিকে রয়েছে β2 - 2x2 ম্যাট্রিক্স, নাম bb , তবে আপনি এই মুহুর্তে ইতিমধ্যে অনুমান করতে পারেন যে এই শব্দটির সাথে খুব শীঘ্রই কী ঘটবে।

উপরের সত্যিকারের অন্তর্নিহিত ডেটা উত্পন্ন প্রক্রিয়াটির জন্য আমাদের এক্সপ্রেশনটির সাথে y প্রতিস্থাপন করা আমাদের কাছে রয়েছে:

E[((XX)1Xy)2]β2=E[((XX)1X(Xβ+u))2]β2=E[((XX)1XX=Iβ+(XX)1Xu)2]β2=E[(β+(XX)1Xu)2]β2=β2+E[(XX)1Xu)2]β2

since E[u]=0. Furthermore, the quadratic β2 term cancels out as anticipated.

Thus we have:

Var[b]=((XX)1X)2E[u2]

By linearity of expectations. Note that by assumption E[u2]=σ2 and ((XX)1X)2=(XX)1XX(XX)1=(XX)1 since XX is a K×K symetric matrix and thus the same as its transpose. Finally we arrive at

Var[b]=σ2(XX)1

Now that we got rid of all β terms. Intuitively, the variance of the estimator is independent of the value of true underlying coefficient, as this is not a random variable per se. The result is valid for all individual elements in the variance covariance matrix as shown in the book thus also valid for the off diagonal elements as well with β0β1 to cancel out respectively. The only problem was that you had applied the general formula for the variance which does not reflect this cancellation at first.

Ultimately, the variance of the coefficients reduces to σ2(XX)1 and independent of β. But what does this mean? (I believe you asked also for a more general understanding of the general covariance matrix)

Look at the formula in the book. It simply asserts that the variance of the estimator increases for when the true underlying error term is more noisy (σ2 increases), but decreases for when the spread of X increases. Because having more observations spread around the true value, lets you in general build an estimator that is more accurate and thus closer to the true β. On the other hand, the covariance terms on the off-diagonal become practically relevant in hypothesis testing of joint hypotheses such as b0=b1=0. Other than that they are a bit of a fudge, really. Hope this clarifies all questions.


and when keep the spread constant and decrease the x's, the standard error of the intercept becomes smaller, which makes sense.
Theta30

I don't follow the expansion of the square. Why is not simplified to ((XX)1X)2=((XX)1X)((XX)1X)=X2?
David

2

In your case we have

XX=[nXiXiXi2]

Invert this matrix and you will get the desired result.


1

It appears that β0β1 are the predicted values (expected values). They make the switch between E(b0)=β0 and E(b1)=β1.


β0 and β1 are generally unknown, what can they switch to?
qed

I think I understand the confusion, and I think they perhaps should have written β0 rather than β0. Here's another post that goes through the calculation: link
Drew75

2
@qed: to sample estimates of the unknown quantities.
Glen_b -Reinstate Monica
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.