একাধিক লিনিয়ার রিগ্রেশন জন্য ন্যূনতম বর্গাকার অনুমানকারী কীভাবে পাওয়া যায়?


30

রৈখিক রিগ্রেশনের ক্ষেত্রে সহজ সালে y=β0+β1x , আপনি অন্তত বর্গ মূল্নির্ধারক আহরণ করতে β 1 = Σ ( এক্স আমি - ˉ এক্স ) ( Y আমি - ˉ Y )β^1=(xix¯)(yiy¯)(xix¯)2 যেমন আপনাকে জানতে হবে হবে না β 0অনুমান করার জন্যβ^0β^1

ধরুন আমি y=β1x1+β2x2 , কিভাবে আমি আহরণ না β 1 আনুমানিক হিসাব ছাড়া β 2 ? নাকি এটা সম্ভব নয়?β^1β^2


1
আপনি ভেরিয়েবলগুলির মধ্যে একটি বাদ দিতে পারেন এবং অন্যটির স্বতন্ত্র থাকলেও তার নিরপেক্ষ অনুমান সংগ্রহ করতে পারেন।
ডেভিড 25272

উত্তর:


51

ম্যাট্রিক্স স্বরলিপি মধ্যে প্রাপ্ত

থেকে শুরু করা y=Xb+ϵ, যা সত্যই ঠিক তেমন

[y1y2yN]=[x11x12x1Kx21x22x2KxN1xN2xNK][b1b2bK]+[ϵ1ϵ2ϵN]

এটা সব minimzing আসে নিচে :ee

ε'ε=[12এন][12এন]=Σআমি=1এনআমি2

কমানোর তাই আমাদের দেয়:''

= ( y - এক্স বি ) ( ওয়াই - এক্স বি )মিআমিএন '=(Y-এক্স)'(Y-এক্স)

= ওয়াই - 2 বি এক্স + বি এক্স এক্স বিminb ee=yy2bXy+bXXb

(ee)b=2Xy+2XXb=!0

XXb=Xy

b=(XX)1Xy

একটি সর্বশেষ গাণিতিক জিনিস, ন্যূনতম জন্য দ্বিতীয় ক্রমের শর্তের জন্য ম্যাট্রিক্স ইতিবাচক সুনির্দিষ্ট। এক্স এর পূর্ণ পদ রয়েছে এমন ক্ষেত্রে এই প্রয়োজনীয়তা পূরণ করা হবে ।XXX

বৃহত্তর অধিদফতরের সমস্ত পদক্ষেপের গর্তে যে সঠিক সংজ্ঞাটি পাওয়া যায় সেটিকে http://economictheoryblog.com/2015/02/19/ols_estimator/ এর অধীনে পাওয়া যাবে


3
এই ব্যয়টি হ'ল আমি যা অনুসন্ধান করছিলাম। কোন স্কিপড স্টেপস নেই। আশ্চর্যজনক যে একই রকম পাওয়া কতটা কঠিন।
জাভাদবা

1
ম্যাট্রিক্স সমীকরণে, দ্বিতীয়টি *হওয়া উচিত নয় +? এছাড়াও, মাত্রাগুলি মিলানোর জন্য এন এন এর পরিবর্তে হওয়া উচিত নয় ? bKbN
অ্যালেক্সিস ওলসন

আলেক্সিস ওলসন, আপনি ঠিক বলেছেন! আমি আমার উত্তর সম্পাদনা করেছি।
Andreas Dibiasi

13

অন্যের অনুমান না করেই একাধিক রিগ্রেশনে কেবলমাত্র একটি গুণফলের অনুমান করা সম্ভব।

অন্যান্য ভেরিয়েবল থেকে এক্স 2 এর প্রভাবগুলি সরিয়ে এবং তারপরে এক্স 1 এর অবশিষ্টাংশের বিরুদ্ধে y এর অবশিষ্টাংশগুলি পুনরায় চাপিয়ে এর অনুমানটি পাওয়া যায় । এটি ব্যাখ্যা করা এবং চিত্রিত করা হয় যে অন্য ভেরিয়েবলগুলির জন্য একটি ঠিক কীভাবে নিয়ন্ত্রণ করে? এবং (ক) রিগ্রেশন সহগকে কীভাবে স্বাভাবিক করা যায়? । এই পদ্ধতির সৌন্দর্যটি হ'ল এর জন্য কোনও ক্যালকুলাসের প্রয়োজন নেই, লিনিয়ার বীজগণিতের প্রয়োজন নেই, কেবল দ্বি-মাত্রিক জ্যামিতি ব্যবহার করে দৃশ্যমান করা যেতে পারে, সংখ্যাগতভাবে স্থিতিশীল এবং একাধিক প্রতিরোধের কেবলমাত্র একটি মৌলিক ধারণাটি কাজে লাগান: তা বের করার (বা "নিয়ন্ত্রণের জন্য") ) একটি একক চলকের প্রভাব।β1x2yx1


বর্তমান ক্ষেত্রে তিনটি সাধারণ রিগ্রেশন পদক্ষেপ ব্যবহার করে একাধিক রিগ্রেশন করা যেতে পারে:

  1. এক্স 2 এ রেজিস্ট্রেশন করুন (ধ্রুবক শব্দ ছাড়া!)। হইয়া হতে দিন Y = α Y , 2 x এর 2 + + δ । অনুমানটি হ'ল α y , 2 = i y i x 2 iyx2y=αy,2x2+δ সুতরাং অবশিষ্টাংশগুলিহ'ল δ=y-αy,2x2 জ্যামিতিক,δকি বাম হয়Yতার অভিক্ষেপ পর সম্মুখেরএক্স2বিয়োগ করা হয়।

    αy,2=iyix2iix2i2.
    δ=yαy,2x2.
    δyx2
  2. এক্স 2 এ রেজিস্ট্রেশন করুন (একটি ধ্রুবক শব্দ ব্যতীত)। হইয়া হতে দিন এক্স 1 = α 1 , 2 x এর 2 + + γ । অনুমানটি α 1 , 2 = i x 1 i x 2 ix1x2x1=α1,2x2+γঅবশিষ্টাংশগুলিহ'ল γ=x1-α1,2এক্স2জ্যামিতিক,γকি বাম হয়এক্স1এর অভিক্ষেপ পর সম্মুখেরএক্স2বিয়োগ করা হয়।

    α1,2=ix1ix2iix2i2.
    γ=x1α1,2x2.
    γx1x2
  3. প্রত্যাবর্তন উপর γ (ছাড়া একটি ধ্রুবক শব্দ)। অনুমান β 1 = Σ আমি δ আমি γ আমিδγমাপসই করা হবেδ= β 1γ+ +εজ্যামিতিক, বিটা 1এর উপাদানδ(যা প্রতিনিধিত্ব করেYসঙ্গেএক্স2মধ্যে বাইরে নিয়ে যাওয়া)γদিক (যা প্রতিনিধিত্ব করেএক্স1সঙ্গেএক্স2বাইরে নিয়ে যাওয়া)।

    β^1=iδiγiiγi2.
    δ=β^1γ+εβ^1δyx2γx1x2

লক্ষ্য করুন যে 2 অনুমান করা হয়নি। β2 এটা সহজেই কি এতদূর (ঠিক যেমন হয়েছে সেগুলোও থেকে উদ্ধার করা সম্ভব β 0 সাধারণ রিগ্রেশন ক্ষেত্রে সহজে ঢাল হিসাব থেকে প্রাপ্ত হয় β 1 )। Ε এর bivariate রিগ্রেশন জন্য অবশিষ্টাংশ হয় Y উপর এক্স 1 এবং এক্স 2β^0β^1εyx1x2

সাধারণ রিগ্রেশন সহ সমান্তরাল শক্তিশালী: পদক্ষেপ (1) এবং (2) হ'ল সাধারন সূত্রে মাধ্যমকে বিয়োগ করে আনার। যদি আপনি কে এর ভেক্টর হতে দেন তবে আপনি প্রকৃত সূত্রটি পুনরুদ্ধার করতে পারেন।x2

β^1yx1y


1
গ্রেট উত্তর, এখানে একটি সাধারণ উপপাদ্য en.wikipedia.org/wiki/...
JohnK

4

ββYiXki

(β0,β1,...,βk)

Yi=β0+β1X1i+...+βkXki+ϵi

ϵiiidN(0,σ2)i=1,...,nXn×knkthXk. You can find many explanations and derivations here of the formula used to calculate the estimated coefficients β^=(β^0,β^1,...,β^k), which is

β^=(XX)1XY

assuming that the inverse (XX)1 exists. The estimated coefficients are functions of the data, not of the other estimated coefficients.


I have a follow up question, on the simple regression case, you make yi=β0+β1x¯+β1(xix¯)+ei then X becomes a matrix of (1,...,1) and (x1x¯,...,xnx¯), then follow through the β^=(XX)(1)XY. How should I rewrite the equation in my case?
Saber CN

And 1 more question, does this apply to cases where x1 and x2 are not linear, but the model is still linear? For example the decay curve y=β1ex1t+β2ex2t, can I substitute the exponential with x1 and x2so it becomes my original question?
Saber CN

In your first comment, you can center the variable (subtract its mean from it) and use that is your independent variable. Search for "standardized regression". The formula you wrote in terms of matrices is not correct. For your second question, yes you may do that, a linear model is one that is linear in β, so as long as y equal to a linear combination of β's you are fine.
caburke

2
(+1). But shouldn't it be "n×k matrix" instead of k×n?
miura

3

One small minor note on theory vs. practice. Mathematically β0,β1,β2...βn can be estimated with the following formula:

β^=(XX)1XY

where X is the original input data and Y is the variable that we want to estimate. This follows from minimizing the error. I will proove this before making a small practical point.

Let ei be the error the linear regression makes at point i. Then:

ei=yiyi^

The total squared error we make is now:

i=1nei2=i=1n(yiyi^)2

Because we have a linear model we know that:

yi^=β0+β1x1,i+β2x2,i+...+βnxn,i

Which can be rewritten in matrix notation as:

Y^=Xβ

We know that

i=1nei2=EE

We want to minimize the total square error, such that the following expression should be as small as possible

EE=(YY^)(YY^)

This is equal to:

EE=(YXβ)(YXβ)

The rewriting might seem confusing but it follows from linear algebra. Notice that the matrices behave similar to variables when we are multiplying them in some regards.

We want to find the values of β such that this expression is as small as possible. We will need to differentiate and set the derivative equal to zero. We use the chain rule here.

dEEdβ=2XY+2XXβ=0

This gives:

XXβ=XY

Such that finally:

β=(XX)1XY

So mathematically we seem to have found a solution. There is one problem though, and that is that (XX)1 is very hard to calculate if the matrix X is very very large. This might give numerical accuracy issues. Another way to find the optimal values for β in this situation is to use a gradient descent type of method. The function that we want to optimize is unbounded and convex so we would also use a gradient method in practice if need be.


except that you don't actually need to compute (XX)1...
user603

বৈধ বিন্দু. একটিও গ্রাম স্কমিট প্রক্রিয়াটি ব্যবহার করতে পারে তবে আমি কেবল মন্তব্য করতে চেয়েছিলাম যে সর্বোত্তম মানগুলি খুঁজে পেতেβ জড়তার কারণে ভেক্টরটি সংখ্যাগতভাবেও করা যেতে পারে।
ভিনসেন্ট ওয়ারমারডাম

2

এলআর-এর জ্যামিতিক ব্যাখ্যার মাধ্যমে একটি সাধারণ বিকাশ করা যেতে পারে।

লিনিয়ার রিগ্রেশন এর প্রক্ষেপণ হিসাবে ব্যাখ্যা করা যেতে পারে ওয়াই কলাম স্পেসে এক্স। সুতরাং, ত্রুটি,ε^ এর কলাম স্পেসে অরথোগোনাল এক্স

সুতরাং, এর মধ্যে অভ্যন্তরীণ পণ্য এক্স' এবং ত্রুটি অবশ্যই 0 হওয়া উচিত,

<এক্স',Y-এক্সβ^> =0

এক্স'Y-এক্স'এক্সβ^=0

এক্স'Y=এক্স'এক্সβ^

যা বোঝায় যে,

(এক্স'এক্স)-1এক্স'Y=β^

এখন একই কাজটি করা যেতে পারে:

(1) প্রজেক্টিং ওয়াই সম্মুখের দিকে এক্স2 (ত্রুটি δ=ওয়াই-এক্স2ডি^), ডি^=(এক্স2'এক্স2)-1এক্স2'Y,

(2) প্রজেক্টিং এক্স1 সম্মুখের দিকে এক্স2 (ত্রুটি γ=এক্স1-এক্স2জি^), জি^=(এক্স1'এক্স1)-1এক্স1এক্স2,

এবং পরিশেষে,

(3) প্রজেক্টিং δ সম্মুখের দিকে γ, β^1

enter image description here

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.