একাধিকের জন্য এই লিনিয়ার রিগ্রেশন পরিচয়টি বোঝার জন্য কি একটি মার্জিত / অন্তর্দৃষ্টিপূর্ণ উপায় আছে?


10

লিনিয়ার রিগ্রেশনটিতে আমি একটি আনন্দদায়ক ফলাফল পেয়েছি যে আমরা যদি মডেলটি ফিট করি

E[Y]=β1X1+β2X2+c,

তারপরে, আমরা যদি মানকে মানিক করে কেন্দ্র করে থাকি Y, X1 এবং X2 ডেটা,

R2=Cor(Y,X1)β1+Cor(Y,X2)β2.

এটি আমার কাছে 2 ভেরিয়েবল সংস্করণের মতো মনে হয় R2=Cor(Y,X)2 জন্য y=mx+c রিগ্রেশন, যা খুশী।

তবে আমি যে একমাত্র প্রমাণ জানি তা কোনওভাবেই গঠনমূলক বা অন্তর্দৃষ্টিপূর্ণ নয় (নীচে দেখুন), এবং এখনও এটি দেখার জন্য এটি মনে হয় এটি সহজেই বোধগম্য হওয়া উচিত।

উদাহরণ চিন্তা:

  • দ্য β1 এবং β2 পরামিতি আমাদের 'অনুপাত' দেয় X1 এবং X2 ভিতরে Y, এবং তাই আমরা তাদের পারস্পরিক সম্পর্কের জন্য যথাযথ অনুপাত নিচ্ছি ...
  • দ্য βগুলি আংশিক সম্পর্ক আছে, R2 স্কোয়ার একাধিক পারস্পরিক সম্পর্ক ... আংশিক সহযোগিতা দ্বারা গুণগুলি সংযুক্তি ...
  • আমরা যদি প্রথমে অরথোগোনালাইজ করি তবে βs হবে Cov/Var... এই ফলাফলটি কিছু জ্যামিতিক ধারণা তৈরি করে?

এই থ্রেডগুলির কোনওোটাই আমার পক্ষে কোথাও নেতৃত্ব দিচ্ছে না। এই ফলাফলটি কীভাবে বোঝা যায় তার স্পষ্ট ব্যাখ্যা যে কেউ দিতে পারে।


অসন্তুষ্টির প্রমাণ

R2=SSregSSTot=SSregN=(β1X1+β2X2)2=β12X12+β22X22+2β1β2X1X2

এবং

Cor(Y,X1)β1+Cor(Y,X2)β2=YX1β1+YX2β2=β1X12+β2X1X2β1+β1X1X2+β2X22β2=β12X12+β22X22+2β1β2X1X2

Qed।


আপনার অবশ্যই সূত্রযুক্ত ভেরিয়েবলগুলি ব্যবহার করা উচিত, অন্যথায় আপনার সূত্রটি R2 মধ্যে মিথ্যা গ্যারান্টিযুক্ত হয় না 0 এবং 1। যদিও এই অনুমানটি আপনার প্রমাণে প্রকাশিত হয়েছে তবে এটি এটি শুরুতেই স্পষ্ট করে তুলতে সহায়তা করবে। আপনি সত্যিই যা করছেন তা নিয়ে আমি হতবাক হয়েছি: আপনারR2স্পষ্টভাবে একা মডেলের একটি ফাংশন - ডেটার সাথে কিছু করার নেই - তবুও আপনি উল্লেখ করতে শুরু করলেন যে কোনও কিছুতে আপনার কাছে মডেলটি "ফিট" রয়েছে।
whuber

যদি আপনার শীর্ষ ফলাফলটি কেবল এক্স 1 এবং এক্স 2 পুরোপুরি অসম্পর্কিত হয় তবে তা ধরে রাখবে না?
গুং - মনিকা পুনরায়

@ গুং আমি এটি ভাবি না - নীচে প্রমাণ বলে মনে হচ্ছে এটি নির্বিশেষে কাজ করে। এই ফলাফলটি আমাকেও অবাক করে, অতএব একটি "স্পষ্ট বোঝার প্রমাণ" চাই
করোন

@ হুবুহু আমি নিশ্চিত না যে আপনি "মডেলটির একা ফাংশন" বলতে কী বোঝায়? আমি কেবল মানেR2দুটি পূর্বাভাসকারী ভেরিয়েবল সহ সাধারণ ওএলএস এর জন্য। অর্থাৎ এটি 2 টি ভেরিয়েবল সংস্করণR2=Cor(Y,X)2
করোন

তোমার কিনা তা আমি বলতে পারি না βiপরামিতি বা অনুমান হয়।
whuber

উত্তর:


9

টুপি ম্যাট্রিক্স আদর্শবান।

(এটি একটি লিনিয়ার-বীজগণিতিক উপায় যা বলছেন যে ওআরএলএস হল ভেরিয়েবল দ্বারা বিস্তৃত স্থানটিতে প্রতিক্রিয়া ভেক্টরের একটি অরথোগোনাল প্রক্ষেপণ))


সংজ্ঞা অনুসারে যে স্মরণ

R2=ESSTSS

কোথায়

ESS=(Y^)Y^

(কেন্দ্রিক) পূর্বাভাসিত মান এবং এর বর্গের যোগফল

TSS=YY

(কেন্দ্রিক) প্রতিক্রিয়া মানগুলির বর্গের যোগফল। standardizingY ইউনিট বৈকল্পিকের আগেও বোঝায়

TSS=YY=n.

আনুমানিক সহগগুলি দ্বারা সরবরাহ করা হয়েছে তাও স্মরণ করুন

β^=(XX)XY,

কোথা হইতে

Y^=Xβ^=X(XX)XY=HY

কোথায় H এর প্রোটেকশনকে প্রভাবিত করে "টুপি ম্যাট্রিক্স" Y এটির সর্বনিম্ন স্কোয়ারের উপরে ফিট Y^। এটি প্রতিসম (যা এর একেবারে রূপ থেকেই সুস্পষ্ট) এবং আদর্শবান । এই ফলাফলটির সাথে অপরিচিতদের জন্য এখানে পরবর্তী প্রমাণ রয়েছে। এটি কেবল চারপাশে কাঁপুনি:

HH=HH=(X(XX)X)(X(XX)X)=X(XX)(XX)(XX)X=X(XX)X=H.

অতএব

R2=ESSTSS=1n(Y^)Y^=1nYHHY=1nYHY=(1nYX)β^.

মাঝের গুরুত্বপূর্ণ পদক্ষেপটি হ্যাট ম্যাট্রিক্সের আদর্শশক্তি ব্যবহার করেছিল। ডান হাত আপনার জাদুকরী সূত্র কারণ1nYX এর মধ্যে পারস্পরিক সম্পর্কের সহগগুলির (সারি) ভেক্টর Y এবং এর কলামগুলি X


(+1) খুব সুন্দর লেখার আপ। কিন্তু কেন ^{-}পরিবর্তে ^{-1}সর্বত্র?
অ্যামিবা

1
@ অ্যামিবা এটি একটি সাধারণ বিপরীতমুখী , যেখানে মামলাগুলি পরিচালনা করতে সেখানে রাখুনXX একক হতে পারে।
হোবার

4
অ্যামিবা পেনরোজ, তার মূল কাগজে ( এক জেনারাইজড ইনভার্স ফর ম্যাট্রিকেস , ১৯৫৪) স্বরলিপিটি ব্যবহার করেছেনA। আমি তাও পছন্দ করি নাA+ স্বরলিপি কারণ তারা খুব সহজেই কনজুগেট, ট্রান্সপোসেস বা কনজুগেট ট্রান্সপোজগুলির সাথে বিভ্রান্ত হয়, যেখানে the A স্বরলিপিটি একটি বিপরীতমুখী হিসাবে প্রস্তাবিত তাই নৈমিত্তিক পাঠক এটি ভেবে দূরে সরে যেতে পারে A1যদি তারা পছন্দ করে আপনি খুব ভাল একজন পাঠক - তবে দেখার জন্য ধন্যবাদ।
হোবার

1
আকর্ষণীয় এবং জোরালো অনুপ্রেরণা, তবে আমি কি জিজ্ঞাসা করতে পারি যে এই স্বরলিপিটি এমন কিছু বিষয় যা মাঝেমধ্যে অন্য কোথাও ব্যবহৃত হয় বা এটি আপনার নিজের আবিষ্কার?
অ্যামিবা

5
@ অ্যামিবা: হ্যাঁ, লিনিয়ার মডেলটিতে গ্রেবিলের শাস্ত্রীয় পাঠগুলি সহ এই চিহ্নটি অন্য কোথাও উপস্থিত রয়েছে appears
কার্ডিনাল

5

নিম্নলিখিত তিনটি সূত্র সুপরিচিত, তারা লিনিয়ার রিগ্রেশন সম্পর্কিত অনেক বইয়ে পাওয়া যায়। এগুলি অর্জন করা কঠিন নয়।

β1=rYX1rYX2rX1X21rX1X22

β2=rYX2rYX1rX1X21rX1X22

R2=rYX12+rYX222rYX1rYX2rX1X21rX1X22

যদি আপনি দুটি সমীকরণকে আপনার সমীকরণের স্থানে রাখেন R2=rYX1β1+rYX2β2, আপনি আর-স্কোয়ারের জন্য উপরের সূত্রটি পাবেন।


এখানে একটি জ্যামিতিক "অন্তর্দৃষ্টি" রয়েছে। নীচে দুটি প্রতিক্রিয়া দেখানো ছবি রয়েছেY দ্বারা X1 এবং X2। এই জাতীয় উপস্থাপনা বিষয়বস্তুতে ভেরিয়েবল-হিসাবে-ভেক্টর হিসাবে পরিচিত (দয়া করে এটি কী পড়ুন )। তিনটি ভেরিয়েবল কেন্দ্রিক হওয়ার পরে ছবিগুলি আঁকা হয় এবং তাই (1) প্রতিটি ভেক্টরের দৈর্ঘ্য = স্ট্যান্ড। সংশ্লিষ্ট ভেরিয়েবলের বিচ্যুতি এবং (2) কোণ (এর কোসাইন) প্রতি দুটি ভেক্টরের মধ্যে = সংশ্লিষ্ট ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক।

enter image description here

Y^ রিগ্রেশন ভবিষ্যদ্বাণী (এর অর্থোগোনাল প্রক্ষেপণ) Y "প্লেন এক্স" তে); e ত্রুটি শব্দটি; cosYY^=|Y^|/|Y|, একাধিক পারস্পরিক সম্পর্ক সহগ।

বাম ছবি নিয়ে রচিত স্কিউ স্থানাঙ্ক এরY^ পরিবর্তনশীল উপর X1 এবং X2। আমরা জানি যে এই জাতীয় স্থানাঙ্কগুলি রিগ্রেশন সহগের সাথে সম্পর্কিত। যথা, স্থানাঙ্কগুলি হ'ল:b1|X1|=b1σX1 এবং b2|X2|=b2σX2

এবং ডান ছবিতে উল্লম্ব স্থানাঙ্কগুলি দেখায় । আমরা জানি যে এই জাতীয় স্থানাঙ্কগুলি শূন্য অর্ডার রিলেশন সম্পর্কিত সহগগুলি (এগুলি অরথোগোনাল অনুমানের কোসাইন) rela যদিr1 এর মধ্যে পারস্পরিক সম্পর্ক Y এবং X1 এবং r1 এর মধ্যে পারস্পরিক সম্পর্ক Y^ এবং X1 তারপর সমন্বয় হয় r1|Y|=r1σY=r1|Y^|=r1σY^। একইভাবে অন্য স্থানাঙ্কের জন্য,r2|Y|=r2σY=r2|Y^|=r2σY^

এখনও পর্যন্ত এটি লিনিয়ার রিগ্রেশন ভেক্টর উপস্থাপনের সাধারণ ব্যাখ্যা ছিল। কীভাবে এটি হতে পারে তা দেখানোর জন্য এখন আমরা কার্যটির দিকে রইলাম turnR2=r1β1+r2β2

প্রথমত, তাদের প্রশ্নে প্রত্যাহার করুন যে @ কোরোন এই শর্তটি সামনে রেখেছিল যে তিনটি ভেরিয়েবলকে মানক করা হলে এই অভিব্যক্তিটি সত্য হয় , যা কেবল কেন্দ্রিক নয়, তবে পৃথককেও ছোট করা হয়। তারপরে (অর্থাত্ বোঝা যাচ্ছে)|X1|=|X2|=|Y|=1 ভেক্টরগুলির "কার্যকারী অংশ" হতে) আমাদের সমান স্থানাঙ্ক রয়েছে: b1|X1|=β1; b2|X2|=β2; r1|Y|=r1; r2|Y|=r2; পাশাপাশিR=|Y^|/|Y|=|Y^|। পুনরায় চিত্রিত করুন, এই অবস্থার অধীনে উপরের ছবিগুলির কেবল "প্লেন এক্স":

enter image description here

ছবিটিতে, আমাদের একই লম্বা লম্বা স্থানাঙ্কের এবং স্কিউ স্থানাঙ্কগুলির একটি জোড়া রয়েছে Y^ দৈর্ঘ্যের R। স্কিউ (বা পিছনে) থেকে লম্ব কর্ডিনেটগুলি পাওয়ার জন্য একটি সাধারণ নিয়ম রয়েছে:P=SC, কোথায় Pহয় points X axesঋজু বেশী ম্যাট্রিক্স;Sস্কিউ বেশী একই আকারের ম্যাট্রিক্স; এবংCহয় axes X axesnonorthogonal অক্ষ মধ্যে Angles (cosines) এর প্রতিসম ম্যাট্রিক্স।

X1 এবং X2 সঙ্গে আমাদের ক্ষেত্রে অক্ষ আছে r12তাদের মধ্যে কোসাইন হচ্ছে। সুতরাং,r1=β1+β2r12 এবং r2=β1r12+β2

এগুলি প্রতিস্থাপন করুন rএর মাধ্যমে প্রকাশ করা β@ করোন এর বিবৃতিতে s R2=r1β1+r2β2, এবং আপনি এটি পাবেন R2=β12+β22+2β1β2r12, - যা সত্য , কারণ এটি ঠিক কীভাবে সমান্তরালগ্রামের একটি ত্রিভুজ (ছবিতে টিন্টেড) তার সংলগ্ন দিকগুলি (পরিমাণ ) দ্বারা প্রকাশ করা হয়β1β2r12 স্কেলার পণ্য হচ্ছে)।

এই একই জিনিসটি যে কোনও সংখ্যক ভবিষ্যদ্বাণীকারী এক্স এর ক্ষেত্রে সত্য Unfortunately দুর্ভাগ্যক্রমে, অনেক পূর্বাভাসকীর সাথে একই চিত্র আঁকানো অসম্ভব।


1
এটিও এভাবে তৈরি হয়েছিল দেখে ভাল +1, তবে এটি whuber এর উত্তরের তুলনায় ততটা অন্তর্দৃষ্টি যোগ করে না
করোন

2
@ করোন, আমি কিছু "অন্তর্দৃষ্টি" যুক্ত করেছি যা আপনি নিতে পারেন।
ttnphns

1
+1 সত্যিই দুর্দান্ত (আপডেটের পরে)। আমি ভেবেছিলাম স্থানাঙ্কগুলির মধ্যে রূপান্তরিত করার "সাধারণ নিয়ম" আহ্বান করা কিছুটা ওভারকিল (এবং আমার কাছে কেবল বিভ্রান্তিকর ছিল); যেমন দেখতেR1=β1+ +β2R12একটিতে কেবল কোসাইন সংজ্ঞাটি মনে রাখা উচিত এবং সঠিক ত্রিভুজগুলির মধ্যে একটির দিকে নজর দেওয়া উচিত।
অ্যামিবা

সত্যিই শীতল সম্পাদনা, স্যুইচড গ্রহণযোগ্য।
করোন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.