বিপরীত রিজ রিগ্রেশন: প্রদত্ত প্রতিক্রিয়া ম্যাট্রিক্স এবং রিগ্রেশন সহগ, উপযুক্ত ভবিষ্যদ্বাণীকারী সন্ধান করুন


16

একটি প্রমিত OLS ঔজ্জ্বল্যের প্রেক্ষাপটে রিগ্রেশন সমস্যা বিবেচনা করুন : আমার ম্যাট্রিকস রয়েছে এবং \ এক্স এবং আমি L = \ | \ Y- \ X \ B \ | ^ 2 হ্রাস করতে \ বি সন্ধান করতে চাই সমাধানটি \ টুপি \ বি = \ আরগমিন_ \ বি \ {এল \} = (\ এক্স ^ \ শীর্ষ \ এক্স) ^ + \ এক্স ^ \ শীর্ষ \ ওয়াই দ্বারা প্রদত্ত YXβΒ = argmin β { এল } = ( এক্সএক্স ) + + এক্সওয়াই

L=YXβ2.
β^=argminβ{L}=(XX)+XY.

আমি একটি "বিপরীত" সমস্যাও তৈরি করতে পারি: প্রদত্ত Y এবং β , এমন একটি X^ যা \ টুপি \ বি \ প্রায় \ বি ^ * উপার্জনβ^β করবে, অর্থাৎ argminβ{L}β2 । কথায় কথায়, আমার কাছে প্রতিক্রিয়া ম্যাট্রিক্স Y এবং সহগ ভেক্টর β এবং আমি ভবিষ্যদ্বাণীকারী ম্যাট্রিক্সটি সন্ধান করতে চাই যা \ বি ^ * এর নিকটবর্তী সহগফল অর্জন করবে β। এটি অবশ্যই solution টুপি \ এক্স = \ আরগমিন_ \ এক্স \ বিগ \ {\ | \ আরগমিন_ \ বি \ {এল \} - \ বি ^ * \ | ^ 2 \ বিগ \ with সহ একটি ওএলএস রিগ্রেশন সমস্যা

X^=argminX{argminβ{L}β2}=Yβ(ββ)+.

স্পেসিফিকেশন আপডেট: @ জিওম্যাট 22 তার উত্তরে ব্যাখ্যা করেছে যে, যদি Y ভেক্টর হয় (যেমন যদি কেবলমাত্র একটি প্রতিক্রিয়া পরিবর্তনশীল থাকে) তবে এই X^ র‌্যাঙ্ক এক হবে এবং বিপরীত সমস্যাটি ব্যাপকভাবে নির্ধারিত হয়। আমার ক্ষেত্রে, Y আসলে একটি ম্যাট্রিক্স (অর্থাত্ অনেক প্রতিক্রিয়ার ভেরিয়েবল রয়েছে, এটি মাল্টিভারিয়েট রিগ্রেশন)। তাই X হয় n×p , Y হয় n×q এবং β হল p×q


আমি রিজ রিগ্রেশনটির জন্য "বিপরীত" সমস্যা সমাধানে আগ্রহী। যথা, আমার ক্ষতির ফাংশনটি এখন

L=YXβ2+μβ2
এবং সমাধানটি
β^=argminβ{L}=(XX+μI)1XY.

"বিপরীত" সমস্যাটি হ'ল

X^=argminX{argminβ{L}β2}=?

আবার, আমার কাছে একটি প্রতিক্রিয়া ম্যাট্রিক্স Y এবং একটি গুণাগুণ ভেক্টর β and * রয়েছে এবং আমি একটি ভবিষ্যদ্বাণীকারী ম্যাট্রিক্স সন্ধান করতে চাই যা ^ বি ^ * এর কাছাকাছি সহগফল অর্জন করবে β

আসলে দুটি সম্পর্কিত সূত্র রয়েছে:

  1. এই X^ দেওয়া Y এবং β এবং μ
  2. এই এবং দেওয়া এবং । μ ওয়াইβ*X^μ^Yβ

তাদের উভয়ের সরাসরি সমাধান আছে কি?


সমস্যাটি বর্ণনা করার জন্য এখানে একটি সংক্ষিপ্ত মতলব সংক্ষেপ:

% generate some data
n = 10; % number of samples
p = 20; % number of predictors
q = 30; % number of responses
Y = rand(n,q);
X = rand(n,p);
mu = 0;
I = eye(p);

% solve the forward problem: find beta given y,X,mu
betahat = pinv(X'*X + mu*I) * X'*Y;

% backward problem: find X given y,beta,mu
% this formula works correctly only when mu=0
Xhat =  Y*betahat'*pinv(betahat*betahat');

% verify if Xhat indeed yields betahat
betahathat = pinv(Xhat'*Xhat + mu*I)*Xhat'*Y;
max(abs(betahathat(:) - betahat(:)))

এই কোড শূন্য আউটপুট যদি mu=0না অন্যথায়।


যেহেতু এবং দেওয়া হয়, তারা ক্ষতির বিভিন্নতাগুলিকে প্রভাবিত করে না। সুতরাং (1) এ আপনি এখনও ওএলএস করছেন। (২) সমানভাবে সহজ, কারণ আপনার উপর চাপিয়ে দেওয়ার ক্ষেত্রে যে কোনও প্রতিবন্ধকতার সীমাবদ্ধতার মধ্যে নির্বিচারে নেতিবাচকভাবে গ্রহণ করে লোকসানটি নির্বিচারে ছোট করা যায়। এটি আপনাকে কেস (1) এ হ্রাস করে। Bμμ^
whuber

@ শুভ ধন্যবাদ আমি মনে করি আমি এটি যথেষ্ট পরিষ্কারভাবে ব্যাখ্যা করিনি। বিবেচনা করুন (1)। এবং দেওয়া হয় (আসুন একে ), তবে আমার কাছে খুঁজে পাওয়া দরকার যা কাছাকাছি রিজ রিগ্রেশন সহগগুলি অর্জন করবে , অন্য কথায় আমি ন্যূনতম করতে চাইকেন এটি ওএলএস হওয়া উচিত তা আমি দেখছি না। BμBXBX
argminB{Lridge(X,B)}B2.
অ্যামিবা বলছেন মনিকাকে

এটি আমার কাছে এবং আমি করতে চাই যে নিকটবর্তী । এটি । f(v,w)vargminwf(v,w)wargminvf(v,w)
অ্যামিবা

আপনার পোস্টে প্রকাশটি বিষয়টি সম্পর্কে বিভ্রান্তিকর, কারণ স্পষ্টতই আপনি কে ক্ষতি ফাংশন হিসাবে ব্যবহার করছেন না । আপনি কি পোস্টে সমস্যার (1) এবং (2) এর সুনির্দিষ্ট বিবরণ দিতে পারেন? L
whuber

2
@ hxd1011 এক্স এর অনেকগুলি কলামকে সাধারণত "একাধিক রিগ্রেশন" বলা হয়, ওয়াইয়ের অনেকগুলি কলামকে সাধারণত "মাল্টিভারিয়েট রিগ্রেশন" বলা হয়।
অ্যামিবা বলছেন মনিকাকে

উত্তর:


11

প্রশ্নটি আগ্রহের সমস্যার আরও সূক্ষ্ম সূচনায় রূপান্তরিত হওয়ার পরে, আমি কেস 1 (পরিচিত রিজ প্যারামিটার) এর সমাধান পেয়েছি। এটি কেস 2 এর জন্যও সহায়তা করবে (বিশ্লেষণাত্মক সমাধানটি হুবহু নয়, একটি সাধারণ সূত্র এবং কিছু বাধা)।

সংক্ষিপ্তসার: দুটি বিপরীত সমস্যা সূত্রের কোনওটিরই একটি অনন্য উত্তর নেই। ক্ষেত্রে 2 এর ক্ষেত্রে , যেখানে রিজ প্যারামিটার অজানা, সেখানে for এর জন্য অনেকগুলি সমাধান । ক্ষেত্রে 1, যেখানে দেওয়া হয়েছে, -মান বর্ণালীতে অস্পষ্টতার কারণে জন্য সীমাবদ্ধ সংখ্যার সমাধান রয়েছে ।এক্স ω ω [ 0 , ω সর্বোচ্চ ] ω এক্স ωμω2Xωω[0,ωmax]ωXω

(ডেরাইভেশনটি কিছুটা দীর্ঘ, তাই টিএল, ডিআর: শেষে একটি কার্যকারী মাতলাব কোড রয়েছে))


নির্ধারিত কেস ("ওএলএস")

সামনের সমস্যাটি হ'ল যেখানে , , এবং । এক্স আর এন × পি বি আর পি × কি ওয়াই আর এন × কিউ

minBXBY2
XRn×pBRp×qYRn×q

আপডেট হওয়া প্রশ্নের উপর ভিত্তি করে, আমরা ধরে নেব , সুতরাং নির্ধারিত এবং অধীনে । প্রশ্নে হিসেবে আমরা "ডিফল্ট" অনুমান করা হবে (ন্যূনতম -norm) সমাধান যেখানে হয় pseudoinverse এর ।বি এক্স ওয়াই এল 2 বি = এক্স + ওয়াই এক্স + এক্সn<p<qBXYL2

B=X+Y
X+X

একবচন মান পচানি (এইখান থেকে SVD এর) , কর্তৃক প্রদত্ত * pseudoinverse নির্ণিত করা যেতে পারে ** (* প্রথম এক্সপ্রেশনটি সম্পূর্ণ এসভিডি ব্যবহার করে, যখন দ্বিতীয় এক্সপ্রেশনগুলি হ্রাস এসভিডি ব্যবহার করে। ** সরলতার জন্য আমি ধরে নিয়েছি এর পূর্ণ পদ রয়েছে, অর্থাৎ বিদ্যমান রয়েছে।)এক্স = ইউ এস ভি টি = ইউ এস 0 ভি টি 0 এক্স + = ভি এস + ইউ টি = ভি 0 এস - 1 0 ইউ টি এক্স এস - 1 0X

X=USVT=US0V0T
X+=VS+UT=V0S01UT
XS01

সুতরাং সামনের সমস্যার সমাধান ভবিষ্যতের রেফারেন্সের জন্য, আমি নোট করব যে , কোথায় হ'ল একক মানগুলির ভেক্টর।

BX+Y=(V0S01UT)Y
S0=diag(σ0)σ0>0

বিপরীত সমস্যায় আমাদের এবং দেওয়া হয় । আমরা জানি যে উপরের প্রক্রিয়া থেকে এসেছিল, তবে আমরা জানি না । কাজটি তখন উপযুক্ত নির্ধারণ করা ।YBBXX

আপডেট করা প্রশ্নে উল্লিখিত হিসাবে, এক্ষেত্রে আমরা পুনরুদ্ধার করতে পারি মূলত একই পন্থাটি ব্যবহার করে, অর্থাৎ এখন ব্যবহার করে ।X

X0=YB+
B

অতিরিক্ত নির্ধারিত কেস (রিজ অনুমানক)

"ওএলএস" ক্ষেত্রে, নিম্ন-নির্ধারিত সমস্যাটি ন্যূনতম-আদর্শ সমাধানটি বেছে নিয়ে সমাধান করা হয়েছিল , অর্থাৎ আমাদের "অনন্য" সমাধানটি স্পষ্টতই নিয়মিত করা হয়েছিল ।

সর্বনিম্ন আদর্শ সমাধানটি বেছে নেওয়ার পরিবর্তে , আমরা আদর্শটি কতটা ছোট হওয়া উচিত তা নিয়ন্ত্রণ করতে একটি পরামিতি প্রবর্তন করি , অর্থাৎ আমরা রিজ রিগ্রেশন ব্যবহার করি ।ω

এই ক্ষেত্রে, আমরা একটি আছে সিরিজ এগিয়ে সমস্যার , = 1 , ... , কুই দ্বারা দেওয়া হয় যে সর্বনিম্ন βএক্স β - Y 2 + + ω 2β 2 বিভিন্ন বাম এবং ডান সংগ্রহ মধ্যে দিকের ভেক্টর বি ω = [ β 1 , ... , β ]βkk=1,,q

minβXβyk2+ω2β2
সমস্যার এই সংগ্রহটি নিম্নোক্ত "ওএলএস" সমস্যা হ্রাস করা যেতে পারে ন্যূনতম বিএক্স ω বি - ওয়াই 2 যেখানে আমরা বর্ধিত ম্যাট্রিক্স X ω = [ X ω I ] প্রবর্তন করেছি
Bω=[β1,,βk],Y=[y1,,yk]
minBXωBY2
Xω=[XωI],Y=[Y0]

Bω=X+Y
Bω=(V0Sω2UT)Y
σω2=σ02+ω2σ0
pnσωσ0

Xω=YBω+

Xω=USω2V0T
σω2

σ0σω2ω

σ0=σ¯±Δσ,σ¯=12σω2,Δσ=(σ¯+ω)(σ¯ω)

Xσ¯±Δσsgn+ω=0+ωω

% Matlab demo of "Reverse Ridge Regression"
n = 3; p = 5; q = 8; w = 1*sqrt(1e+1); sgn = -1;
Y = rand(n,q); X = rand(n,p);
I = eye(p); Z = zeros(p,q);
err = @(a,b)norm(a(:)-b(:),Inf);

B = pinv([X;w*I])*[Y;Z];
Xhat0 = Y*pinv(B);
dBres0 = err( pinv([Xhat0;w*I])*[Y;Z] , B )

[Uw,Sw2,Vw0] = svd(Xhat0, 'econ');

sw2 = diag(Sw2); s0mid = sw2/2;
ds0 = sqrt(max( 0 , s0mid.^2 - w^2 ));
s0 = s0mid + sgn * ds0;
Xhat = Uw*diag(s0)*Vw0';

dBres = err( pinv([Xhat;w*I])*[Y;Z] , B )
dXerr = err( Xhat , X )
sigX = svd(X)', sigHat = [s0mid+ds0,s0mid-ds0]' % all there, but which sign?

Bpn

ωω

ωωmax=σ¯n=min[12σω2]

X^Bσ0SVD[X]

Xrnd=Uw*diag(s0mid+sign(randn(n,1)).*ds0)*Vw0'; % random signs
dBrnd=err(pinv([Xrnd;w*I])*[Y;Z],B) % B is always consistent ...
dXrnd=err(Xrnd,X) % ... even when X is not

1
+11। এই প্রশ্নের উত্তরের জন্য আপনি যে সমস্ত প্রচেষ্টা করেছিলেন এবং আমাদের যে সমস্ত আলোচনার জন্য রেখেছেন তার জন্য অনেক ধন্যবাদ। এটি পুরোপুরি আমার প্রশ্নের উত্তর বলে মনে হচ্ছে। আমি অনুভব করেছি যে কেবল আপনার উত্তর গ্রহণ করা এই ক্ষেত্রে যথেষ্ট নয়; এটি বর্তমানে এই উত্তরটিতে থাকা দুটি তুলনায় অনেক বেশি দাবিদার। চিয়ার্স।
অ্যামিবা বলছেন মনিকাকে

pnX

@ জিওম্যাটট২২২ আমার মূল প্রশ্নে আমার মন্তব্য বলেছেন যে ব্যবহার pinvকরা ভাল জিনিস নয়, আপনি কি একমত?
হাইতাও ডু

1
@ hxd1011 সাধারণভাবে আপনি (প্রায়) কখনই স্পষ্টরূপে কোনও ম্যাট্রিক্স সংখ্যায় উল্টাতে চান না এবং এটি সিউডো-ইনভার্সের জন্যও ধারণ করে। আমি এটি যে দুটি কারণে এখানে ব্যবহার করেছি তা হ'ল) ​​1) গাণিতিক সমীকরণ + অ্যামিবার ডেমো কোডের সাথে ধারাবাহিকতা এবং 2) নিম্ন নির্ধারিত সিস্টেমগুলির ক্ষেত্রে ডিফল্ট মতলব "স্ল্যাশ" সমাধানগুলি পিনভের থেকে পৃথক হতে পারে । আমার কোডের প্রায় সব ক্ষেত্রেই যথাযথ \ বা / আদেশগুলি প্রতিস্থাপন করা যেতে পারে, যা সাধারণত পছন্দ করা হয়। (এগুলি
মতলবকে

1
@ hxd1011 আমার পূর্ববর্তী মন্তব্যের দ্বিতীয় পয়েন্টে স্পষ্ট করতে, মূল প্রশ্নে আপনার মন্তব্যের লিঙ্ক থেকে : "যদি A এর পদক্ষেপ A এর কলামের সংখ্যার চেয়ে কম হয়, তবে x = A \ B ন্যূনতম নয় আদর্শ সমাধান more
জিওম্যাটট22
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.