"ইউনিট-ভেরিয়েন্স" রিজ রিগ্রেশন অনুমানের সীমা যখন


21

অতিরিক্ত বাধা নিয়ে রিজ রিগ্রেশন বিবেচনা করুন যা ; এর বর্গাকার ইউনিটের সমষ্টি (সমানভাবে, ইউনিটের বৈকল্পিক) প্রয়োজন; প্রয়োজনে, কেউ ধরে নিতে পারেন যে এর সাথে বর্গক্ষেত্রের একক রয়েছে:y^y

β^λ=argmin{yXβ2+λβ2}s.t.Xβ2=1.

β^λ যখন \ ল্যাম্বদা \ থেকে \ ইনফটিটির সীমা কত λ?


এখানে কিছু বিবৃতি যা আমি বিশ্বাস করি সত্য:

  1. যখন λ=0 , তখন একটি পরিষ্কার পরিষ্কার সমাধান পাওয়া যায়: ওএলএসের অনুমানকারী β^0=(XX)1Xy এবং সীমাবদ্ধতা মেটানোর জন্য এটি স্বাভাবিক করুন (একজন এটি একটি ল্যাঞ্জরেঞ্জ গুণক যোগ করে এবং পার্থক্য দেখিয়ে দেখতে পারেন):

    β^0=β^0/Xβ^0.
  2. সাধারণভাবে সমাধানটি হ্যাট {{বোল্ডসাইম্বল \ বিটা} _ \ ল্যাম্বদা ^ * = \ বড় ((1+ \ মিউ) \ ম্যাথবিএফ এক্স ^ \ শীর্ষ \ ম্যাথবিএফ এক্স + \ ল্যাম্বদা \ ম্যাথবিএফ আমি \ বড়) ^ {- 1} \ mathbf X ^ \ top \ mathbf y \: \: \ \ मज {সহ \ পাঠ্য the সীমাবদ্ধতা মেটানোর জন্য প্রয়োজনীয়} \ ল্যাম্বদা> 0

    β^λ=((1+μ)XX+λI)1Xywith μ needed to satisfy the constraint.
    হলে আমি কোনও বন্ধ ফর্ম সমাধান দেখতে পাচ্ছি না । মনে হচ্ছে সমাধানটি সীমাবদ্ধতা মেটানোর জন্য কিছু সাধারণ R ল্যাম্বদা ^ * দিয়ে সাধারণ আরআর অনুমানের সমান , তবে আমি \ ল্যাম্বদা ^ * এর জন্য কোনও বদ্ধ সূত্র দেখতে পাচ্ছি না ।λ>0 λλ
  3. যখন λ , সাধারণ আরআর অনুমানকারী

    β^λ=(XX+λI)1Xy
    স্পষ্টতই শূন্যে রূপান্তরিত হয় তবে এর দিকনির্দেশ β^λ/β^λএর দিক থেকে এগোয় Xy , ওরফে প্রথম আংশিক লিস্ট স্কোয়ার (পিএলএস) অংশটি।

বিবৃতি (২) এবং (৩) একসাথে আমাকে ভাবিয়ে তোলে যে সম্ভবত \ টুপি \ \ সাহসী চিহ্ন \ বিটা} _ \ ল্যাম্বদা ^ *β^λ এছাড়াও যথাযথভাবে সাধারণীকরণ করা \ ম্যাথবিএফ এক্স \ \ শীর্ষ \ ম্যাথবিএফ ওয়াইতে রূপান্তরিত হয় Xyতবে আমি নিশ্চিত নই যে এটি সঠিক এবং আমি কোনওভাবেই নিজেকে বোঝাতে সক্ষম হইনি।

উত্তর:


17

একটি জ্যামিতিক ব্যাখ্যা

প্রশ্নটিতে বর্ণিত অনুমানকটি হ'ল ল্যাঞ্জরেঞ্জ গুণকটি নিম্নলিখিত অপটিমাইজেশন সমস্যার সমতুল্য:

minimize f(β) subject to g(β)t and h(β)=1 

f(β)=yXβ2g(β)=β2h(β)=Xβ2

যা জ্যামিতিকভাবে দেখা যেতে পারে, সবচেয়ে ছোট উপবৃত্তাকার সন্ধান হিসাবে যা গোলকের এর ছেদকে স্পর্শ করে এবং উপবৃত্তাকারf(β)=RSS g(β)=th(β)=1


স্ট্যান্ডার্ড রিজ রিগ্রেশন ভিউয়ের সাথে তুলনা

জ্যামিতিক দৃষ্টিকোণ দৃষ্টিভঙ্গির ক্ষেত্রে এটি পয়েন্টের পুরানো দৃষ্টিভঙ্গিকে (স্ট্যান্ডার্ড রিজ রিগ্রেশনের জন্য) পরিবর্তিত করে যেখানে গোলক (ত্রুটি) এবং গোলক ( ) স্পর্শ রয়েছেβ2=t । একটি নতুন দৃশ্যে যেখানে আমরা সেই বিন্দুর সন্ধান করি যেখানে স্পেরয়েড (ত্রুটিগুলি) একটি বক্ররেখা স্পর্শ করে ( দ্বারা জড়িত বিটার আদর্শ )Xβ2=1 । Sp সীমাবদ্ধতার সাথে ছেদ করার কারণে এক গোলক (বাম চিত্রের নীল) নিম্ন মাত্রায় চিত্রে পরিবর্তিত হয় ।Xβ=1

দ্বিমাত্রিক ক্ষেত্রে এটি দেখতে সহজ।

জ্যামিতিক ভিউ

আমরা যখন প্যারামিটার টিউন করি তখন আমরা নীল / লাল গোলকের তুলনামূলক দৈর্ঘ্য বা এবং এর আপেক্ষিক দৈর্ঘ্য পরিবর্তন করি (ল্যাঙ্গরজিয়ান মাল্টিপ্লায়ার্স তত্ত্বে সম্ভবত আনুষ্ঠানিকভাবে এবং একটি ঝরঝরে উপায় আছে ঠিক এর মানে হল যে প্রতিটি জন্য বর্ণনা এর ফাংশন হিসাবে , অথবা বিপরীত, একটি একঘেয়ে ফাংশন। কিন্তু আমি মনে কর তুমি, intuitively দেখতে পারেন স্কোয়ারড অবশিষ্টাংশ এর সমষ্টি শুধুমাত্র বৃদ্ধি যখন আমরা হ্রাস ।)tf(β)g(β) tλ||β||

সমাধান জন্য হিসাবে আপনি 0 এবং এর মধ্যে একটি লাইনে বলা হয়βλλ=0βLS

সমাধান জন্য Is (প্রকৃতপক্ষে যেমন আপনার মন্তব্য করার) প্রথম অধ্যক্ষ উপাদানের loadings হবে। এটি সেই বিন্দু যেখানে মধ্যে সবচেয়ে ছোট । এটি সেই বিন্দু যেখানে একক বিন্দুতে উপবৃত্ত স্পর্শ করে ।βλλβ2βX2=1β2=t|Xβ|=1

এই 2-ডি ভিউতে গোলকের এবং spheroid এর পয়েন্ট। একাধিক মাত্রায় এগুলি বক্ররেখা হবেβ2=tβX2=1

(আমি প্রথম কাল্পনিক। যে এই রেখাচিত্র উপবৃত্ত হবে কিন্তু তারা আরো জটিল আপনি উপবৃত্ত কল্পনা করতে পারে বল দ্বারা বিভক্ত করা হচ্ছে কিছু এলিপসয়েড হতাশার ধরণের তবে প্রান্তগুলি যা কোনও সহজ উপবৃত্ত নয়)Xβ2=1β2t


সীমাλ

প্রথমে (পূর্ববর্তী সম্পাদনাগুলি) আমি লিখেছিলাম যে কিছু সীমাবদ্ধ যার উপরে সমস্ত সমাধান একই (এবং তারা they পয়েন্টে থাকে )। কিন্তু এই হল না কেসλlimβ

LARS অ্যালগরিদম বা গ্রেডিয়েন্ট বংশোদ্ভূত হিসাবে অপ্টিমাইজেশন বিবেচনা করুন। যদি কোনও বিন্দু জন্য কোনও দিক থাকে যেখানে আমরা পরিবর্তন করতে পারি যে পেনাল্টি টার্ম এসএসআর টার্মের চেয়ে কম বৃদ্ধি করে হ্রাস পায় তবে আপনি ন্যূনতম নন ।ββ|β|2|yXβ|2

  • ইন স্বাভাবিক শৈলশিরা রিগ্রেশন আপনার জন্য একটি শূন্য ঢাল (সমস্ত নির্দেশাবলী মধ্যে) থাকতে বিন্দুতে । সুতরাং সমস্ত সীমাবদ্ধ- ক্ষেত্রে সমাধানটি হতে পারে না (যেহেতু শাস্তি না বাড়িয়ে স্কোয়ারের অবশিষ্টাংশের যোগফল হ্রাস করার জন্য একটি অনন্য পদক্ষেপ নেওয়া যেতে পারে)।|β|2β=0λβ=0
  • Lasso জন্য এই হল না একই যেহেতু: শাস্তি হয় (তাই শূন্য ঢাল সঙ্গে দ্বিঘাত নয়)। যে কারণে কিছু সীমিত মান থাকবে যার উপরে সমস্ত সমাধান শূন্য কারণ পেনাল্টি টার্ম ( দ্বারা গুণিত ) বর্গের অবশিষ্টাংশ হ্রাসের চেয়ে আরও বৃদ্ধি পাবে।|β|1λlimλ
  • সীমাবদ্ধ রিজের জন্য আপনি নিয়মিত রিজ রিগ্রেশন হিসাবে একই পাবেন। আপনি পরিবর্তন করেন তাহলে থেকে শুরু তারপর এই পরিবর্তন হতে হবে ঋজু থেকে ( উপবৃত্তাকার পৃষ্ঠতলের ঋজু হয় ) এবং জরিমানার শর্ত পরিবর্তন না করে স্কোয়ারের অবশিষ্টাংশের যোগফলকে হ্রাস না করে একটি অনন্য পদক্ষেপের মাধ্যমে পরিবর্তন করা যেতে পারে। সুতরাং যে কোনও সীমাবদ্ধ পয়েন্টের জন্য সমাধান হতে পারে না।ββββ|Xβ|=1βλβ

সীমা সম্পর্কে আরও নোটλ

ইনফিনিটির জন্য স্বাভাবিক রিজ রিগ্রেশন সীমাবদ্ধতা রিজ রিগ্রেশন ভিন্ন পয়েন্টের সাথে মিলে যায়। এই 'পুরানো' সীমাটি সেই বিন্দুর সাথে মিলে যায় যেখানে সমান -1 এর সমান হয়। তারপরে স্বাভাবিক সমস্যাটিতে লাগরঞ্জ ফাংশনের ডেরাইভেটিভλμ

2(1+μ)XTXβ+2XTy+2λβ
স্ট্যান্ডার্ড সমস্যার মধ্যে ল্যাংরেজ ফাংশনের ডাইরিভেটিভের সমাধানের সাথে মিল রাখে

2XTXβ+2XTy+2λ(1+μ)βwith β=(1+μ)β


লিখেছেন স্ট্যাকএক্সচেঞ্জ স্ট্রাইক


+1 টি। অনেক অনেক ধন্যবাদ, এটি দুর্দান্ত সহায়ক! এটিকে ভাবতে আমার কিছুটা সময় লাগবে।
অ্যামিবা বলেছেন পুনর্নির্মাণ মনিকা

এটি উল্লেখ করার মতো যে লাল এবং কালো উপবৃত্তগুলির একই আকৃতি রয়েছে: এ কারণেই তারা যেখানে তাদের স্পর্শ করে তাদের কেন্দ্রগুলিকে যুক্ত রেখার উপর অবস্থিত। আমার প্রশ্নের পয়েন্ট # 1 এর দুর্দান্ত গ্রাফিকাল প্রমাণ proof
অ্যামিবা বলছে মনিকাকে

আমি আপনার আঁকার উপর কোথায় বেটা অনন্ত ল্যাম্বদার সাথে রিজ প্রাক্কলনকারীর সাথে সাদৃশ্যপূর্ণ, কালো উপবৃত্তির উপর শুয়ে থাকতে স্বাভাবিক করেছি understand আমি মনে করি এটি এবং (আমার স্বরলিপি ব্যবহার করে) - এর মধ্যে যে দুটি পয়েন্ট যা আপনার অঙ্কনের কালো খোলা চেনাশোনাগুলির সাথে চিহ্নিত। সুতরাং আমরা যদি রিজ রিগ্রেশন করি এবং সমাধানটিকে সাধারণীকরণ করি এবং ল্যাম্বডাকে 0 থেকে অনন্তের দিকে বাড়িয়ে তুলি তবে এটি সম্ভবত আমাদের একই চাপকে নিয়ে যায়, তবে পিসি 1 পর্যন্ত পুরো পথটি নয় not পরিবর্তে, সীমাবদ্ধভাবে স্পষ্টভাবে রেখে, সমাধানগুলি PC1 অবধি পুরোপুরি এগিয়ে যায়। β0βXβ=1
অ্যামিবা

+5 (আমি উত্তমভাবে আপনার জবাবটি পুরষ্কার দেব) started আমি আমার নিজস্ব উত্তরও পোস্ট করেছি কারণ আমি কিছু বীজগণিত ডেরাইভেশন করেছি এবং প্রশ্নটিতে যুক্ত করা খুব বেশি ছিল। আপনার সিদ্ধান্তে আমি নিশ্চিত নই যে এখানে কিছু সীমাবদ্ধ থাকবে যার পরে সমাধানটি আর পরিবর্তন হবে না এবং পিসি 1 দ্বারা দেওয়া হবে। আমি এটি বীজগণিতভাবে দেখতে পাচ্ছি না এবং কেন এটি থাকতে হবে তার জন্য আপনার যুক্তিটি আমি পুরোপুরি বুঝতে পারি না। আসুন এটি বের করার চেষ্টা করি। λlim
অ্যামিবা বলেছেন রোনস্টেট মনিকা

@ আমেবা, আপনি সীমাবদ্ধ mb ল্যাম্বদা existing বিদ্যমান নেই সম্পর্কে সঠিক ছিলেন । আমি খুব স্বজ্ঞাততার সাথে যুক্তি দিয়েছিলাম এবং নিয়মিত রিজ রিগ্রেশনকে সীমাবদ্ধ রিজ রিগ্রেশন-এর জন্য একটি নির্দিষ্ট শর্ত থেকে দ্রুত লাফিয়ে উঠি। নিয়মিত আরআর point বিন্দুতে জন্য একটি শূন্য allাল (সমস্ত দিকের দিকে) । আমি ভেবেছিলাম যে ( ) আপনি সীমাবদ্ধ প্রতিরোধের সাথে এটি পাবেন না not তবে ক্ষেত্রে সীমাবদ্ধ আপনি সমস্ত দিক থেকে 'সরাতে' পারবেন না । λlim|β|2β=0β0β|Xβ|=1β
সেক্সটাস এম্পিরিকাস

10

এটি @ মার্তিজানের সুন্দর জ্যামিতিক উত্তরের একটি বীজগণিত অংশ।

সবার আগে, যখন হয় প্রাপ্তি সহজ: সীমাতে, লোকসানের কার্যক্রমে প্রথম পদটি নগণ্য হয়ে যায় এবং এভাবে উপেক্ষা করা যায়। অপ্টিমাইজেশনের সমস্যাটি যা প্রথম প্রধান উপাদান

β^λ=argmin{yXβ2+λβ2}s.t.Xβ2=1
λ
limλβ^λ=β^=argminXβ2=1β2argmaxβ2=1Xβ2,
X(যথাযথভাবে মাপা) এই প্রশ্নের উত্তর।

এখন আসুন আমি আমার প্রশ্নের # 2 পয়েন্টে উল্লেখ করা কোনও মানের সমাধান বিবেচনা করি। ক্ষতির ফাংশনে যোগ করার জন্য ল্যাঞ্জরেজ গুণক এবং পৃথকীকরণের মাধ্যমে আমরা পেয়েছিλμ(Xβ21)

β^λ=((1+μ)XX+λI)1Xywith μ needed to satisfy the constraint.

ল্যাম্বদা শূন্য থেকে অসীমের দিকে বেড়ে গেলে এই সমাধানটি কীভাবে আচরণ করবে ?λ

  • যখন , আমরা একটি মাপের সংস্করণ পাই:λ=0

    β^0β^0.
  • ধনাত্মক তবে ছোট মানগুলির জন্য , সমাধানটি কয়েকটি রিজ অনুমানের আকারযুক্ত সংস্করণ:λ

    β^λβ^λ.
  • কখন, সীমাবদ্ধতা প্রয়োজনীয় মান । এর অর্থ হ'ল সমাধানটি প্রথম পিএলএস উপাদানটির একটি মাপা সংস্করণ (যার অর্থ সংশ্লিষ্ট রিজ অনুমানকারী ):λ=XXy(1+μ)0λ

    β^XXyXy.
  • যখন চেয়ে বড় হয়, প্রয়োজনীয় শব্দটি নেতিবাচক হয়ে যায়। এখন থেকে সমাধানটি হল সিউডো-রিজ অনুমানকটির একটি নেতিবাচক নিয়মিতকরণ প্যারামিটার ( নেতিবাচক রিজ ) এর একটি মাপা সংস্করণ । দিকনির্দেশের ক্ষেত্রে, আমরা এখন অসীম ল্যাম্বদা সহ অতীত রিজ রিগ্রেশন areλ(1+μ)

  • যখন , শব্দটি zero শূন্যে চলে যাবে (বা এতে বিভক্ত হবে) অনন্ত) যদি না যেখানে বৃহত্তম একক মান । এটি principal সীমাবদ্ধ এবং প্রথম মূল অক্ষের সাথে সমানুপাতিক । আমরা সেট করতে হবে বাধ্যতা সন্তুষ্ট। সুতরাং, আমরা সেইλ((1+μ)XX+λI)1μ=λ/smax2+αsmaxX=USVβ^λV1μ=λ/smax2+U1y1

    β^V1.

সামগ্রিকভাবে, আমরা দেখতে পাই যে এই সীমাবদ্ধ ন্যূনতমকরণ সমস্যাটি নিম্নলিখিত বর্ণালীতে ওএলএস, আরআর, পিএলএস এবং পিসিএর ইউনিট-ভেরিয়েন্স সংস্করণগুলিকে অন্তর্ভুক্ত করেছে:

OLSRRPLSnegative RRPCA

এটি "কন্টিনিয়াম রিগ্রেশন" নামে পরিচিত একটি অস্পষ্ট (?) কেমোমেট্রিক্স কাঠামোর সমতুল্য বলে মনে হচ্ছে ( https://scholar.google.de/scholar?q="continuum+regression " , বিশেষত স্টোন এবং ব্রুকস 1990, সানডবার্গ 1993, Björkström & Sundberg 1999, ইত্যাদি) যা পূর্ণবিস্তার একই একীকরণ অনুমতি দেয় এমন একটি তদর্থক নির্ণায়কএটি স্পষ্টতই স্কেলড ওএলএস প্রদান করে যখন , পিএলএস যখন , পিসিএ যখন , এবং

T=corr2(y,Xβ)Varγ(Xβ)s.t.β=1.
γ=0γ=1γ0<γ<11<γ< , দেখুন 1993 সালে সানডবার্গ।

আরআর / পিএলএস / পিসিএ / ইত্যাদির সাথে বেশ খানিকটা অভিজ্ঞতা থাকা সত্ত্বেও, আমি স্বীকার করতেই পারি যে আমি এর আগে "কন্টিনাম রিগ্রেশন" কখনও শুনিনি। আমার এও বলা উচিত যে আমি এই শব্দটিকে অপছন্দ করি।


একটি স্কিম্যাটিক যা আমি @ মার্টিজন এর একটি ভিত্তিতে করেছি:

ইউনিট-ভেরিয়েন্স রিজ রিগ্রেশন

আপডেট: চিত্রটি নেতিবাচক রিজ পাথের সাথে আপডেট হয়েছে, এটি কীভাবে দেখতে হবে তা প্রস্তাব দেওয়ার জন্য @ মার্তিজনকে বিশাল ধন্যবাদ। আরও তথ্যের জন্য নেতিবাচক রিজ রিগ্রেশন বোঝার জন্য আমার উত্তর দেখুন ।


"কন্টিনিয়াম রিগ্রেশন" একটি সাধারণ কাঠামোর মধ্যে পিএলএস এবং পিসিএকে একীকরণ করার লক্ষ্যে কৌশলগুলির একটি আশ্চর্যজনকভাবে বিস্তৃত শ্রেণির একটি বলে মনে হচ্ছে। নেতিবাচক পর্বগুলি নিয়ে গবেষণা করার আগে পর্যন্ত আমি এর আগে কখনও শুনিনি (আমি আপনার সাথে সংযুক্ত নেতিবাচক রিজ প্রশ্নের প্রথম মন্তব্যে পেজ বজর্কস্ট্রন এবং সানডবার্গকে একটি লিঙ্ক সরবরাহ করি), যদিও এটি সম্ভবত বিস্তৃতভাবে আলোচিত হয়েছে কেমোমেট্রিক সাহিত্য। এটি পরিসংখ্যানের অন্যান্য ক্ষেত্রগুলি থেকে বিচ্ছিন্নভাবে আপাতদৃষ্টিতে বিকশিত হওয়ার কিছু reasonতিহাসিক কারণ থাকতে হবে। (1/3)
রায়ান সিমন্স 14

একটি কাগজ আপনি পড়তে চাইতে পারেন হ'ল ডি জং এট আল। (2001) । তাদের "ক্যানোনিকাল পিএলএস" গঠনের বিষয়টি আপনার সমতুল্য হিসাবে দ্রুত নজরে বলে মনে হচ্ছে, যদিও আমি স্বীকার করি যে আমি এখনও কঠোরভাবে গণিতের তুলনা করি নি (তারা একই শিরাতে আরও বেশ কয়েকটি পিএলএস-পিসিএ জেনারালাইজেশনের একটি পর্যালোচনা সরবরাহ করে)। তবে তারা কীভাবে সমস্যার ব্যাখ্যা দিয়েছে তা দেখার জন্য অন্তর্দৃষ্টিযোগ্য হতে পারে। (2/3)
রায়ান সিমন্স

যদি সেই লিঙ্কটি মারা যায়, সম্পূর্ণ প্রশংসাপত্রটি হ'ল: সিজম্যান ডি জং, ব্যারি এম ওয়াইজ, এন। লরেন্স রিকার। "ক্যানোনিকাল আংশিক সর্বনিম্ন স্কোয়ার এবং ধারাবাহিক পাওয়ারের রিগ্রেশন" " কেমোমেট্রিক্স জার্নাল, 2001; 15: 85-100। doi.org/10.1002/… (3/3)
রায়ান সিমন্স

1
আহ, ঠিক আছে, তারপরে এবং যান তবে তাদের অনুপাতটি । যাইহোক, পিএলএস এবং পিসিএ ভেক্টরগুলির মধ্যে (negativeণাত্মক) সেক্টরে নেতিবাচক রিজ রিগ্রেশন পাথ এমন হওয়া উচিত যা তাদের উপবৃত্তের উপরে প্রজেকশনPLS এবং PCA পয়েন্টের মধ্যে রয়েছে between ( মিও যেমন অনন্তের দিকে চলে যায় তেমনি অনন্তের দিকে যাওয়ার আদর্শটি বোঝায় , সুতরাং পথটি নীচের ডানদিকে চলতে থাকে, প্রাথমিকভাবে স্পর্শকাতর, নেতিবাচক, পিএলএস এবং শেষ পর্যন্ত পিসিএ পর্যন্ত)λ1+μ±smax2|Xβ=1|μ
সেক্সটাস এম্পিরিকাস

1
এটি দৃশ্যায়নে যোগ করবে। আমি বর্তমানের তিনটি আরআর পাথ পয়েন্টগুলি (যেখানে বৃত্ত এবং উপবৃত্ত স্পর্শ) নীচে ডানদিকে অবিরত এবং অবশেষে অনন্ত সময়ে বৃত্ত এবং উপবৃত্তাকার যে জায়গাটি বৃত্ত স্পর্শ করবে সেই দিকের দিকে 'স্পর্শ' করা উচিত|β|2=t|X(ββ^)|2=RSS|β|2=tpca|Xβ|2=1
সেক্সটাস এম্পেরিকাস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.