বদ্ধ ফর্মের লসো দ্রবণটি বের করা


52

minβ(YXβ)T(YXβ)β1t

βjlasso=sgn(βjLS)(|βjLS|γ)+
X

এটি কিছুটা বিভ্রান্ত বলে মনে হচ্ছে। শুরুতে আপনি একটি প্রতিবন্ধকতা t এবং সমাধানে আপনি একটি প্যারামিটার \ গামা পরিচয় করিয়ে দিন γ। আমি অনুমান করছি যে আপনি এই দু'টি দ্বৈত সমস্যার মাধ্যমে সম্পর্কিত হতে চান, তবে আপনি কী সন্ধান করছেন তা আপনি পরিষ্কার করে দিতে পারেন।
কার্ডিনাল

2
আংশিকভাবে খোঁজার, @cardinal সাড়া β যে ছোট (YXβ)(YXβ) সাপেক্ষে β1t খোঁজার সমতূল্য β যে ছোট (YXβ)(YXβ)+γj|βj|t এবং am গামার মধ্যে 1-1 টি সম্পর্ক রয়েছে γ। নরম-চৌম্বকীয় ফলাফলটি কেন 'সহজে' তা দেখতে, আমি দ্বিতীয় প্রকাশটি (আমার মন্তব্যে) সমাধান করার পরামর্শ দিই।

2
আরেকটি নোট, যখন খোঁজার β যে ছোট (YXβ)(YXβ)+γj|βj|, সমস্যাটিকে βj>0 , βj<0 , এবং \ বিটা = 0 কে বিভক্ত করুনβ=0

2
@ কার্ডিনাল আহ হ্যাঁ, 1-1 টি ভুল। সংশোধন: প্রতিটি t0 , আপনি একটি am গামা \ গিগ 0 খুঁজে পেতে পারেন γ0

3
একটি দুর্দান্ত আলোচনার জন্য ধন্যবাদ! আমি এই ভিডিওটি অবশ্যই পাঠাতে পেরেছি - লাসো সমন্বয় বংশোদ্ভূত আপডেট আবিষ্কার করা , যা এই আলোচনার সাথে অত্যন্ত প্রাসঙ্গিক এবং খুব সুন্দরভাবে সমাধানের মধ্য দিয়ে চলে। ভবিষ্যতের দর্শকদের জন্য সহায়ক হতে পারে :-)
জোরবার

উত্তর:


64

কারুশ-কুহান-টাকার অবস্থার মধ্য দিয়ে মোটামুটি অর্থনৈতিক পন্থা সহ এটি বেশ কয়েকটি উপায়ে আক্রমণ করা যেতে পারে ।

নীচে একটি বেশ কয়েকটি প্রাথমিক বিকল্প যুক্তি রয়েছে।

অরথোগোনাল ডিজাইনের জন্য সর্বনিম্ন স্কোয়ার সমাধান

ধরুন অर्थোগোনাল কলাম দ্বারা গঠিত। তারপরে, সর্বনিম্ন-স্কোয়ার সমাধান হ'ল X

β^LS=(XTX)1XTy=XTy.

কিছু সমতুল্য সমস্যা

ল্যাঙ্গরজিয়ান ফর্মের মাধ্যমে, এটি দেখতে সহজবোধ্য যে প্রশ্নটিতে বিবেচিত একটি সমতুল্য সমস্যা হ'ল

minβ12yXβ22+γβ1.

প্রথম পদটি প্রসারিত করার সাথে সাথে আমরা পেয়েছি এবং যেহেতু তেমন কিছু নেই আগ্রহের ভেরিয়েবলগুলির মধ্যে, আমরা এটিকে ত্যাগ করতে এবং আরও একটি সমতুল্য সমস্যা বিবেচনা করতে পারি, 12yTyyTXβ+12βTβyTy

minβ(yTXβ+12β2)+γβ1.

হিসাবে উল্লেখ করে , পূর্ববর্তী সমস্যাটি আবার as হিসাবে লেখা যেতে পারে β^LS=XTy

minβi=1pβ^iLSβi+12βi2+γ|βi|.

আমাদের উদ্দেশ্য ফাংশন এখন লক্ষ্যগুলির সমষ্টি, প্রতিটি পৃথক ভেরিয়েবল , যাতে সেগুলি পৃথকভাবে সমাধান করা যেতে পারে।βi

সম্পূর্ণ তার অংশগুলির যোগফলের সমান

একটি নির্দিষ্ট করা । তারপরে, আমরা i

Li=β^iLSβi+12βi2+γ|βi|.

যদি তবে আমাদের অবশ্যই থাকতে হবে অন্যথায় আমরা এর চিহ্নটি ফ্লিপ করতে পারি এবং উদ্দেশ্য ফাংশনের জন্য কম মান পেতে পারি। একইভাবে যদি তবে আমাদের অবশ্যই ।β^iLS>0βi0β^iLS<0βi0

কেস 1 : । যেহেতু , এবং এটি সমান করে এবং শূন্যের সমান , আমরা এবং ডান হাতের দিকটি যদি না হয় তবে এটি কেবল সম্ভব হয়, তবে এই ক্ষেত্রে আসল সমাধানটি হ'ল β^iLS>0βi0

Li=β^iLSβi+12βi2+γβi,
βiβi=β^iLSγ
β^ilasso=(β^iLSγ)+=sgn(β^iLS)(|β^iLS|γ)+.

কেস 2 : । এর থেকে বোঝা যায় যে আমাদের অবশ্যই এবং সাথে সম্মান করে এবং শূন্যের সমান সেট করে আমরা get । তবে, আবার এটি সম্ভব হয়েছে তা নিশ্চিত করার জন্য আমাদের , যা β^iLS0βi0

Li=β^iLSβi+12βi2γβi.
βiβi=β^iLS+γ=sgn(β^iLS)(|β^iLS|γ)βi0
β^ilasso=sgn(β^iLS)(|β^iLS|γ)+.

উভয় ক্ষেত্রেই আমরা পছন্দসই ফর্মটি পাই, এবং তাই আমাদের কাজ শেষ।

চূড়ান্ত মন্তব্য

মনে রাখবেন যে বৃদ্ধি , তারপরে প্রতিটিঅগত্যা হ্রাস পায়, তাই does । যখন , আমরা ওএলএস সমাধানগুলি পুনরুদ্ধার করি এবংআমরা প্রাপ্ত সকলের জন্য ।γ|β^ilasso|β^lasso1γ=0γ>maxi|β^iLS|β^ilasso=0i


2
@ কার্ডিনাল দুর্দান্ত লেখা!
গ্যারি

9
+1 পুরো দ্বিতীয়ার্ধটি সরল পর্যবেক্ষণ দ্বারা প্রতিস্থাপন করা যেতে পারে যে অবজেক্ট ফাংশন হয় at সহ দুটি উত্তল প্যারোবোলার অংশগুলির একটি ইউনিয়ন , যেখানে এবং the চিহ্নটি অন্যথায় নেওয়া হয়। সূত্রটি নীচের অংশটি বেছে নেওয়ার এক অভিনব উপায়। β12β2+(±γβ^)β±γβ^β<0
whuber

যদি সম্ভব হয় তবে আমি কেকেটি-অনুকূলতা শর্তাদি ব্যবহার করে ডেরাইভেশনগুলি দেখতে চাই। এই ফলাফলটি অর্জনের আরও কী কী উপায় আছে?
ব্যবহারকারী 1137731

5
@ কার্ডিনাল: একটি চমৎকার উদ্দীপনা জন্য ধন্যবাদ। একটি পর্যবেক্ষণ। যদি আমি মনে করি, অরথোগোনাল কলামগুলির সাথে ম্যাট্রিক্স অর্থ্থোনাল (ওরফে অর্থনরমাল) ম্যাট্রিক্সের মতো নয়। তারপরে কিছু তির্যক ম্যাট্রিক্স (অগত্যা পরিচয় ম্যাট্রিক্সের জন্য নয়)। অরথোগোনাল ম্যাট্রিক্স অনুমানের সাথে (মূল প্রশ্নে যেমন রয়েছে), আমাদের কাছে এবং সমস্ত দেখতে দুর্দান্ত :)XX=DDXX=I
ওলেগ মেল্নিকভ

@ কার্ডিনাল আপনি কেন বলছেন তা আমি পাই না "যেহেতু নাহলে আমরা এর চিহ্নটি ফ্লিপ করতে পারি এবং উদ্দেশ্যমূলক কার্যকারিতার জন্য কম মান পেতে পারি"। আমরা উদ্দেশ্যমূলক ফাংশনের ডেরাইভেটিভ নিচ্ছি। উদ্দেশ্যমূলক ফাংশনটি উচ্চতর বা কম হলে কী হয় who আমরা যে বিষয়টির যত্ন নিই তা হ'ল ডেরাইভেটিভ শূন্যে সেট করা আছে, আমরা এক্সট্রিমার বিষয়ে যত্নশীল। এটি ধ্রুবক দ্বারা উচ্চতর বা নিম্নতর কিনা আরগমিনকে প্রভাবিত করে না।
13985

7

অনুমান covariates , এর কলাম , এছাড়াও যাতে মান হয় । এটি কেবল পরে সুবিধার জন্য: এটি ছাড়াই, স্বীকৃতিটি আরও ভারী হয় যেহেতু কেবল তির্যক। আরও ধরে যে । ফলাফলটি ধরে রাখার জন্য এটি একটি প্রয়োজনীয় অনুমান। সর্বনিম্ন স্কোয়ারের অনুমানকারী । তারপরে, লাসো অনুমানকারী (ল্যাঙ্গরজিয়ান ফর্ম) xjXRn×pXTX=IXTXnpβ^OLS=argminβyXβ22

(defn.)β^λ=argminβ12nyXβ22+λβ1(OLS is projection)=argminβ12nXβ^OLSXβ22+λβ1(XTX=I)=argminβ12nβ^OLSβ22+λβ1(algebra)=argminβ12β^OLSβ22+nλβ1(defn.)=proxnλ1(β^OLS)(takes some work)=Snλ(β^OLS),
\ end {align *} যেখানে একটি ফাংশনের প্রক্সিমাল অপারেটর এবং নরম প্রান্তিকproxffSαα

এটি এমন একটি ডেরাইভেশন যা কার্ডিনাল কাজ করে এমন প্রক্সিমাল অপারেটরের বিশদ বিবরণকে এড়িয়ে যায়, তবে, আমি আশা করি, একটি বদ্ধ ফর্মকে সম্ভব করে তোলে এমন প্রধান পদক্ষেপগুলি স্পষ্ট করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.