মধ্যে Lasso সম্পর্ক এবং


10

লাসো রিগ্রেশন সম্পর্কে আমার বোঝা হ'ল যে ক্ষুদ্রতরকরণ সমস্যা সমাধানের জন্য রিগ্রেশন সহগগুলি নির্বাচন করা হয়েছে:

minβyXβ22 s.t.β1t

অনুশীলনে সমস্যাটি সমাধানের জন্য ল্যাগরেঞ্জ গুণক ব্যবহার করে এটি করা হয়

minβyXβ22+λβ1

মধ্যে সম্পর্ক কি λ এবং t ? উইকিপিডিয়ায় অনিচ্ছাকৃতভাবে সহজভাবে বলা হয়েছে যে এটি "ডেটা নির্ভর"।

আমি কেন যত্ন করব? প্রথমত বৌদ্ধিক কৌতূহলের জন্য। তবে ক্রস-বৈধতা দ্বারা ল্যাম্বডা বাছাইয়ের ফলাফলগুলি সম্পর্কে আমিও উদ্বিগ্ন λ

বিশেষত, যদি আমি এন-ভাঁজ ক্রস বৈধকরণ করছি, আমি আমার প্রশিক্ষণের ডেটার বিভিন্ন পার্টিশনগুলিতে n বিভিন্ন মডেলকে ফিট করব। তারপরে আমি প্রদত্ত mb ল্যাম্বদা-র জন্য অব্যবহৃত ডেটাতে প্রতিটি মডেলের যথার্থতা তুলনা করি λ। তবে একই ল্যাম্বডাটি ডেটার বিভিন্ন উপ-পর্বের জন্য λএকটি পৃথক বাধা ( t ) বোঝায় (যেমন, t=f(λ) "ডেটা নির্ভর")।

ক্রস যাচাইকরণের সমস্যাটি কি আমি সত্যিই সেই টি খুঁজে পেতে সমাধান করতে চাই না tযা সেরা পক্ষপাত-নির্ভুলতা বাণিজ্য বন্ধ করে দেয়?

প্রতিটি ক্রস-বৈধতা বিভাজনের জন্য এবং \ ল্যাম্বদা এবং ফলাফল বিতরণ দেখে practice β1 and গণনা করে অনুশীলনে আমি এই প্রভাবটির আকার সম্পর্কে মোটামুটি ধারণা পেতে পারি । কিছু ক্ষেত্রে উল্লিখিত সীমাবদ্ধতা ( টি ) আমার ক্রস-বৈধকরণ সাবসেটগুলি জুড়ে যথেষ্ট শান্তভাবে পরিবর্তিত হতে পারে। যেখানে উল্লেখযোগ্যভাবে আমি টি >> 0 এর প্রকরণের সহগের অর্থ ।λtt>>0


5
অব্যক্ত ডাউনভোটটি বাতিল করতে উত্সাহীকরণ। প্রশ্নটি আমার দক্ষতার বাইরে কিন্তু এটি যুক্তিসঙ্গতভাবে সূচিত বলে মনে হয়।
এমকেটি - মনিকা

উত্তর:


2

এটিই রিজ রিগ্রেশনটির মানক সমাধান :

β=(XX+λI)1Xy

আমরা এটাও জানি , সুতরাং এটি অবশ্যই সত্য হওয়া উচিতβ=t

(XX+λI)1Xy=t

জন্য সমাধান করা সহজ নয় ।λ

কম্পিউট: আপনার সেরা বাজি শুধু আপনার কি করছেন আপনি করছেন রাখা হয় একাধিক জুড়ে ডেটা একই উপ-নমুনার উপর মান।tλ

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.