লাসো ভেরিয়েবল ট্রেস প্লটের ব্যাখ্যা ting


15

আমি glmnetপ্যাকেজে নতুন এবং ফলাফলগুলি কীভাবে ব্যাখ্যা করতে পারি তা সম্পর্কে আমি এখনও নিশ্চিত নই। কেউ দয়া করে আমাকে নীচের ট্রেস প্লটটি পড়তে সহায়তা করতে পারেন?

নিম্নলিখিতটি চালিয়ে গ্রাফটি প্রাপ্ত হয়েছিল:

library(glmnet)
return <- matrix(ret.ff.zoo[which(index(ret.ff.zoo)==beta.df$date[2]), ])
data   <- matrix(unlist(beta.df[which(beta.df$date==beta.df$date[2]), ][ ,-1]), 
                 ncol=num.factors)
model  <- cv.glmnet(data, return, standardize=TRUE)

op <- par(mfrow=c(1, 2))
plot(model$glmnet.fit, "norm",   label=TRUE)
plot(model$glmnet.fit, "lambda", label=TRUE)
par(op)

এখানে চিত্র বর্ণনা লিখুন

উত্তর:


20

উভয় প্লটে, প্রতিটি রঙিন রেখাটি আপনার মডেলটিতে একটি পৃথক সহগ দ্বারা নেওয়া মানের প্রতিনিধিত্ব করে। লাম্বদা হ'ল নিয়মিতকরণের মেয়াদে (এল 1 আদর্শ) দেওয়া ওজন, সুতরাং লাম্বদা শূন্যের কাছে যাওয়ার সাথে সাথে আপনার মডেলের ক্ষতি ফাংশন ওএলএস লোকসানের ক্রিয়াকলাপের কাছে চলে আসে। এই কংক্রিটটি তৈরি করার জন্য আপনি লাসো ক্ষতির কার্যটি নির্দিষ্ট করার জন্য এখানে একটি উপায় রয়েছে:

βএকটিগুলিগুলি=argmin [আরএসএস(β)+ +λ*এটি L1-নর্ম(β)]

অতএব, যখন ল্যাম্বদা খুব ছোট হয়, তখন ল্যাসো সমাধানটি ওএলএস দ্রবণটির খুব কাছাকাছি হওয়া উচিত এবং আপনার সমস্ত সহগ মডেলটিতে রয়েছে। ল্যাম্বদা বাড়ার সাথে সাথে নিয়মিতকরণের মেয়াদ আরও বেশি কার্যকর হয় এবং আপনি আপনার মডেলটিতে কম ভেরিয়েবল দেখতে পাবেন (কারণ আরও বেশি সহগের শূন্যের মূল্য হবে)।

আমি উপরে উল্লিখিত হিসাবে, L1 আদর্শ লাসো জন্য নিয়মিত শব্দ। সম্ভবত এটি দেখার আরও ভাল উপায়টি হল যে এক্স-অক্ষটি হ'ল এল 1 আদর্শটি গ্রহণযোগ্য সর্বোচ্চ মান । সুতরাং আপনার যখন একটি ছোট এল 1 আদর্শ রয়েছে তখন আপনার প্রচুর নিয়ন্ত্রণ হয়। অতএব, শূন্যের একটি এল 1 আদর্শ শূন্য মডেল দেয় এবং আপনি এল 1 আদর্শ বৃদ্ধি করার সাথে সাথে ভেরিয়েবলগুলি মডেলটিকে "প্রবেশ" করবে কারণ তাদের সহগেরগুলি শূন্যবিহীন মান নেয়।

বাম দিকে প্লট এবং ডানদিকে প্লট মূলত আপনাকে একই জিনিস দেখায়, কেবল বিভিন্ন স্কেলের উপর।


2
খুব ঝরঝরে উত্তর, ধন্যবাদ! উপরের গ্রাফগুলি থেকে অর্থাত্ একটি চূড়ান্ত মডেল থেকে কী "সেরা ভবিষ্যদ্বাণীকারীদের" কাটা সম্ভব?
মায়ু

4
না, আপনাকে এর জন্য ক্রস-বৈধতা বা অন্য কোনও বৈধকরণ পদ্ধতি প্রয়োজন; এটি আপনাকে জানিয়ে দেবে যে এল 1 আদর্শের (বা সমতুল্য, কোন লগ (ল্যাম্বদা)) সর্বোত্তম ভবিষ্যদ্বাণীপূর্ণ দক্ষতার সাথে মডেলটি দেয়।
জেএডব্লিউ

11
আপনি যদি আপনার শক্তিশালী ভবিষ্যদ্বাণী নির্ধারণ করার চেষ্টা করছেন, আপনি প্লটটির প্রমাণ হিসাবে প্রমাণ করতে পারবেন যে মডেলটির প্রারম্ভিক প্রবেশকারী ভেরিয়েবলগুলি সবচেয়ে ভবিষ্যদ্বাণীমূলক এবং ভেরিয়েবলগুলি যা পরে মডেলটিতে প্রবেশ করে তা কম গুরুত্বপূর্ণ। আপনি যদি "সেরা মডেল" চান তবে সাধারণত ক্রস বৈধকরণের মাধ্যমে এটি পাওয়া যায়। গ্ল্যামনেট প্যাকেজ ব্যবহার করে এটি অর্জনের জন্য একটি সাধারণ পদ্ধতি আপনাকে এখানে পরামর্শ দেওয়া হয়েছিল: stats.stackexchange.com/a/68350/8451 । আমি দৃঢ়ভাবে সুপারিশ করছি যেন আপনি ESLII স্বল্প, Lasso অধ্যায় (3.4.2 এবং 3.4.3), যা ডাউনলোড বিনামূল্যে পড়ুন: www-stat.stanford.edu/~tibs/ElemStatLearn
ডেভিড মার্কস

@ ডেভিড মার্কস, প্লটের শীর্ষে সংখ্যাগুলি কী বলে? ক্রস বৈধকরণের মাধ্যমে সেরা মডেলটি কীভাবে চয়ন করবেন।
জিজা

@ ডেভিডমার্কের কিছুক্ষণ সময় হয়েছে তবে অন্য কারও জন্যও এটি ভাবছে যে শূন্যের মূল্যহীন নয় এমন ওজনে সহগের সংখ্যা।
ইয়ান বেলচার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.