দুঃখিত যদি এই প্রশ্নটি কিছুটা মৌলিক জুড়ে আসে।
আমি আরে একাধিক লিনিয়ার রিগ্রেশন মডেলের জন্য ল্যাসো ভেরিয়েবল নির্বাচনটি ব্যবহার করতে চাইছি I আমার এবং সেট করার পরে আমি নিম্নলিখিত কমান্ডগুলি ব্যবহার করব:y
model = lars(x, y)
coef(model)
আমার সমস্যাটি যখন আমি ব্যবহার করি coef(model)
। এটি 15 টি সারি সহ একটি ম্যাট্রিক্স প্রত্যাবর্তন করে, প্রতিবার একটি অতিরিক্ত অনুমানকারী যুক্ত করা হয় added তবে কোন মডেলটি বেছে নেবেন সে সম্পর্কে কোনও পরামর্শ নেই। আমি কিছু মিস করেছি? আমি মাত্র একটি " সেরা " মডেল ফিরে পাওয়ার জন্য লার্স প্যাকেজটি পাওয়ার কী উপায় আছে ?
glmnet
পরিবর্তে অন্যান্য পোস্ট ব্যবহার করার পরামর্শ দিচ্ছে তবে এটি আরও জটিল বলে মনে হচ্ছে। একই এবং ব্যবহার করে একটি প্রচেষ্টা নিম্নরূপ । আমি কি এখানে কিছু মিস করেছি ?: y
cv = cv.glmnet(x, y)
model = glmnet(x, y, type.gaussian="covariance", lambda=cv$lambda.min)
predict(model, type="coefficients")
চূড়ান্ত কমান্ডটি আমার ভেরিয়েবলগুলির একটি তালিকা ফেরত দেয়, বেশিরভাগটি সহগ সহ যদিও বেশ কয়েকটি = 0 হয়। এটি কি লাসো দ্বারা নির্বাচিত " সেরা " মডেলের সঠিক পছন্দ ? আমি যদি আমার সমস্ত ভেরিয়েবলের সহিত একটি রৈখিক মডেল ফিট করি তবে এর সহগগুলি not=0
আমার খুব অনুরূপ, তবে কিছুটা আলাদা, গুণফলের অনুমান হয়। এই পার্থক্যের কোনও কারণ আছে কি? লাসো দ্বারা নির্বাচিত এই ভেরিয়েবলগুলির সাথে রৈখিক মডেলটিকে পুনর্বিবেচনা করা এবং এটিকে আমার চূড়ান্ত মডেল হিসাবে গ্রহণ করা কি গ্রহণযোগ্য হবে? অন্যথায় আমি তাত্পর্যপূর্ণ জন্য কোনও পি-মান দেখতে পাচ্ছি না। আমি কি কিছু মিস করেছি?
নেই
type.gaussian="covariance"
যে glmnet
একাধিক লিনিয়ার রিগ্রেশন ব্যবহার করে তা নিশ্চিত করুন ?
ভেরিয়েবলগুলির স্বয়ংক্রিয় নর্মালাইজেশনটি সহগগুলি কী আদৌ প্রভাবিত করে? কোনও লাসো পদ্ধতিতে ইন্টারঅ্যাকশন শর্তাদি অন্তর্ভুক্ত করার কোনও উপায় আছে কি?
আমি এই প্রক্রিয়াটিকে আরও বেশি প্রমাণ করতে চাইছি যে কোনও মডেলের তুলনায় লাসো কীভাবে ব্যবহার করা যেতে পারে যা যদি কোনও পরিবর্তন হয় তবে বাস্তবে কোনও গুরুত্বপূর্ণ অনুমান / পূর্বাভাসের জন্য ব্যবহৃত হবে।
এটি পড়তে সময় দেওয়ার জন্য আপনাকে ধন্যবাদ। লাসো / লার্স / গ্ল্যামনেট সম্পর্কে যে কোনও সাধারণ মন্তব্যও প্রশংসিত হবে।