আমি প্রাসঙ্গিক বৈশিষ্ট্যগুলি নির্বাচন করতে জিএলএম এবং ইলাস্টিক নেট ব্যবহার করতে চাই + একটি লিনিয়ার রিগ্রেশন মডেল তৈরি করুন (অর্থাত্, ভবিষ্যদ্বাণী এবং বোঝার উভয়ই তাই তুলনামূলকভাবে কয়েকটি পরামিতি রেখে যাওয়া ভাল)। আউটপুট অবিচ্ছিন্ন হয়। এটি প্রতি ক্ষেত্রে জিন । আমি প্যাকেজটি সম্পর্কে পড়ছি , তবে অনুসরণের পদক্ষেপগুলি সম্পর্কে আমি 100% নিশ্চিত নই:glmnet
ল্যাম্বদা চয়ন করতে সিভি সঞ্চালন করুন:
cv <- cv.glmnet(x,y,alpha=0.5)
(কিউ 1) ইনপুট ডেটা দেওয়া হলে আপনি কি আলাদা আলফা মান চয়ন করবেন?
(প্র 2) মডেলটি তৈরি করার আগে আমার কি অন্য কিছু করা দরকার?মডেলটিকে ফিট করুন:
model=glmnet(x,y,type.gaussian="covariance",lambda=cv$lambda.min)
(কিউ 3) "কোভেরিয়েন্স" এর চেয়ে ভাল কিছু?
(প্র 4) লাম্বদা যদি সিভি দ্বারা বেছে নেওয়া হয়, তবে এই পদক্ষেপের প্রয়োজন কেনnlambda=
?
(প্র 5) এটি ব্যবহার করা ভালlambda.min
বাlambda.1se
?কোন পরামিতিগুলি ("।") পড়েছে তা দেখতে, সহগের সংগ্রহ করুন:
predict(model, type="coefficients")
সহায়তা পৃষ্ঠা সেখানে অনেক
predict
পদ্ধতি (যেমন,predict.fishnet
,predict.glmnet
,predict.lognet
, ইত্যাদি)। তবে কোনও "সরল" ভবিষ্যদ্বাণী হিসাবে আমি উদাহরণে দেখেছি।
(Q6) উচিত আমি ব্যবহারpredict
বাpredict.glmnet
বা অন্যান্য?
নিয়মিতকরণ পদ্ধতি সম্পর্কে আমি যা পড়েছি তা সত্ত্বেও আমি আর এবং এই পরিসংখ্যান প্যাকেজগুলিতে বেশ নতুন, তাই আমি আমার সমস্যাটি কোডের সাথে মানিয়ে নিচ্ছি কিনা তা নিশ্চিত হওয়া শক্ত difficult কোন পরামর্শ স্বাগত জানানো হবে।
আপডেটের
উপর ভিত্তি করে "পূর্বে উল্লিখিত হিসাবে, ক্লাস ট্রেনের কোনও অবজেক্টে একটি উপাদান বলা হয় finalModel
যা পুনর্নির্মাণের মাধ্যমে নির্বাচিত টিউনিং প্যারামিটার মানগুলির সাথে লাগানো মডেল। মডেল এর পূর্বাভাস ফাংশন। "
caret
আলফা এবং ল্যাম্বডা উভয়কেই টিউন করতে ব্যবহার করে:
trc = trainControl(method=cv, number=10)
fitM = train(x, y, trControl = trC, method="glmnet")
না fitM
পূর্ববর্তী ধাপে 2 প্রতিস্থাপন করবেন? যদি তা হয় তবে কীভাবে type.gaussian="naive",lambda=cv$lambda.min/1se
এখন গ্ল্যামনেট বিকল্পগুলি ( ) নির্দিষ্ট করবেন ?
এবং নিম্নলিখিত predict
পদক্ষেপ, আমি প্রতিস্থাপন করতে পারেন model
করতে fitM
?
যদি আমি করি
trc = trainControl(method=cv, number=10)
fitM = train(x, y, trControl = trC, method="glmnet")
predict(fitM$finalModel, type="coefficients")
এটি কি আদৌ অর্থবহ হয় বা আমি উভয় প্যাকেজ ভোকাবুলারি ভুলভাবে মিশ্রিত করছি?