আমি 30 টি স্বতন্ত্র ভেরিয়েবলের সেট থেকে অবিচ্ছিন্ন নির্ভরশীল ভেরিয়েবলের জন্য ভবিষ্যদ্বাণী খুঁজে পেতে চাই। আমি আরএস এর গ্ল্যামনেট প্যাকেজে প্রয়োগ হিসাবে লাসো রিগ্রেশন ব্যবহার করছি some এখানে কিছু ডামি কোড রয়েছে:
# generate a dummy dataset with 30 predictors (10 useful & 20 useless)
y=rnorm(100)
x1=matrix(rnorm(100*20),100,20)
x2=matrix(y+rnorm(100*10),100,10)
x=cbind(x1,x2)
# use crossvalidation to find the best lambda
library(glmnet)
cv <- cv.glmnet(x,y,alpha=1,nfolds=10)
l <- cv$lambda.min
alpha=1
# fit the model
fits <- glmnet( x, y, family="gaussian", alpha=alpha, nlambda=100)
res <- predict(fits, s=l, type="coefficients")
res
আমার প্রশ্নগুলি কীভাবে আউটপুটটি ব্যাখ্যা করবেন:
এটি কি ঠিক বলা যায় যে চূড়ান্ত আউটপুটে শূন্যের থেকে পৃথক সহগ দেখায় এমন সমস্ত ভবিষ্যদ্বাণী নির্ভরশীল চলকের সাথে সম্পর্কিত?
এটি কি কোনও জার্নাল প্রকাশের প্রসঙ্গে পর্যাপ্ত প্রতিবেদন হতে পারে? বা সহগের তাত্পর্যটির জন্য পরীক্ষা-পরিসংখ্যান সরবরাহ করা আশা করা যায়? (প্রসঙ্গটি মানব জেনেটিক্স)
তাৎপর্য দাবি করার জন্য পি-মান বা অন্যান্য পরীক্ষা-পরিসংখ্যান গণনা করা কি যুক্তিসঙ্গত? কীভাবে সম্ভব হবে? কোনও পদ্ধতি কি আর-তে প্রয়োগ করা হয়?
প্রতিটি ভবিষ্যদ্বাণীকের জন্য কোনও সাধারণ রিগ্রেশন প্লট (ডেটা পয়েন্টগুলি লিনিয়ার ফিটের সাথে প্লট করা) এই ডেটাটি ভিজ্যুয়ালাইজ করার উপযুক্ত উপায় হতে পারে?
হতে পারে যে কোনও বাস্তব তথ্য উপাত্তের প্রসঙ্গে লাসোর ব্যবহার দেখানো প্রকাশিত নিবন্ধগুলির কয়েকটি সহজ উদাহরণ সরবরাহ করতে পারে এবং এটি একটি জার্নালে কীভাবে রিপোর্ট করবেন?
cv
ভবিষ্যদ্বাণী পদক্ষেপের জন্যও ব্যবহার করতে পারবেন না ?