জেমস, উইটেন, হাস্টি, তিবশিরানী (২০১৩) র র ' রেড রেজিস্ট্রেশন / ল্যাসো'র অ্যাপ্লিকেশন ইন স্ট্যাটাসটিকাল লার্নিং বইয়ের ল্যাব বিভাগ §§.। পেরিয়ে যাচ্ছি ।
আরও সুনির্দিষ্টভাবে, আমি Ridge
আর প্যাকেজ 'আইএসএলআর' থেকে 'হিট্টার্স' ডেটাসেটে বিজ্ঞান-বিজ্ঞান মডেলটি প্রয়োগ করার চেষ্টা করছি । আমি আর কোডে প্রদর্শিত একই বৈশিষ্ট্যগুলির সেট তৈরি করেছি। যাইহোক, আমি glmnet()
মডেল থেকে ফলাফল কাছাকাছি পেতে পারে না । আমি তুলনার জন্য একটি এল 2 টিউনিং প্যারামিটার নির্বাচন করেছি। (বিজ্ঞান-শিখায় 'আলফা' যুক্তি)।
পাইথন:
regr = Ridge(alpha=11498)
regr.fit(X, y)
http://nbviewer.ipython.org/github/JWarmenhoven/ISL-python/blob/master/Notebooks/Chapter%206.ipynb
আর:
লক্ষ্য করুন যুক্তি alpha=0
মধ্যে glmnet()
উপায়ে যে একটি ও L2 শাস্তি প্রয়োগ করতে হবে (রিজ রিগ্রেশন)। ডকুমেন্টেশন সতর্ক করে যে এর জন্য কোনও একক মান প্রবেশ না করে lambda
, তবে ফলাফলটি আইএসএলের মতোই যেখানে ভেক্টর ব্যবহৃত হয়।
ridge.mod <- glmnet(x,y,alpha=0,lambda=11498)
পার্থক্যের কারণ কী?
সম্পাদনা করুন: আর-তে শাস্তিযুক্ত প্যাকেজটি
ব্যবহার করার সময় penalized()
, সহগগুলি স্কাইকিট-শিখার সাথে একই।
ridge.mod2 <- penalized(y,x,lambda2=11498)
তখন প্রশ্নটিও হতে পারে: ' রিজ রিগ্রেশন করার সময় glmnet()
এবং এর মধ্যে পার্থক্য কী penalized()
?
আর প্যাকেজ গ্লোনেট https://github.com/civisanalytics/python-glmnet এ ব্যবহৃত প্রকৃত ফোর্টরান কোডের জন্য নতুন পাইথন র্যাপার
sklearn.linear_model.Ridge
আনপেনালাইজড ইন্টারসেপ্ট অ্যাসেসিমেশন (স্ট্যান্ডার্ড) করে এবং জরিমানা এমন হয় যা||Xb - y - intercept||^2 + alpha ||b||^2
হ্রাস করা হয়b
। জরিমানার সামনে কারণ1/2
বা1/n_samples
বা উভয়ই থাকতে পারে , ফলাফলগুলি তত্ক্ষণাত্ পৃথক করে তোলে। পেনাল্টি স্কেলিং সমস্যাটি নির্ধারণের জন্য, উভয় ক্ষেত্রেই জরিমানা নির্ধারণ করুন 0 সেখানে কোনও বিভেদ সমাধান করুন এবং তারপরে জরিমানাটি কী যুক্ত করে তা পরীক্ষা করুন। এবং বিটিডব্লিউ আইএমএইচও এখানে এই প্রশ্নটি জিজ্ঞাসা করার সঠিক জায়গা।