লাসো রিগ্রেশন সহগের সংখ্যাগুলি শূন্যের দিকে সঙ্কুচিত করে, এভাবে কার্যকরভাবে মডেল নির্বাচন সরবরাহ করে। আমি বিশ্বাস করি যে আমার ডেটাতে নামমাত্র এবং অবিচ্ছিন্ন সহকারীদের মধ্যে অর্থপূর্ণ মিথস্ক্রিয়া রয়েছে। অগত্যা, তবে সত্যিকারের মডেলটির 'মূল প্রভাবগুলি' অর্থবহ (শূন্য নয়)। সত্যিকারের মডেলটি অজানা বলে অবশ্যই আমি এটি জানি না। আমার উদ্দেশ্যগুলি হ'ল প্রকৃত মডেলটি সন্ধান করা এবং ফলাফলটি যতটা সম্ভব নিকটস্থভাবে পূর্বাভাস দেওয়া।
আমি শিখেছি যে মডেল বিল্ডিংয়ের শাস্ত্রীয় পদ্ধতির একটি মিথস্ক্রিয়া অন্তর্ভুক্ত করার আগে সর্বদা একটি প্রধান প্রভাব অন্তর্ভুক্ত থাকে। এভাবে দুই covariates একটি প্রধান প্রভাব ছাড়া একটি মডেল হতে পারে না এবং জেড যদি covariates একজন মিথস্ক্রিয়া হয় এক্স * টু Z একই মডেল হবে। ফাংশন সাবধানে পরিণামে নির্বাচন মডেল পদ (যেমন অনগ্রসর বা ফরওয়ার্ড এআইসি উপর ভিত্তি করে) এই নিয়মের পালনকারী।step
R
লাসো অন্যরকমভাবে কাজ করছে বলে মনে হচ্ছে। যেহেতু সমস্ত প্যারামিটারগুলিকে শাস্তি দেওয়া হয়েছে তা সন্দেহ ছাড়াই ঘটতে পারে যে একটি প্রধান প্রভাব শূন্যের দিকে সঙ্কুচিত হয়ে গেছে তবে সেরা (যেমন ক্রস-বৈধ) মডেলটির মিথস্ক্রিয়া শূন্য নয়। R
এর glmnet
প্যাকেজটি ব্যবহার করার সময় এটি আমি আমার ডেটাগুলির জন্য বিশেষত খুঁজে পাই ।
আমি উপরে উদ্ধৃত প্রথম নিয়মের ভিত্তিতে সমালোচনা পেয়েছি, অর্থাৎ আমার চূড়ান্ত ক্রস-বৈধতাযুক্ত লসো মডেলটিতে কিছু শূন্য-মিথস্ক্রিয়া সম্পর্কিত মূল প্রভাবের শর্তাদি অন্তর্ভুক্ত নয়। তবে এই নিয়মটি এই প্রসঙ্গে কিছুটা অদ্ভুত বলে মনে হচ্ছে। যা নেমে আসে তা হ'ল আসল মডেলের প্যারামিটারটি শূন্য কিনা। আসুন ধরে নেওয়া যাক তবে এটি মিথস্ক্রিয়াটি শূন্য নয়, তবে লাসো সম্ভবত এটি সনাক্ত করবে, সুতরাং সঠিক মডেলটি সন্ধান করবে। বাস্তবে মনে হয় এই মডেল থেকে ভবিষ্যদ্বাণীগুলি আরও সুনির্দিষ্ট হবে কারণ এই মডেলটিতে সত্য-শূন্য মূল প্রভাব থাকে না, যা কার্যকরভাবে একটি শব্দের পরিবর্তনশীল।
আমি কি এই ভিত্তির উপর ভিত্তি করে সমালোচনা খণ্ডন করতে পারি বা আমি কোনওভাবে পূর্ব-সতর্কতা অবলম্বন করা উচিত যে লাসো ইন্টারঅ্যাকশন শব্দটির আগে প্রধান প্রভাব অন্তর্ভুক্ত করে?