লাসো রিগ্রেশন সহগের সংখ্যাগুলি শূন্যের দিকে সঙ্কুচিত করে, এভাবে কার্যকরভাবে মডেল নির্বাচন সরবরাহ করে। আমি বিশ্বাস করি যে আমার ডেটাতে নামমাত্র এবং অবিচ্ছিন্ন সহকারীদের মধ্যে অর্থপূর্ণ মিথস্ক্রিয়া রয়েছে। অগত্যা, তবে সত্যিকারের মডেলটির 'মূল প্রভাবগুলি' অর্থবহ (শূন্য নয়)। সত্যিকারের মডেলটি অজানা বলে অবশ্যই আমি এটি জানি না। আমার উদ্দেশ্যগুলি হ'ল প্রকৃত মডেলটি সন্ধান করা এবং ফলাফলটি যতটা সম্ভব নিকটস্থভাবে পূর্বাভাস দেওয়া।
আমি শিখেছি যে মডেল বিল্ডিংয়ের শাস্ত্রীয় পদ্ধতির একটি মিথস্ক্রিয়া অন্তর্ভুক্ত করার আগে সর্বদা একটি প্রধান প্রভাব অন্তর্ভুক্ত থাকে। এভাবে দুই covariates একটি প্রধান প্রভাব ছাড়া একটি মডেল হতে পারে না এবং জেড যদি covariates একজন মিথস্ক্রিয়া হয় এক্স * টু Z একই মডেল হবে। ফাংশন সাবধানে পরিণামে নির্বাচন মডেল পদ (যেমন অনগ্রসর বা ফরওয়ার্ড এআইসি উপর ভিত্তি করে) এই নিয়মের পালনকারী।stepR
লাসো অন্যরকমভাবে কাজ করছে বলে মনে হচ্ছে। যেহেতু সমস্ত প্যারামিটারগুলিকে শাস্তি দেওয়া হয়েছে তা সন্দেহ ছাড়াই ঘটতে পারে যে একটি প্রধান প্রভাব শূন্যের দিকে সঙ্কুচিত হয়ে গেছে তবে সেরা (যেমন ক্রস-বৈধ) মডেলটির মিথস্ক্রিয়া শূন্য নয়। Rএর glmnetপ্যাকেজটি ব্যবহার করার সময় এটি আমি আমার ডেটাগুলির জন্য বিশেষত খুঁজে পাই ।
আমি উপরে উদ্ধৃত প্রথম নিয়মের ভিত্তিতে সমালোচনা পেয়েছি, অর্থাৎ আমার চূড়ান্ত ক্রস-বৈধতাযুক্ত লসো মডেলটিতে কিছু শূন্য-মিথস্ক্রিয়া সম্পর্কিত মূল প্রভাবের শর্তাদি অন্তর্ভুক্ত নয়। তবে এই নিয়মটি এই প্রসঙ্গে কিছুটা অদ্ভুত বলে মনে হচ্ছে। যা নেমে আসে তা হ'ল আসল মডেলের প্যারামিটারটি শূন্য কিনা। আসুন ধরে নেওয়া যাক তবে এটি মিথস্ক্রিয়াটি শূন্য নয়, তবে লাসো সম্ভবত এটি সনাক্ত করবে, সুতরাং সঠিক মডেলটি সন্ধান করবে। বাস্তবে মনে হয় এই মডেল থেকে ভবিষ্যদ্বাণীগুলি আরও সুনির্দিষ্ট হবে কারণ এই মডেলটিতে সত্য-শূন্য মূল প্রভাব থাকে না, যা কার্যকরভাবে একটি শব্দের পরিবর্তনশীল।
আমি কি এই ভিত্তির উপর ভিত্তি করে সমালোচনা খণ্ডন করতে পারি বা আমি কোনওভাবে পূর্ব-সতর্কতা অবলম্বন করা উচিত যে লাসো ইন্টারঅ্যাকশন শব্দটির আগে প্রধান প্রভাব অন্তর্ভুক্ত করে?