আরও কিছু তথ্য; হটাত যদি
- আপনি কতগুলি ভেরিয়েবল নির্বাচন করবেন তা আগে জানতেন এবং আপনি LARS পদ্ধতিতে জটিলতা জরিমানা নির্ধারণ করেছিলেন যেমন অ 0 0 সহগের সাথে অনেকগুলি ভেরিয়েবল থাকতে পারে,
- গণনা ব্যয় কোনও সমস্যা নয় (ভেরিয়েবলের মোট সংখ্যা ছোট, 50 বলুন),
- সমস্ত ভেরিয়েবল (y, x) অবিচ্ছিন্ন that
কোন সেটিংয়ে LARS মডেলটি (অর্থাত্ LARS ফিটে শূন্য সহগ নেই এমন ভেরিয়েবলগুলির ওএলএস ফিট) একই সংখ্যার সহগ সহ একটি মডেল থেকে পৃথক হবে তবে সম্পূর্ণ অনুসন্ধানের মাধ্যমে পাওয়া যাবে (একটি লা রেজসুবসেটস)?
সম্পাদনা: আমি 0 টির আসল 'সহগুণযুক্ত 10 ভেরিয়েবল (এবং সমস্ত বৈশিষ্ট্য একে অপরের সাথে দৃ strongly়ভাবে সম্পর্কযুক্ত) বাদে একটি আদর্শ গাউসিয়ান থেকে আঁকা আসল সহগের সাথে 50 টি ভেরিয়েবল এবং 250 টি পর্যবেক্ষণ ব্যবহার করছি। নির্বাচিত ভেরিয়েবলের দুটি সেটের মধ্যে পার্থক্য মিনিট হওয়ায় এই সেটিংস স্পষ্টতই ভাল নয়। সর্বাধিক পার্থক্য পাওয়ার জন্য কোন ধরণের ডেটা কনফিগারেশনটি অনুকরণ করা উচিত এটি সত্যিই একটি প্রশ্ন।