ধরা যাক আপনার কাছে দুটি উচ্চতর সম্পর্কযুক্ত প্রিডেক্টর ভেরিয়েবল এবং ধরুন উভয়ই কেন্দ্রিক এবং স্কেলড (মানে শূন্য, বৈকল্পিক একটি)। তারপর প্যারামিটার ভেক্টর উপর শৈলশিরা আযাব β 2 1 + + β 2 2 যখন Lasso শাস্তি শব্দ | β 1 | + + | β 2 | । এখন, যেহেতু মডেলটি অত্যন্ত কলিনিয়ার হিসাবে বিবেচিত, তাই এক্স এবং জেড কম বা কম Y এর পূর্বাভাস দেওয়ার জন্য একে অপরের প্রতিস্থাপন করতে পারে , x , z এর অনেক লিনিয়ার সংমিশ্রণ যেখানে আমরা খালি অংশে সাবস্টাইটিউট করবএক্স , জেডβ21+ + β22| বিটা1∣ + ∣ β2|এক্সz- রওয়াইএক্স , জেডজেড এর জন্য এক্স , পূর্বাভাসক হিসাবে খুব একইভাবে কাজ করবে, উদাহরণস্বরূপ 0.2 x + 0.8 x , 0.3 x + 0.7 z বা 0.5 x + 0.5 zএক্সz- র0.2 x + 0.8 x , 0.3 x + 0.7 z0.5 x + 0.5 জেডভবিষ্যদ্বাণীকারী হিসাবে প্রায় সমান ভাল হবে। এখন এই তিনটি উদাহরণ দেখুন, তিনটি ক্ষেত্রেই লাশো জরিমানা সমান, এটি 1, যখন রিজ পেনাল্টি পৃথক হয়, এটি যথাক্রমে 0.68, 0.58, 0.5 হয়, সুতরাং লাসো পেনাল্টি কলিনিয়ার ভেরিয়েবলের সমান ওজনকে পছন্দ করবে চয়ন করতে সক্ষম হবে না। এটি একটি কারণ রিজ (বা আরও সাধারণভাবে, ইলাস্টিক নেট, যা লাসো এবং রিজ পেনাল্টির একটি লিনিয়ার সংমিশ্রণ) কোলিনিয়ার পূর্বাভাসকারীদের সাথে আরও ভাল কাজ করবে: যখন ডেটা কলিনিয়ার প্রেডিক্টরের বিভিন্ন লিনিয়ার সংমিশ্রনের মধ্যে চয়ন করার সামান্য কারণ দেয়, লাসো ঠিক ঠিক করবে "বিচরণ" যখন রিজ সমান ওজন চয়ন করে। ভবিষ্যতে ডেটা ব্যবহারের জন্য এটি শেষের চেয়ে ভাল অনুমান হতে পারে! এবং, যদি বর্তমান উপাত্তগুলির সাথে এটি হয়, তবে ক্রস বৈধকরণে রিজ সহ আরও ভাল ফলাফল হিসাবে প্রদর্শিত হতে পারে।
আমরা এটিকে বেইসিয়ান পদ্ধতিতে দেখতে পারি: রিজ এবং লাসো বিভিন্ন পূর্বের তথ্যকে বোঝায় এবং রিজ দ্বারা বর্ণিত পূর্বের তথ্যগুলি এ জাতীয় পরিস্থিতিতে আরও যুক্তিসঙ্গত হতে থাকে। (এই ব্যাখ্যাটি আমি এখানে কম-বেশি শিখেছি: ট্র্যাভর হাসি, রবার্ট তিবশিরানী এবং মার্টিন ওয়াইনরাইটের "স্ট্যাটিস্টিকাল লার্নিং উইথ স্পারসিটি দ্য লাসো অ্যান্ড জেনারালাইজেশন" বইটি থেকে, তবে এই মুহুর্তে আমি সরাসরি উদ্ধৃতিটি খুঁজে পাইনি)।