ল্যান্সো কীভাবে কলিনের পূর্বাভাসকারীদের মধ্যে নির্বাচন করেন?

আমি একটি স্বজ্ঞাত উত্তরের সন্ধান করছি কেন একটি জিএলএম লাসো মডেল অত্যন্ত সংযুক্তদের একটি গ্রুপের মধ্যে থেকে একটি নির্দিষ্ট ভবিষ্যদ্বাণীকে নির্বাচন করে এবং কেন এটি সর্বোত্তম উপসেট বৈশিষ্ট্য নির্বাচন করে তা এত আলাদাভাবে করে।

তিবশিরানী ১৯৯।-এর চিত্র ২-এ দেখানো লাসোর জ্যামিতি থেকে আমি বিশ্বাস করতে পরিচালিত করেছি যে লাসো আরও বেশি বৈচিত্র্য নিয়ে ভবিষ্যদ্বাণীকে নির্বাচন করে।

এখন ধরুন যে আমি লজিস্টিক রিগ্রেশন মডেলটির জন্য 2 ভবিষ্যদ্বাণী গ্রহণ করার জন্য 10 ফোল্ড সিভি দিয়ে সেরা সাবসেট নির্বাচন ব্যবহার করেছি এবং আমার 2 বছর পূর্বাভাসকারী সর্বোত্তম (0-1 লোকসান অর্থে) এর যথাযথ পূর্ববর্তী জ্ঞান রয়েছে।

লাসো সমাধান বৃহত্তর পূর্বাভাস ত্রুটির সাথে একটি কম পার্সিমোনিয়াস (5 ভবিষ্যদ্বাণীকারী) সমাধানের পক্ষে solution স্বজ্ঞাতভাবে, কী কারণে পার্থক্য দেখা দেয়? এটি কি সম্পর্কিত যেভাবে লাসো সম্পর্কিত সম্পর্কযুক্ত ভবিষ্যদ্বাণীদের মধ্যে নির্বাচন করে?

feature-selection lasso

— পাইওটর সোকল
সূত্র

পেনালাইজেশন এবং পাথ নির্ভরতার ক্ষেত্রে লাসো সেরা-সাবসেট নির্বাচন থেকে পৃথক।

সেরা-সাবসেট নির্বাচনের ক্ষেত্রে, 2 ভবিষ্যদ্বাণী সেরা পারফরম্যান্স দিয়েছেন তা সনাক্ত করতে সম্ভবত সিভি ব্যবহার করা হয়েছিল। সিভি চলাকালীন, দণ্ড ছাড়াই পূর্ণ-মাত্রার রিগ্রেশন সহগ কতটি ভেরিয়েবল অন্তর্ভুক্ত করতে হবে তা মূল্যায়নের জন্য ব্যবহৃত হত। একবার 2 ভবিষ্যদ্বাণী ব্যবহার করার সিদ্ধান্ত নেওয়া হয়েছিল, তারপরে 2 ভবিষ্যদ্বাণীকারীদের সমস্ত সংমিশ্রণের সাথে চূড়ান্ত মডেলটির জন্য 2 সন্ধানের জন্য সমান্তরালভাবে সম্পূর্ণ ডেটা সেটের সাথে তুলনা করা হবে। এই 2 চূড়ান্ত ভবিষ্যদ্বাণীকারীদের তাদের পূর্ণ-মাত্রার রিগ্রেশন সহগগুলি দণ্ডবিহীনভাবে দেওয়া হবে, যেন তারা সবই একমাত্র পছন্দ ছিল।

পেনাল্টিটি ধীরে ধীরে শিথিল করার সাথে সাথে আপনি রিগ্রেশন কোফিলিয়েন্টগুলির পরিমাপের বৃহত পরিমাণে জরিমানা দিয়ে শুরু হিসাবে লাসোকে ভাবতে পারেন। ফলাফলটি হ'ল ভ্যারিয়েবলগুলি একবারে একটি করে প্রবেশ করে, প্রতিটি পয়েন্টে শিথিল হওয়ার সময় সিদ্ধান্ত নিয়ে সিদ্ধান্ত নেওয়া হয় যে এটি ইতিমধ্যে মডেলটিতে ভেরিয়েবলের সহগগুলি বাড়ানো, বা অন্য পরিবর্তনশীল যুক্ত করার জন্য আরও মূল্যবান কিনা। তবে যখন আপনি একটি 2-ভেরিয়েবল মডেলটি বলুন, তখন লাসো কর্তৃক অনুমোদিত রিগ্রেশন সহগগুলি 2 ভেরিয়েবল এবং 3-ভেরিয়েবল মডেলের তুলনায় ব্যবহৃত স্ট্যান্ডার্ড নন-পেনালাইজড রেগ্রেশনগুলির তুলনায় সেই একই ভেরিয়েবলের পরিমাণের চেয়ে কম হবে in সেরা সাবসেট নির্বাচন।

এটি সেরা-সাবসেট নির্বাচনের চেয়ে নতুন ভেরিয়েবলগুলিকে ল্যাসো-তে প্রবেশ করা সহজ করার জন্য ভাবা যেতে পারে। তাত্ত্বিকভাবে, কতগুলি ভেরিয়েবল অন্তর্ভুক্ত করা উচিত তার অনিশ্চয়তার বিরুদ্ধে লাসো সম্ভাব্য কম-আসল-রিগ্রেশন সহগগুলির সাথে ব্যবসা করে। এটি একটি লাসো মডেলের আরও ভেরিয়েবলগুলি অন্তর্ভুক্ত করতে পারে এবং লাসোর সম্ভাব্যতর খারাপ পারফরম্যান্স যদি আপনি নিশ্চিতভাবে জানতেন যে কেবলমাত্র 2 টি ভেরিয়েবল অন্তর্ভুক্ত করা দরকার। তবে আপনি যদি ইতিমধ্যে জানতেন যে প্রডাক্টর ভেরিয়েবলগুলি সঠিক মডেলটিতে অন্তর্ভুক্ত করা উচিত তবে আপনি সম্ভবত লাসো ব্যবহার করবেন না।

এখনও অবধি কিছুই মুখ্যাঙ্গের উপর নির্ভর করে নি, যা লাসোর তুলনায় সেরা-উপসেটটিতে পরিবর্তনশীল নির্বাচনের বিভিন্ন ধরণের স্বেচ্ছাসেবীর দিকে পরিচালিত করে। এই উদাহরণে, সেরা-উপসেট 2 সম্ভাব্য ভবিষ্যদ্বাণীকারীদের সমস্ত সম্ভাব্য সংমিশ্রণ পরীক্ষা করেছে এবং সেই সংমিশ্রণের মধ্যে সেরাটি বেছে নিয়েছে। সুতরাং যে নির্দিষ্ট তথ্য নমুনা জয়ের জন্য সেরা 2।

লাসো, একবারে একটি পরিবর্তনশীল যুক্ত করার জন্য তার পথ নির্ভরতা সহ, এর অর্থ হল যে অন্যান্য ভেরিয়েবলগুলি পরস্পর সম্পর্কিত হলে শিথিলকরণের প্রক্রিয়াতে পরে প্রবেশ করার সময় একটি ভেরিয়েবলের প্রাথমিক পছন্দ প্রভাবিত করতে পারে। কোনও ভেরিয়েবলের পক্ষে প্রথম দিকে প্রবেশ করা এবং তার পরের সংযুক্ত ভেরিয়েবলগুলি প্রবেশ করার সাথে সাথে এর লাসো সহগের জন্য ড্রপ করাও সম্ভব।

অনুশীলনে, উভয় পদ্ধতির সাথে চূড়ান্ত মডেলগুলিতে সম্পর্কিত সম্পর্কের পূর্বাভাসকারীদের মধ্যে পছন্দ অত্যন্ত নমুনা নির্ভর, একই তথ্যের বুটস্ট্র্যাপ নমুনায় এই মডেল-বিল্ডিং প্রক্রিয়াগুলি পুনরাবৃত্তি করে পরীক্ষা করা যায়। যদি খুব বেশি ভবিষ্যদ্বাণী না থাকে এবং আপনার প্রাথমিক আগ্রহটি নতুন ডেটা সেটগুলির বিষয়ে পূর্বাভাসে থাকে, রিজ রিগ্রেশন যা সমস্ত ভবিষ্যদ্বাণীকে রাখে।

— EDM
সূত্র