এটি লাসো এবং বন্ধুদের জন্য উপযুক্ত সমস্যার মতো শোনাচ্ছে যা সংকোচন এবং পরিবর্তনশীল নির্বাচন করে। স্ট্যাটিস্টিকাল লার্নিংয়ের এলিমেন্টগুলি রিগ্রেশনের জন্য লাসো এবং ইলাস্টিক নেট এবং এই সমস্যার জন্য আরও প্রাসঙ্গিক, লজিস্টিক রিগ্রেশনকে বর্ণনা করে।
বইটির লেখকরা গ্ল্যামনেট নামে একটি আর প্যাকেজ হিসাবে লাসো এবং ইলাস্টিক নেট উপলব্ধ একটি কার্যকর প্রয়োগ করেছে । আমি পূর্বে এই প্যাকেজটি প্রায় 250,000 সারির ডেটা ম্যাট্রিকের সাথে বাইনারি ডেটা বিশ্লেষণের জন্য ব্যবহার করেছি, যদিও কিছুটা কম কলাম রয়েছে, তবে অন্য সমস্ত কলামগুলির বিরুদ্ধে সমস্ত কলামের প্রকৃতপক্ষে চলমান রয়েছে। যদি ডেটা ম্যাট্রিক্সটিও অল্প যায়, বাস্তবায়নও সেটার সুবিধা নিতে পারে এবং আমি বিশ্বাস করি যে পদ্ধতিটি আসলে ওপিএস সম্পূর্ণ ডেটা সেটের জন্য কাজ করতে পারে। এখানে লাসো সম্পর্কে কিছু মন্তব্য রয়েছে:
- অ-মসৃণ ( -norm) পেনাল্টি ফাংশনটি ব্যবহার করে লাসো পরিবর্তনশীল নির্বাচন অর্জন করে , যা সাধারণত কিছু প্যারামিটার 0 এর সমান হয় বলে প্যারামিটারের অনুমানের ফলাফল হয় যে অনুমান করা হয় কতগুলি শূন্য-পরামিতি এবং কত অ-শূন্য পরামিতি সঙ্কুচিত হয়, একটি টিউনিং পরামিতি দ্বারা নির্ধারিত হয়। গ্ল্যামনেটে বাস্তবায়নের দক্ষতা এই সত্যের উপর অনেক বেশি নির্ভর করে যে একটি বড় জরিমানার জন্য কেবল কয়েকটি পরামিতি 0 থেকে পৃথক।ℓ1
- টিউনিং প্যারামিটার নির্বাচন প্রায়শই ক্রস-বৈধকরণ দ্বারা সম্পন্ন হয়, তবে ক্রস-বৈধকরণের পদক্ষেপ ছাড়াই পদ্ধতিটি পেনাল্টি প্যারামিটার দ্বারা সূচকযুক্ত নির্বাচিত ভেরিয়েবলগুলির একটি ভাল ক্রম দিতে সক্ষম হতে পারে।
- পরিবর্তনশীল নির্বাচনের জন্য নেতিবাচক দিক থেকে, লাসো ভেরিয়েবলের নির্বাচনের ক্ষেত্রে অস্থির হতে পারে, বিশেষত, যদি তারা কিছুটা সম্পর্কযুক্ত হয়। এই অস্থিতিশীলতার উন্নতি করার জন্য আরও সাধারণ ইলাস্টিক নেট পেনাল্টি উদ্ভাবিত হয়েছিল, তবে এটি সমস্যার সম্পূর্ণ সমাধান করে না। লাসোর জন্য পরিবর্তনশীল নির্বাচনের উন্নতি করার জন্য অভিযোজিত লাসো হ'ল আরেকটি ধারণা।
- স্থায়িত্ব নির্বাচন লসোর মতো পদ্ধতির মাধ্যমে নির্বাচিত ভেরিয়েবলের বৃহত্তর স্থায়িত্ব অর্জনের জন্য মাইনশাউসেন এবং বেলম্যান দ্বারা প্রস্তাবিত একটি সাধারণ পদ্ধতি। এর জন্য ডেটা সেটটির সাবস্ক্রিপ্সের জন্য বেশ কয়েকটি ফিটের প্রয়োজন হয় এবং যেমনটি কম্পিউটারের চেয়েও বেশি দাবি।
- পেনাল্টি প্যারামিটারের মাধ্যমে প্যারামিটারাইজড একক ভেরিয়েবল মডেল থেকে জটিল জটিল মডেল (অগত্যা সমস্ত ভেরিয়েবলগুলি অন্তর্ভুক্ত নয়) পর্যন্ত "ভাল" মডেলগুলির একটি মাত্রিক সেট তৈরি করার জন্য লাসোর চিন্তাভাবনার যুক্তিসঙ্গত উপায়। বিপরীতে, অবিচ্ছিন্ন ফিল্টারগুলি কেবল ভাল একক-পরিবর্তনশীল মডেলের একটি নির্বাচন বা ক্রম উত্পাদন করে।
পাইথনের জন্য ল্যাসো এবং ইলাস্টিক নেট এর মতো পদ্ধতিগুলির বিজ্ঞান-শিখতে একটি বাস্তবায়ন রয়েছে ।