লাসো এবং ফরোয়ার্ড / পশ্চাদপদ মডেল নির্বাচনের উভয় শক্তি এবং সীমাবদ্ধতা রয়েছে। কোনও সুস্পষ্ট সুপারিশ করা যেতে পারে। এটিকে সমাধান করার জন্য সিমুলেশন সর্বদা অন্বেষণ করা যেতে পারে।
উভয়ই মাত্রিকতার অর্থে বোঝা যায়: মডেল পরামিতিগুলির সংখ্যা এবং পর্যবেক্ষণের সংখ্যা উল্লেখ করে refer আপনি যদি পিছনের মডেল নির্বাচন ব্যবহার করে মডেলগুলি ফিট করতে সক্ষম হন তবে আপনার সম্ভবত । সেক্ষেত্রে, "সর্বোত্তম ফিটিং" মডেলটি হ'ল সমস্ত প্যারামিটার ব্যবহার করা হয় ... অভ্যন্তরীণভাবে যাচাই করার সময়! এটি কেবল অত্যধিক মানানসই বিষয়।এন পি ≫ এনpnp≫n
মডেল মূল্যায়নের জন্য স্প্লিট স্যাম্পল ক্রস ভ্যালিডেশন (সিভি) ব্যবহার করে ওভারফিটিং প্রতিকার করা হয়। যেহেতু আপনি এটি বর্ণনা করেননি, তাই ধরে নিই আপনি এটি করেন নি। ধাপে ধাপে মডেল নির্বাচনের বিপরীতে, লাসো মডেলটির পরামিতিগুলির সংখ্যাকে দণ্ডিত করতে একটি টিউনিং প্যারামিটার ব্যবহার করে। আপনি টিউনিং প্যারামিটারটি ঠিক করতে পারেন, বা এই মানটি চয়ন করতে একটি জটিল পুনরাবৃত্তি প্রক্রিয়া ব্যবহার করতে পারেন। ডিফল্টরূপে , লাসো পরবর্তীকালে করে। এটি সিভি দিয়ে সম্পন্ন করা হয়েছে যাতে ভবিষ্যদ্বাণীটির এমএসই হ্রাস করতে পারে। ধাপে ধাপে মডেল নির্বাচনের এমন কোনও বাস্তবায়ন সম্পর্কে আমি অবগত নই যা এই ধরণের অত্যাধুনিক কৌশল ব্যবহার করে, এমনকি বিআইসিকে মানদণ্ড হিসাবে অভ্যন্তরীণ বৈধতা পক্ষপাত দ্বারা ভুগতে পারে। আমার অ্যাকাউন্ট অনুসারে, এটি স্বয়ংক্রিয়ভাবে "বাইরের বাইরে" ধাপে ধাপে মডেল নির্বাচনের উপরে লাসোকে উত্সাহ দেয়।
শেষ অবধি, ধাপে ধাপে মডেল নির্বাচনের বিভিন্ন নিবন্ধককে অন্তর্ভুক্ত / বাদ দেওয়ার জন্য বিভিন্ন মানদণ্ড থাকতে পারে। যদি আপনি নির্দিষ্ট মডেলের প্যারামিটারগুলির ওয়াল্ড পরীক্ষা বা ফলস্বরূপ মডেল আর ^ 2 এর জন্য পি-মানগুলি ব্যবহার করেন তবে আপনি ভাল করতে পারবেন না, বেশিরভাগ অভ্যন্তরীণ বৈধতা পক্ষপাতের কারণে (আবার সিভি দিয়ে প্রতিকার করা যেতে পারে)। আমি অবাক করে দিয়েছি যে এই ধরণের মডেলগুলি এখনও বাস্তবায়িত হয়। মডেল নির্বাচনের জন্য এআইসি বা বিআইসি অনেক ভাল মানদণ্ড।
প্রতিটি পদ্ধতিতে বেশ কয়েকটি সমস্যা রয়েছে। ধাপে ধাপে মডেল নির্বাচনের সমস্যাগুলি আরও ভালভাবে বোঝা যায়, এবং লাসোর চেয়ে অনেক খারাপ। আপনার প্রশ্নের সাথে আমি যে প্রধান সমস্যাটি দেখছি তা হ'ল আপনি ভবিষ্যদ্বাণী মূল্যায়নের জন্য বৈশিষ্ট্য নির্বাচন সরঞ্জামগুলি ব্যবহার করছেন । তারা স্বতন্ত্র কাজ। বৈশিষ্ট্য নির্বাচন বা স্পার্স মডেল নির্বাচনের জন্য লাসো আরও ভাল। এটি সমস্ত ভেরিয়েবল ব্যবহার করার কারণে রিজ রিগ্রেশন আরও ভাল পূর্বাভাস দিতে পারে।
লাসোর দুর্দান্ত শক্তি হ'ল এটি এমন মডেলগুলির অনুমান করতে পারে , যেমন কেস ফরোয়ার্ড (তবে পিছিয়ে নয়) পদক্ষেপের প্রতিরোধের হতে পারে। উভয় ক্ষেত্রেই, এই মডেলগুলি তখনই পূর্বাভাসের জন্য কার্যকর হতে পারে যখন সেখানে খুব শক্তিশালী ভবিষ্যদ্বাণীকারীদের হাতে গোনা থাকে। যদি অনেক দুর্বল ভবিষ্যদ্বাণী দ্বারা ফলাফলের আরও ভালভাবে পূর্বাভাস দেওয়া হয়, তবে রিজ রিগ্রেশন বা ব্যাগিং / বুস্টিং দীর্ঘ শট দ্বারা ফরোয়ার্ড স্টেপওয়াইজ রিগ্রেশন এবং ল্যাসো উভয়কেই ছাড়িয়ে যাবে । ফরোয়ার্ড স্টেপওয়াইজ রিগ্রেশনের চেয়ে লাসো অনেক দ্রুত।p≫n
বৈশিষ্ট্য নির্বাচন এবং পূর্বাভাসের মধ্যে স্পষ্টতই প্রচুর পরিমাণে ওভারল্যাপ রয়েছে, তবে একটি রেঞ্চ হাতুড়ি হিসাবে কতটা ভাল পরিবেশন করে তা সম্পর্কে আমি আপনাকে কখনও বলি না। সাধারণভাবে, মডেল সহগ এবং এর বিচ্ছিন্ন সংখ্যার সাথে পূর্বাভাসের জন্য , আমি ফরোয়ার্ড স্টেপওয়াস মডেল নির্বাচনের চেয়ে লাসোকে পছন্দ করব।p≫n