ছুটির মরসুমটি আমাকে এলিমেটিকাল লার্নিংয়ের সাথে আগুনের পাশে কুঁকানোর সুযোগ দিয়েছে । একটি (ঘন ঘনবাদী) একনোমেট্রিক্সের দৃষ্টিকোণ থেকে আসা, রিজ রিগ্রেশন, লাসো এবং কমপক্ষে অ্যাঙ্গেল রিগ্রেশন (এলএআর) এর মতো সঙ্কুচিত পদ্ধতির ব্যবহার উপলব্ধিতে আমার সমস্যা হচ্ছে। সাধারণত, আমি নিজেরাই প্যারামিটারের অনুমানগুলিতে এবং নিরপেক্ষতা বা কমপক্ষে ধারাবাহিকতা অর্জনে আগ্রহী। সঙ্কুচিত পদ্ধতিগুলি এটি করে না।
আমার কাছে মনে হয় যে এই পদ্ধতিগুলি ব্যবহার করা হয় যখন পরিসংখ্যানবিদরা উদ্বিগ্ন হন যে রিগ্রেশন ফাংশনটি ভবিষ্যদ্বাণীদের কাছে খুব বেশি প্রতিক্রিয়াশীল হয়ে পড়েছে, এটি ভবিষ্যদ্বাণীকারীদেরকে আসলে তার চেয়ে আরও বেশি গুরুত্বপূর্ণ (সহগের পরিধি দ্বারা পরিমাপ করা) বলে মনে করে। অন্য কথায়, overfitting।
তবে, ওএলএস সাধারণত নিরপেক্ষ ও ধারাবাহিক অনুমান সরবরাহ করে ((পাদটীকা) আমি সর্বদা খুব বেশি যে অনুমান করা যায় না তার চেয়ে বেশি ফিট করার সমস্যাটি দেখেছি, তবে আত্মবিশ্বাসের বিরতি খুব ছোট কারণ নির্বাচন প্রক্রিয়াটি বিবেচনায় নেওয়া হয়নি ( ইএসএল এই পরবর্তী পয়েন্টটির উল্লেখ করে)।
নিরপেক্ষ / ধারাবাহিক সহগ অনুমানগুলি ফলাফলের পক্ষপাতহীন / ধারাবাহিক পূর্বাভাসের দিকে পরিচালিত করে। সঙ্কুচিত পদ্ধতিগুলি ওএলএসের তুলনায় ভবিষ্যদ্বাণীগুলিকে গড়ের পরিণতির নিকটে ঠেলে দেয়, সম্ভবত টেবিলে তথ্য রেখে যায়।
পুনরাবৃত্তি করার জন্য, সঙ্কোচন পদ্ধতিগুলি কী সমস্যার সমাধান করার চেষ্টা করছে তা আমি দেখতে পাচ্ছি না। আমি কিছু অনুপস্থিত করছি?
পাদটীকা: সহগের সনাক্তকরণের জন্য আমাদের পূর্ণ কলাম র্যাঙ্ক শর্ত প্রয়োজন। ত্রুটিগুলির জন্য exogeneity / শূন্য শর্তাধীন গড় অনুমান এবং লিনিয়ার শর্তাধীন প্রত্যাশা অনুমানটি সহগকে আমরা যে ব্যাখ্যা দিতে পারি তা নির্ধারণ করে তবে আমরা এই অনুমানগুলি সত্য না হলেও আমরা কোনও কিছুর পক্ষপাতহীন বা ধারাবাহিক অনুমান পাই।