লিনিয়ার রিগ্রেশন কেন নিয়মিতকরণ প্যারামিটারের মানগুলিকেও শাস্তি দেয়?


9

বর্তমানে রিজ রিগ্রেশন শিখছি এবং আরও জটিল মডেলগুলির শাস্তি (বা আরও জটিল মডেলের সংজ্ঞা) সম্পর্কে আমি কিছুটা বিভ্রান্ত হয়ে পড়েছিলাম।

আমি যা বুঝতে পারি তা থেকে মডেল জটিলতা অগত্যা বহুবর্ষীয় ক্রমের সাথে সম্পর্কিত হতে পারে না। তাই:

2+3+4x2+5x3+6x4
এর চেয়ে আরও জটিল মডেল:
5x5

এবং আমি জানি যে নিয়ন্ত্রণের বিন্দুটি মডেলটির জটিলতা কম রাখার জন্য, সুতরাং উদাহরণস্বরূপ বলুন যে আমাদের কাছে একটি 5 তম অর্ডার বহুবচন রয়েছে

f(x;w)=w0+w1x+w2x2+w3x3+w4x4+w5x5

আরও পরামিতি যে 0 ভাল হয়।

তবে আমি যা বুঝতে পারি না তা হ'ল, যদি এটি একই ক্রমটির বহুপদী থাকে তবে কেন নিম্ন পরামিতি মানগুলি কম শাস্তি পায়? তাহলে কেন:

2+5x+x3
কম জটিল মডেল হতে হবে

433+342x+323x3
এগুলি উভয়ই একই বহু বহুতোষ ক্রম এবং পরামিতি মানগুলি কেবলমাত্র ডেটার উপর নির্ভর করে।

ধন্যবাদ!

উত্তর:


10

পরামিতি মানগুলি কেবলমাত্র ডেটার উপর নির্ভর করে

এটি আপনার প্রশ্নের মূল অংশ। এখানেই আপনি বিভ্রান্ত হয়ে পড়েছেন।

হ্যাঁ, প্যারামিটার মানগুলি ডেটার উপর নির্ভর করে। আমরা যখন কোনও মডেল ফিট করি তবে ডেটা স্থির হয় । অন্য কথায়, আমরা পর্যবেক্ষণগুলিতে শর্তসাপেক্ষে একটি মডেল ফিট করি । বিভিন্ন ডেটাসেটে লাগানো বিভিন্ন মডেলের জটিলতার সাথে তুলনা করার কোনও অর্থ হয় না ।

এবং একটি নির্দিষ্ট ডেটাসেটের প্রসঙ্গে, একটি মডেল

2+5x+x3

তুলনায় প্রকৃতপক্ষে সহজতম মডেলের কাছাকাছি, যথা সমতল শূন্য মডেল

433+342x+323x3,

এবং এটি আপনার পর্যবেক্ষণের স্কেল নির্বিশেষে ধারণ করে।

ঘটনাচক্রে, বিরতি (2 এবং 433আপনার উদাহরণে) ঘন ঘন দণ্ডিত হয় না, উদাহরণস্বরূপ, বেশিরভাগ লাসোর সূত্রগুলিতে, কারণ পর্যবেক্ষণের সামগ্রিক গড় ক্যাপচার করার জন্য আমরা অবাধে এটির পরিবর্তিত হতে দেওয়া ভাল। অন্য কথায়, আমরা পর্যবেক্ষণের গড়ের দিকে মডেলটি সঙ্কুচিত করি, একটি সম্পূর্ণ শূন্য মডেল নয় (যেখানে শূন্যটি প্রায়শই নির্বিচারে হবে)। এই অর্থে, একটি ফ্ল্যাট2 এবং একটি ফ্ল্যাট 433 মডেল সমান জটিল বিবেচিত হবে।


1
নিম্নতর মানের সহগগুলি উচ্চতর সহগের তুলনায় সমতল শূন্য থেকে দূরে? এটি কি টাইপো, নাকি আমি ভুল বোঝাবুঝি কেন দূরে-ধ্রুবক মডেলটিকে ঘনিষ্ঠ থেকে ধ্রুবক মডেলের মতো শাস্তি দেওয়া হয় না?
আরএম

দুঃখিত, এটি আসলে একটি টাইপ ছিল। আমাকে সম্পাদনা করতে দিন। এই বিষয়টি চিহ্নিত করার জন্য ধন্যবাদ!
স্টিফান কোলাসা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.