এটির ব্যাখ্যা করার সহজ উপায় হ'ল নিয়মিতকরণ শব্দের সাথে খাপ খায় না, এটি সংকেতের আকার নির্ধারণের ক্ষেত্রে খুব বেশি কিছু করে না। যদি আপনি কোনও বিশালাকার গৌরবময় ফাংশন আনুষঙ্গিক হিসাবে গভীর শিক্ষার কথা ভাবেন, তবে বুঝতে পারবেন জটিল সংকেতের আকার নির্ধারণ করতে এটির প্রচুর ডেটা প্রয়োজন।
যদি কোনও আওয়াজ না পাওয়া যায় তবে এনএন এর ক্রমবর্ধমান জটিলতা আরও ভালভাবে অনুমান করতে পারে। এনএন আকারে কোনও জরিমানা থাকত না, প্রতিটি ক্ষেত্রে আরও ভাল হত been একটি টেলর অনুমান হিসাবে বিবেচনা করুন, অ-বহুবচন ফাংশনের জন্য (সংখ্যাসম্য নির্ভুলতার বিষয়টি উপেক্ষা করে) আরও শর্তাবলী সর্বদা ভাল।
এটি একটি গোলমালের উপস্থিতিতে ভেঙে যায়, কারণ আপনি আওয়াজকে ফিট করতে শুরু করেন। সুতরাং, সাহায্যের জন্য এখানে নিয়মিতকরণ এসেছে: এটি শব্দদ্বারে ফিটনেস হ্রাস করতে পারে, এইভাবে আমাদের অরৈখিক সমস্যার জন্য আরও বড় এনএন তৈরির সুযোগ দেয় ।
নিম্নলিখিত আলোচনাটি আমার উত্তরের জন্য অত্যাবশ্যক নয়, তবে আমি কিছু মন্তব্যের উত্তর দিতে এবং উপরের উত্তরের মূল অংশটিকে অনুপ্রাণিত করতে কিছু অংশ যুক্ত করেছি। মূলত, আমার বাকী উত্তরটি ফ্রেঞ্চ আগুনের মতো যা বার্গারের খাবারের সাথে আসে, আপনি এড়িয়ে যেতে পারেন।
(ইর) প্রাসঙ্গিক কেস: বহুবর্ষীয় রিগ্রেশন
আসুন একটি বহুবর্ষীয় রিগ্রেশন এর খেলনা উদাহরণটি দেখুন। এটি অনেক ফাংশনের জন্য বেশ ভাল আনুমানিকরও। আমরা অঞ্চলে in ফাংশনটি দেখব । যেমন আপনি নীচে এর টেলর সিরিজটি থেকে দেখতে পাচ্ছেন যে সপ্তম অর্ডার প্রসারণটি ইতিমধ্যে বেশ ভাল ফিট so তাই আমরা আশা করতে পারি যে 7+ ক্রমের একটি বহুপদীও খুব ভাল ফিট হওয়া উচিত:পাপ( এক্স )x ∈ ( - 3 , 3 )
এরপরে, আমরা পর্যবেক্ষণের সাথে 7 টি পর্যবেক্ষণের সাথে সেট করা একটি খুব খুব কোলাহলযুক্ত ডেটাতে ক্রমবর্ধমান উচ্চতর অর্ডার সহ বহুভুজ ফিট করতে চলেছি:
বহু লোকের কাছ থেকে জানার মধ্যে আমরা বহু লোককে কী বলেছি তা আমরা পর্যবেক্ষণ করতে পারি: তারা অস্থির এবং বহুবর্ষের ক্রম বৃদ্ধি করে বন্যভাবে দোলন শুরু করে।
যাইহোক, সমস্যাটি নিজেরাই বহুবচন নয়। সমস্যা হ'ল গোলমাল। যখন আমরা কোলাহলিত তথ্যে বহুবর্ষগুলি মাপসই করি তখন ফিটগুলির অংশটি শোনার জন্য, সংকেতকে নয়। এখানে একই সঠিক পলিনোমিয়ালগুলি একই ডেটা সেটটিতে ফিট করে কিন্তু শব্দদণ্ডের সাথে সম্পূর্ণভাবে মুছে ফেলা হয়। ফিটগুলি দুর্দান্ত!
পাপ( এক্স )
এছাড়াও লক্ষ্য করুন যে উচ্চতর অর্ডার বহুভুক্তগুলি অর্ডার 6 এর পাশাপাশি ফিট করে না, কারণ এগুলি সংজ্ঞায়িত করার মতো পর্যাপ্ত পর্যবেক্ষণ নেই। সুতরাং, আসুন 100 পর্যবেক্ষণের সাথে কী ঘটে তা দেখুন। নীচের চার্টে আপনি দেখতে পাচ্ছেন যে কোনও বৃহত্তর ডেটা সেট কীভাবে আমাদের উচ্চতর অর্ডার বহুত্বগুলি ফিট করতে দেয়, এভাবে আরও ভাল ফিট করে!
দুর্দান্ত, তবে সমস্যাটি হ'ল আমরা সাধারণত গোলমাল সংক্রান্ত ডেটা নিয়ে কাজ করি। আপনি যদি খুব গোলমালী তথ্যের 100 টি পর্যবেক্ষণের সাথে একই মাপসই হন তবে কী ঘটে তা দেখুন, নীচের চার্টটি দেখুন। আমরা আবার এক স্কোয়ারে ফিরে এসেছি: উচ্চতর অর্ডার বহুতলগুলি ভয়ঙ্কর দোলনা ফিট উত্পাদন করে। সুতরাং, ডেটা সেট বাড়ানো তথ্যকে আরও ভালভাবে ব্যাখ্যা করার জন্য মডেলের জটিলতা বাড়ানোর পক্ষে তেমন কোনও সহায়তা করেনি। এটি আবারও, কারণ জটিল মডেলটি কেবলমাত্র সংকেত আকারে নয়, গোলমালের আকারকেও আরও ভাল ফিট করে।
অবশেষে, আসুন এই সমস্যাটির জন্য কিছু খোঁড়া নিয়মিত করার চেষ্টা করি। নীচের চার্টটি নিয়মিতকরণ দেখায় (বিভিন্ন জরিমানা সহ) 9 বহুপদী রিগ্রেশন অর্ডার করার জন্য প্রয়োগ করা হয়। উপরের আদেশের জন্য এটিকে তুলনা করুন (পাওয়ার) 9 বহুপথীয় ফিট: নিয়মিতকরণের একটি উপযুক্ত স্তরে উচ্চতর অর্ডার বহুবর্ষগুলি শোরগোলের ডেটাতে ফিট করা সম্ভব।
কেবল যদি এটি পরিষ্কার ছিল না: আমি বহুবর্ষীয় রিগ্রেশনটি এভাবে ব্যবহার করার পরামর্শ দিচ্ছি না। পলিনোমিয়ালগুলি স্থানীয় ফিটগুলির জন্য ভাল, সুতরাং একটি টুকরা অনুসারে বহুভুজ একটি ভাল পছন্দ হতে পারে। তাদের সাথে পুরো ডোমেনটি ফিট করা প্রায়শই একটি খারাপ ধারণা, কারণ তারা আওয়াজের প্রতি সংবেদনশীল, প্রকৃতপক্ষে, এটি উপরের প্লটগুলি থেকে স্পষ্ট হওয়া উচিত। শব্দটি সংখ্যাসূচক হোক বা অন্য কোনও উত্স থেকে এই প্রসঙ্গে গুরুত্বপূর্ণ নয়। শব্দটি গোলমাল, এবং বহুভুজগুলি এতে আবেগের সাথে প্রতিক্রিয়া জানাবে।