যদিও কসরা মানশায়েই একটি ভাল সাধারণ উত্তর দেয় (+1), আমি উদাহরণটি বোঝার জন্য একটি সহজ দিতে চাই।
খুব সাধারণ সমস্যাটি ভাবুন: কোনও ফাংশন ফিটিং f:[0,1]→R। এটি করার জন্য, আপনি বহুবর্ষীয় শ্রেণীর বাইরে থেকে একটি মডেল নেন। তর্কের খাতিরে, আসুন আমরা मानনা করি যে আপনি 0 ডিগ্রি একটি বহুপদী নেন This এই মডেলগুলির ক্ষমতাটি খুব সীমিত কারণ এটি কেবল ধ্রুবকগুলিকে ফিট করতে পারে। এটি মূলত গড় মানটি অনুমান করবে (ত্রুটি ফাংশনের উপর অবশ্যই নির্ভর করে তবে এটি সহজ রাখবে)। তুলনামূলকভাবে দ্রুত আপনার কাছে এই ধরণের মডেলটির সেরা পরামিতিগুলি কী তা সম্পর্কে একটি দুর্দান্ত ধারণা তৈরি হবে। আপনার পরীক্ষা- এবং প্রশিক্ষণের ত্রুটিটি প্রায় অভিন্ন হবে, আপনি যতগুলি উদাহরণ যুক্ত করেন তা বিবেচনা করেই। সমস্যাটি এমন নয় যে আপনার পর্যাপ্ত ডেটা নেই, সমস্যাটি হ'ল আপনার মডেলটি যথেষ্ট শক্তিশালী নয়: আপনি অন্তর্বাস ।
সুতরাং অন্য পথে যেতে দিন: বলুন আপনার কাছে 1000 ডেটা পয়েন্ট রয়েছে। কিছুটা গণিত জানা, আপনি 999 ডিগ্রির বহুবচন বেছে নিয়েছেন Now এখন আপনি প্রশিক্ষণের ডেটা পুরোপুরি ফিট করতে পারেন। তবে আপনার ডেটা কেবলমাত্র খুব সঠিকভাবে ডেটা ফিট করতে পারে। উদাহরণস্বরূপ, দেখুন ( আমার ব্লগ থেকে )
এই ক্ষেত্রে, আপনার কাছে অন্যান্য মডেল রয়েছে যা পুরোপুরি ডেটাও ফিট করে। স্পষ্টতই, নীল মডেলটি ডেটাপয়েন্টগুলির মধ্যে একধরনের অপ্রাকৃত বলে মনে হয়। মডেল নিজেই প্রকারের বিতরণটি ভালভাবে ক্যাপচার করতে সক্ষম না হতে পারে, তাই মডেলটিকে আরও সহজ কিছুতে সীমাবদ্ধ করা আসলে এটি সহায়তা করতে পারে। এটি ওভারফিটের উদাহরণ হতে পারে ।