উত্তর:
প্রথমত, আমাদের প্লটের ডান দিকে মনোনিবেশ করা উচিত, যেখানে মূল্যায়নের জন্য পর্যাপ্ত পরিমাণে ডেটা রয়েছে।
যদি দুটি বক্ররেখা "একে অপরের কাছাকাছি" থাকে এবং উভয়ই তবে কম স্কোর থাকে। মডেলটি একটি আন্ডার ফিটিং সমস্যায় ভুগছেন (হাই বায়াস)
প্রশিক্ষণ বক্রের যদি আরও ভাল স্কোর থাকে তবে পরীক্ষার বক্ররেখার কম স্কোর থাকে, অর্থাৎ, দুটি বক্ররেখাগুলির মধ্যে বড় ব্যবধান রয়েছে। তারপরে মডেল একটি ওভার ফিটনেস সমস্যায় ভুগছেন (উচ্চ ভেরিয়েন্স)
প্লটটি থেকে মডেলটি ভাল কিনা তা বলা শক্ত। এটি সম্ভব যে আপনার সত্যিই "সহজ সমস্যা" রয়েছে, একটি ভাল মডেল 90% অর্জন করতে পারে। অন্যদিকে, এটি আপনার পক্ষে সম্ভবত একটি "কঠিন সমস্যা" রয়েছে যা আমরা করতে পারি সেরা কাজটি হ'ল 70% অর্জন করা। (দ্রষ্টব্য, আপনি আশা করতে পারেন না যে আপনি একটি নিখুঁত মডেল পাবেন, স্কোর বলুন 1। আপনি কতটা অর্জন করতে পারবেন তা আপনার ডেটাতে কতটা গোলমাল নির্ভর করে তার উপর নির্ভর করে ose মনে করুন আপনার ডেটাতে প্রচুর ডেটা পয়েন্ট রয়েছে ঠিক বৈশিষ্ট্য রয়েছে তবে বিভিন্ন লেবেল রয়েছে, আপনি যা করুক না কেন, আপনি স্কোরের উপর 1 অর্জন করতে পারবেন না))
আপনার উদাহরণের আরেকটি সমস্যা হ'ল বাস্তব জগতে প্রয়োগের ক্ষেত্রে 350 টি উদাহরণ খুব ছোট বলে মনে হচ্ছে।
আরও ভাল বোঝার জন্য আপনি ওভার ফিটিংয়ের অধীনে অভিজ্ঞতার জন্য নিম্নলিখিত পরীক্ষা-নিরীক্ষা করতে পারেন এবং শেখার বক্ররেখায় কী ঘটবে তা পর্যবেক্ষণ করতে পারেন।
এমএনআইএসটি ডেটা বলার জন্য একটি খুব জটিল ডেটা নির্বাচন করুন এবং একটি সাধারণ মডেলের সাথে মানানসই, একটি বৈশিষ্ট্য সহ রৈখিক মডেল বলুন।
একটি সাধারণ ডেটা নির্বাচন করুন, আইরিস ডেটা বলুন, কোনও জটিলতার মডেলের সাথে মানানসই, বলুন, এসভিএম।
এছাড়াও, আমি আন্ডার ফিটিং এবং ওভার ফিটিং সম্পর্কিত দুটি উদাহরণ দেব। নোট করুন এটি বক্রতা শিখছে না, তবে গ্রেডিয়েন্ট বুস্টিং মডেলটিতে পুনরাবৃত্তির সংখ্যার ক্ষেত্রে পারফরম্যান্সের প্রতি শ্রদ্ধা রয়েছে যেখানে আরও পুনরাবৃত্তির ক্ষেত্রে বেশি ফিট করার সম্ভাবনা থাকবে। এক্স অক্ষটি পুনরাবৃত্তির সংখ্যা দেখায়, এবং y অক্ষগুলি কার্যকারিতা দেখায়, যা আরওসি-র আওতাধীন Areaণাত্মক অঞ্চল (কম ভাল the
বাম সাবপ্ল্লট ওভার ফিটিংয়ে ভুগছে না (পারফরম্যান্স যুক্তিসঙ্গতভাবে ভাল হওয়ায় ফিটিংয়ের অধীনেও নয়) তবে পুনরাবৃত্তির সংখ্যা যখন বড় হয় তখন ডানদিকে ওভার ফিটিং থেকে ভোগা হয়।