ট্রেন বনাম পরীক্ষার ত্রুটির তুলনা কীভাবে পরিচালনা করতে হবে সে সম্পর্কে সেখানে বিরোধী পরামর্শ রয়েছে বলে মনে হয়, বিশেষত যখন দুজনের মধ্যে একটি ফাঁক রয়েছে। আমার মনে হয় এমন দুটি স্কুল আছে যা আমার কাছে দ্বন্দ্ব বলে মনে হচ্ছে। আমি কীভাবে দুজনের মধ্যে পুনর্মিলন করব (বা আমি এখানে কী মিস করছি তা বুঝতে পারি) তা বোঝার জন্য আমি খুঁজছি
চিন্তাভাবনা # 1: একা ট্রেন এবং পরীক্ষা সেট পারফরম্যান্সের মধ্যে একটি ব্যবধান ওভারফিটকে নির্দেশ করে না
প্রথম, (এখানেও আলোচনা করা হয়েছে: প্রশিক্ষণ এবং পরীক্ষার ত্রুটির তুলনা কীভাবে অত্যধিক মানসিকতার পরিচায়ক হতে পারে? ), এই ধারণাটি যে ট্রেন এবং পরীক্ষার সেটগুলির মধ্যে একমাত্র পার্থক্য অত্যধিক উত্সাহকে নির্দেশ করতে পারে না। এটি আমার ব্যবহারিক অভিজ্ঞতার সাথে একমত, উদাহরণস্বরূপ, গাছে গাছের পদ্ধতি, যেখানে ক্রস-বৈধতা ভিত্তিক হাইপার প্যারামিটার সুরের পরেও ট্রেন এবং পরীক্ষার ত্রুটির মধ্যে ব্যবধান কিছুটা বড় থাকতে পারে। তবে (মডেল ধরণের নির্বিশেষে) আপনার বৈধতা ত্রুটি যতক্ষণ না ফিরে আসবে ততক্ষণ আপনি ভাল। অন্তত, এই চিন্তাভাবনা।
চিন্তাভাবনা # 2: আপনি যখন ট্রেন এবং পরীক্ষার পারফরম্যান্সের মধ্যে একটি ফাঁক দেখেন: এমন জিনিসগুলি করুন যা অতিশয় লড়াইয়ের বিরুদ্ধে লড়াই করবে
তবে, এরপরে এমন পরামর্শ রয়েছে যা আপনি দেখতে পান, খুব ভাল উত্স থেকে বোঝা যায় যে ট্রেন এবং পরীক্ষার ত্রুটির মধ্যে একটি ব্যবধান ওভারফিটিংয়ের ইঙ্গিত দেয়। এখানে একটি উদাহরণ রয়েছে: অ্যান্ড্রু এনজি (একটি দুর্দান্ত আলাপ) এর "বাদাম ও বোল্টস" কথাবার্তা https://www.youtube.com/watch?v=F1ka6a13S9I যেখানে প্রায় সময় স্ট্যাম্পে 48:00 তিনি একটি ফ্লো চার্ট আঁকেন এতে বলা হয়েছে যে "যদি আপনার ট্রেনের সেট ত্রুটিটি কম থাকে এবং আপনার ট্রেন-ডেভ সেট ত্রুটি বেশি হয়, আপনার নিয়মিতকরণ করা উচিত, আরও ডেটা পাওয়া উচিত, বা মডেল আর্কিটেকচার পরিবর্তন করা উচিত ..." যা ওভারফিটিংয়ের বিরুদ্ধে লড়াইয়ের জন্য আপনি নিতে পারেন এমন সমস্ত পদক্ষেপ।
যা আমাকে এনেছে ... : আমি কি এখানে কিছু মিস করছি? এটি কি থাম্বের একটি মডেল নির্দিষ্ট নিয়ম (সাধারণত সরল মডেলগুলির ট্রেন এবং পরীক্ষার মধ্যে কম ফাঁক থাকে না)? না কি কেবল দুটি পৃথক চিন্তাভাবনা আছে?