পাইথনের সাথে ফ্রেঞ্চোইস চোল্টের ডিপ লার্নিংয়ে এটি বলে:
ফলস্বরূপ, বৈধতা সেটটিতে পারফরম্যান্সের ভিত্তিতে মডেলটির কনফিগারেশনটি টিউন করার ফলে খুব শীঘ্রই বৈধতা সেটটিতে অতিরিক্ত মানানসই ফলাফল আসতে পারে যদিও আপনার মডেলটি এতে সরাসরি প্রশিক্ষণপ্রাপ্ত না হয়।
এই ঘটনার কেন্দ্রবিন্দু হ'ল তথ্য ফাঁসের ধারণা। যখনই আপনি বৈধতা সেটটিতে মডেলটির পারফরম্যান্সের ভিত্তিতে আপনার মডেলের একটি হাইপারপ্যারমিটার টিউন করেন, মডেলটিতে বৈধতা ডেটা ফাঁসের কিছু তথ্য । যদি আপনি কেবল একবার এটি করেন, একটি প্যারামিটারের জন্য, তবে খুব অল্প পরিমাণে তথ্য ফাঁস হবে এবং আপনার বৈধতা সেটটি মডেলটি মূল্যায়নের জন্য নির্ভরযোগ্য থাকবে। তবে আপনি যদি এই বার বার পুনরুক্ত করেন - একটি পরীক্ষা চালাচ্ছেন, বৈধতা সেটটির মূল্যায়ন করা এবং ফলস্বরূপ আপনার মডেলটি পরিবর্তন করুন — তবে আপনি মডেলটিতে সেট হওয়া বৈধতা সম্পর্কে ক্রমবর্ধমান উল্লেখযোগ্য পরিমাণের তথ্য ফাঁস করবেন।
হাইপারপ্যারামিটারগুলি টিউন করার সময় যদি আমি বৈধতা ডেটাতে মডেল পারফরম্যান্সের মূল্যায়ন করি তবে কেন বৈধতা ডেটা সম্পর্কিত তথ্য ফাঁস হবে?