আমি একজন ভান্ডারের চিন্তা করে থাকেন উত্তর আমি কয়েক সপ্তাহ আগে এক প্রশ্নের দিলেন
হোল্ড আউট ক্রস-বৈধকরণ একক পরীক্ষার সেট উত্পাদন করে যা বারবার প্রদর্শনের জন্য ব্যবহার করা যেতে পারে। আমরা সকলেই একমত হয়ে দেখছি যে এটি অনেক দিক থেকে একটি নেতিবাচক বৈশিষ্ট্য, যেহেতু একটি বহিরাগত সেটটি এলোমেলো হয়ে যাওয়ার মাধ্যমে অ-প্রতিনিধি হতে পারে। তদুপরি, আপনি যেমন পরীক্ষার তথ্যগুলিতে অতিরিক্ত মানিয়ে নিতে পারেন তেমনভাবে আপনি প্রশিক্ষণের ডেটা থেকেও বেশি উপকার করতে পারেন।
যাইহোক, এটি আমার কাছে মনে হয় যে একটি আউট-আউট স্যাম্পলটির স্থির প্রকৃতিটি কে-ফোল্ড সিভিয়ের চেয়ে "বেশি ডেটা পাওয়ার" আরও ভাল অনুমান এবং এটি ভাঁজগুলি জুড়ে গড়ের বিষয়টি এড়িয়ে যায়। আমি আমার এই অনুভূতির জন্য কোনও পরিসংখ্যানের ভিত্তিতে আসতে পারি না। আমার অন্তর্দৃষ্টি কোন যুক্তি আছে?
উদাহরণস্বরূপ, আসন্ন প্রকল্পের জন্য আমি যা মনে করি তা হ'ল প্রথমে একটি মডেল তৈরি এবং পরীক্ষার জন্য হোল্ড-আউট বৈধতা ব্যবহার করা হয়, তারপরে যাচাইকরণের পদক্ষেপ হিসাবে আমার ভবিষ্যদ্বাণী ত্রুটির অনুমানটি দেখানোর জন্য হোল্ড-আউট সেটটি বেশ কয়েকবার পুনরায় অঙ্কন করে ( পরীক্ষা সেটটিতে) পরীক্ষার সেটে নমুনা ত্রুটির শক্তিশালী। এটি কোনও কারণে খারাপ ধারণা? এই প্রশ্নটি আগে জিজ্ঞাসা করা হয়েছিল কিন্তু কোনও উত্তর পাই নি।