আমার মূল প্রশ্নটি কী-ভাঁজ ক্রস-বৈধকরণ প্রশিক্ষণ / বৈধতা / পরীক্ষার সেট থাকার ক্ষেত্রে (এটি যদি এ জাতীয় প্রসঙ্গে পুরোপুরি ফিট করে তবে) কীভাবে ফিট করে তা বোঝার চেষ্টা করে with
সাধারণত, লোকেরা ডেটাটিকে একটি প্রশিক্ষণ, বৈধকরণ এবং পরীক্ষার সেটগুলিতে বিভক্ত করার কথা বলে - অ্যান্ড্রু এনজি এর কোর্স অনুযায়ী 60/20/20 অনুপাতে বলুন - যার মাধ্যমে বৈধতা সেটটি মডেল প্রশিক্ষণের জন্য অনুকূল পরামিতিগুলি সনাক্ত করতে ব্যবহৃত হয়।
যাইহোক, যদি ডেটার পরিমাণ তুলনামূলকভাবে কম হয় তবে যদি কেউ আরও প্রতিনিধি নির্ভুলতা পরিমাপের আশায় কে-ফোল্ড ক্রস-বৈধতা ব্যবহার করতে চায়, তবে এই 60/20/20 বিভাজনে কে-ভাঁজ ক্রস-বৈধকরণ ঠিক কী করবে? দৃশ্যকল্প?
উদাহরণস্বরূপ, এর অর্থ কি এই যে আমরা প্রকৃতপক্ষে প্রশিক্ষণ এবং পরীক্ষার সেটগুলি (তথ্যের ৮০%) একত্রিত করব এবং তাদের নির্ভুলতার পরিমাপ (স্পষ্টতই 'পরীক্ষার সেট' রেখে কার্যকরভাবে বিচ্ছিন্নকরণ) পেতে কে-ফোল্ড ক্রস বৈধতা দেব? যদি তাই হয়, আমরা কোন প্রশিক্ষিত মডেলটি ব্যবহার করব) ক উত্পাদনে, এবং খ) বৈধতা সেটের বিরুদ্ধে ব্যবহার করতে এবং অনুকূল প্রশিক্ষণের পরামিতিগুলি সনাক্ত করতে? উদাহরণস্বরূপ, a এবং b এর একটি সম্ভাব্য উত্তর সম্ভবত সেরা-ভাঁজ মডেলটি ব্যবহার করা।