অনেকগুলি মেশিন লার্নিং অ্যাপ্লিকেশনগুলিতে তথাকথিত ডেটা বৃদ্ধির পদ্ধতিগুলি আরও ভাল মডেল তৈরি করার অনুমতি দিয়েছে। উদাহরণস্বরূপ, বিড়াল এবং কুকুরের 100 টি চিত্রের একটি প্রশিক্ষণ সেট অনুমান করুন । আবর্তন, মিররিং, বিপরীতে সামঞ্জস্যকরণ ইত্যাদির মাধ্যমে মূল চিত্রগুলি থেকে অতিরিক্ত চিত্র উত্পন্ন করা সম্ভব।
চিত্রগুলির ক্ষেত্রে, ডেটা বর্ধন তুলনামূলকভাবে সহজ। তবে, ধরুন (উদাহরণস্বরূপ) একটিতে নমুনা এবং কয়েক শতাধিক ধারাবাহিক ভেরিয়েবলগুলির একটি প্রশিক্ষণ সেট রয়েছে যা বিভিন্ন জিনিস উপস্থাপন করে। ডেটা বর্ধন এতটা স্বজ্ঞাত মনে হয় না। এমন ক্ষেত্রে কী করা যায়?