এটি আপনার কাছে থাকা ডেটার পরিমাণ, পদ্ধতির নির্দিষ্ট ব্যয় এবং আপনি কীভাবে আপনার ফলাফল হতে চান তা নির্ভর করে।
কিছু উদাহরণ:
আপনার যদি অল্প ডেটা থাকে তবে আপনি সম্ভবত ক্রস-বৈধকরণ (কে-ভাঁজ, ছেড়ে যাওয়া-ওয়ান-আউট ইত্যাদি) ব্যবহার করতে চান আপনার মডেল সম্ভবত যেভাবেই প্রশিক্ষণ এবং পরীক্ষা করতে খুব বেশি সংস্থান গ্রহণ করবে না। আপনার ডেটা থেকে সর্বাধিক পাওয়ার ভাল উপায় good
আপনার কাছে প্রচুর ডেটা রয়েছে: আপনি সম্ভবত একটি যুক্তিসঙ্গতভাবে বড় টেস্ট-সেট নিতে চান, এটি নিশ্চিত করে যে কিছু অদ্ভুত নমুনা আপনার ফলাফলের অনেক বৈচিত্র্য দেবে এমন সম্ভাবনা খুব কমই থাকবে। আপনার কতটা ডাটা নেওয়া উচিত? এটি সম্পূর্ণ আপনার ডেটা এবং মডেলের উপর নির্ভর করে। উদাহরণস্বরূপ বক্তৃতা স্বীকৃতি হিসাবে, আপনি যদি খুব বেশি ডেটা নেন (আসুন 3000 বাক্য বলি), আপনার পরীক্ষাগুলি কয়েক দিন সময় নিতে পারে, কারণ 7-10 এর রিয়েলটাইম ফ্যাক্টরটি সাধারণ। আপনি যদি খুব সামান্য গ্রহণ করেন তবে এটি আপনি যে স্পিকারগুলি বেছে নিচ্ছেন তার উপর এটি অনেক বেশি নির্ভরশীল (যা প্রশিক্ষণের সেটটিতে অনুমোদিত নয়)।
এছাড়াও মনে রাখবেন, অনেক ক্ষেত্রেই একটি বৈধতা / বিকাশ সেট করা ভাল!