আপনি যখন একটি বড় ডেটাসেটে মডেলগুলি ফিট করার চেষ্টা করছেন, তখন সাধারণ পরামর্শটি হ'ল ডেটাটিকে তিন ভাগে বিভক্ত করা: প্রশিক্ষণ, বৈধতা এবং পরীক্ষা ডেটাসেট।
এটি কারণ মডেলগুলির সাধারণত প্যারামিটারগুলির তিনটি "স্তর" থাকে: প্রথম "পরামিতি" হ'ল মডেল বর্গ (যেমন এসভিএম, নিউরাল নেটওয়ার্ক, এলোমেলো বন), পরামিতিগুলির দ্বিতীয় সেট হ'ল "নিয়মিতকরণ" পরামিতি বা "হাইপারপ্যারামিটার" ( যেমন লাসো পেনাল্টি সহগ, কর্নেলের পছন্দ, নিউরাল নেটওয়ার্ক কাঠামো) এবং তৃতীয় সেটটি সাধারণত "প্যারামিটার" হিসাবে বিবেচিত হয় (যেমন কোভেরিয়েটের জন্য সহগ))
একটি মডেল শ্রেণি এবং হাইপারপ্যারামিটারের পছন্দ দেওয়া, প্রশিক্ষণ সংস্থায় ত্রুটি হ্রাসকারী পরামিতিগুলি বেছে নিয়ে পরামিতিগুলি বেছে নেওয়া হয়। একটি মডেল শ্রেণি দেওয়া হয়েছে, কেউ বৈধতা সেটটিতে ত্রুটি হ্রাস করে হাইপারপ্রেমিটারগুলিকে সুর দেয়। একটি পরীক্ষা সেটে পারফরম্যান্সের মাধ্যমে মডেল শ্রেণি নির্বাচন করে।
তবে কেন আরও পার্টিশন নেই? প্রায়শই একজন হাইপারপ্যারামিটারগুলিকে দুটি গ্রুপে বিভক্ত করতে পারে এবং প্রথমটির জন্য "বৈধকরণ 1" এবং দ্বিতীয়টির সাথে ফিট করার জন্য "বৈধতা 2" ব্যবহার করতে পারে। বা এমন কেউ প্রশিক্ষণের ডেটা / বৈধতা ডেটা বিভক্ত করার আকারকে হাইপারপ্যারামিটার হিসাবে সুর করতে পারে।
এটি ইতিমধ্যে কিছু অ্যাপ্লিকেশনগুলিতে একটি সাধারণ অভ্যাস? তথ্যের অনুকূল বিভাজন নিয়ে কি কোনও তাত্ত্বিক কাজ রয়েছে?