আমার কিছু ডেটা রয়েছে এবং আমি এই তথ্য থেকে একটি মডেল (লিনিয়ার রেগ্রেশন মডেল বলি) তৈরি করতে চাই। পরবর্তী পদক্ষেপে, আমি মডেলটিতে লেভ-ওয়ান-আউট ক্রস-বৈধকরণ (এলইউসিভি) প্রয়োগ করতে চাই যাতে এটি কতটা ভাল পারফর্ম করে দেখুন see
যদি আমি LOOCV টি ঠিক বুঝতে পারি তবে আমি এই নমুনা (প্রশিক্ষণের সেট) ব্যতীত প্রতিটি নমুনা ব্যবহার করে আমার প্রতিটি নমুনার (পরীক্ষার সেট) জন্য একটি নতুন মডেল তৈরি করি। তারপরে আমি পরীক্ষার সেটটি ভবিষ্যদ্বাণী করতে এবং ত্রুটিগুলি গণনার জন্য মডেলটি ব্যবহার করি ।
পরবর্তী পদক্ষেপে আমি একটি নির্বাচিত ফাংশন ব্যবহার করে উত্পন্ন সমস্ত ত্রুটিগুলিকে একত্রিত করি, উদাহরণস্বরূপ স্কোয়ার ত্রুটিটির অর্থ। আমি এই মানগুলি মডেলের গুণমান (বা ফিটনের ভালতা) বিচার করতে ব্যবহার করতে পারি।
প্রশ্ন: এই মানের-মানগুলির জন্য মডেলটি কোন মডেলের জন্য প্রযোজ্য, তাই আমি যদি আমার মামলার জন্য এলওসিভি থেকে উত্পন্ন মেট্রিকগুলি খুঁজে পাই তবে আমি কোন মডেলটি বেছে নেব? LOOCV বিভিন্ন মডেলের দিকে তাকিয়ে (যেখানে এন নমুনার আকার হয়); কোনটি আমার বেছে নেওয়া উচিত?
- এটি কি মডেল যা সমস্ত নমুনা ব্যবহার করে? এই মডেলটি কখনই এলইউসিভি প্রক্রিয়া চলাকালীন গণনা করা হয়নি!
- এটি কি মডেলটিতে সবচেয়ে কম ত্রুটি রয়েছে?