আমি মনে করি যে ক্রস-বৈধকরণের উদ্দেশ্যটি বোঝার জন্য আপনি এখনও কিছু মিস করছেন।
আসুন কিছু পরিভাষা সোজা হয়ে উঠি, সাধারণত যখন আমরা 'একটি মডেল' বলি আমরা কিছু ইনপুট ডেটা কীভাবে আমাদের পূর্বাভাস দেওয়ার চেষ্টা করি তার সাথে কীভাবে সম্পর্কিত তার বর্ণনা দেওয়ার জন্য একটি নির্দিষ্ট পদ্ধতি উল্লেখ করি। আমরা সাধারণত সেই পদ্ধতির নির্দিষ্ট উদাহরণগুলিকে বিভিন্ন মডেল হিসাবে উল্লেখ করি না। সুতরাং আপনি বলতে পারেন যে 'আমার কাছে লিনিয়ার রিগ্রেশন মডেল রয়েছে' তবে আপনি প্রশিক্ষিত সহগের দুটি ভিন্ন সেটকে বিভিন্ন মডেল কল করবেন না। কমপক্ষে মডেল নির্বাচনের প্রসঙ্গে নয়।
সুতরাং, যখন আপনি কে-ফোল্ড ক্রস বৈধকরণ করবেন, আপনি পরীক্ষা করছেন যে আপনার মডেল কতটা ডেটা দ্বারা প্রশিক্ষিত হতে সক্ষম হবে এবং তারপরে এটি ডেটা না দেখে পূর্বাভাস দেয়। আমরা এর জন্য ক্রস বৈধতা ব্যবহার করি কারণ আপনি যদি আপনার সমস্ত ডেটা ব্যবহার করে প্রশিক্ষণ দেন তবে আপনার পরীক্ষার জন্য আর কিছুই অবশিষ্ট নেই। আপনি একবার এটি করতে পারেন, প্রশিক্ষণের জন্য 80% উপাত্ত এবং পরীক্ষার জন্য 20% ব্যবহার করে বলুন, তবে আপনি যদি পরীক্ষা করতে যা করেছেন 20% এর মধ্যে এমন কিছু পয়েন্ট রয়েছে যা বিশেষত সহজ (বা বিশেষত শক্ত) অনুমান করা? আমরা মডেলগুলি শিখতে এবং ভবিষ্যদ্বাণী করতে সক্ষমতার সর্বোত্তম অনুমানের সাথে আসতে পারি না।
আমরা সমস্ত ডেটা ব্যবহার করতে চাই। সুতরাং ৮০/২০ বিভক্তের উপরের উদাহরণটি চালিয়ে যেতে, আমরা ৮০% ডেটাতে times বার মডেলকে প্রশিক্ষণ দিয়ে এবং ২০% পরীক্ষার মাধ্যমে 5-গুণ ক্রস বৈধকরণ করব। আমরা নিশ্চিত করি যে প্রতিটি ডেটা পয়েন্ট ঠিক একবারে 20% পরীক্ষায় সেট হবে। তাই আমাদের মডেল কিছু তথ্য থেকে শেখার এবং কিছু নতুন ডেটা পূর্বাভাস দেওয়ার কাজটি কতটা ভাল সম্পাদন করে তা বোঝার জন্য আমাদের প্রতিটি ডেটা পয়েন্ট ব্যবহার করেছি।
তবে ক্রস-বৈধকরণের উদ্দেশ্যটি আমাদের চূড়ান্ত মডেলটি সামনে এড়ানো নয়। আমরা আমাদের প্রশিক্ষিত মডেলটির এই 5 টি উদাহরণ কোনও বাস্তব ভবিষ্যদ্বাণী করতে ব্যবহার করি না। তার জন্য আমরা আমাদের সেরা ডেটা যতটা সম্ভব সেরা মডেল নিয়ে আসতে চাইছি। ক্রস-বৈধকরণের উদ্দেশ্য মডেল চেকিং, মডেল বিল্ডিং নয়।
এখন, আমাদের দুটি মডেল আছে বলুন, লিনিয়ার রিগ্রেশন মডেল এবং নিউরাল নেটওয়ার্ক বলুন। আমরা কীভাবে বলতে পারি কোন মডেলটি ভাল? আমরা কে-ভাঁজ ক্রস-বৈধকরণ করতে পারি এবং পরীক্ষা সেট পয়েন্টগুলির পূর্বাভাস দেওয়ার ক্ষেত্রে কোনটি আরও ভাল প্রমাণিত হতে পারে তা দেখতে পারি। তবে একবার আমরা আরও ভাল পারফর্মিং মডেল বাছাই করতে ক্রস-বৈধকরণ ব্যবহার করার পরে, আমরা সেই সমস্ত মডেল (সেই লিনিয়ার রিগ্রেশন বা নিউরাল নেটওয়ার্ক যাই হোক না কেন) সেই মডেলটিকে প্রশিক্ষণ দিই। আমরা আমাদের চূড়ান্ত ভবিষ্যদ্বাণীমূলক মডেলের জন্য ক্রস-বৈধকরণের সময় প্রশিক্ষিত প্রকৃত মডেল উদাহরণগুলি ব্যবহার করি না।
নোট করুন যে বুটস্ট্র্যাপ অগ্রিগ্রেশন নামে একটি প্রযুক্তি রয়েছে (সাধারণত 'ব্যাগিং'কে ছোট করা হয়) যা কোনও উপায়ে মডেল তৈরির জন্য ক্রস-বৈধকরণের অনুরূপ উপায়ে তৈরি মডেল দৃষ্টান্তগুলি ব্যবহার করে, তবে এটি সুযোগের বাইরে একটি উন্নত প্রযুক্তি is আপনার প্রশ্ন এখানে।