ক্রসওয়েডেশন দিয়ে কাজ করার উপায়টি আপনি সঠিকভাবে বর্ণনা করেছেন। আসলে, আপনি শেষে যুক্তিসঙ্গত বৈধতা সেট করার জন্য 'ভাগ্যবান', কারণ প্রায়শই, মডেলটি অনুকূল করার জন্য ক্রসওয়েডেশন ব্যবহার করা হয়, তবে কোনও "আসল" বৈধতা হয় না।
@ সিমন স্টেলিং তার মন্তব্যে যেমন বলেছিলেন যে ক্রসঅ্যাডিয়াল্টিফিকেশন হ'ল আনুমানিক ত্রুটি ঘটবে (যা বোঝায় যে আপনি ক্রমাগত ডেটা পুনরায় ব্যবহার করছেন) তবে ভাগ্যক্রমে সমস্ত মডেলের ক্ষেত্রেই তাই বিপর্যয়কে বাদ দেওয়া (অর্থাত্: ত্রুটিগুলি কেবল হ্রাস হয়) একটি "খারাপ" মডেলের জন্য কিছুটা, এবং "ভাল" মডেলের জন্য আরও কিছু), ক্রসওলাইটেড মানদণ্ডে সেরা অভিনয় করে এমন মডেল নির্বাচন করা সাধারণত "বাস্তবের জন্য" সেরাও হয়ে উঠবে।
কখনও কখনও নিম্ন ত্রুটিগুলির জন্য কিছুটা সংশোধন করার জন্য ব্যবহৃত একটি পদ্ধতি হ'ল বিশেষত যদি আপনি পার্সিমোনাস মডেলগুলির সন্ধান করছেন, তবে সেই ক্ষুদ্রতম মডেল / সর্বাধিক সহজ পদ্ধতিটি বেছে নেওয়া হয় যার জন্য ক্রসওলাইটেড ত্রুটিটি কোনও এসডির মধ্যে (ক্রসওলাইটেড) সর্বোত্তম থেকে নেওয়া হয়। ক্রসওয়েডিয়েশন নিজেই হিসাবে, এটি একটি হিউরিস্টিক, সুতরাং এটি কিছু যত্ন সহ ব্যবহার করা উচিত (যদি এটি বিকল্প হয়: আপনার সুরের প্যারামিটারগুলির বিরুদ্ধে আপনার ত্রুটির একটি চক্রান্ত করুন: এটি আপনাকে গ্রহণযোগ্য ফলাফল রয়েছে কিনা তা আপনাকে কিছু ধারণা দেবে)
ত্রুটিগুলির নিম্নমুখী পক্ষপাতদর্শন দেওয়া, ক্রসওয়েডেশন থেকে ত্রুটিগুলি বা অন্য কার্য সম্পাদনের পরিমাপ প্রকাশ করা গুরুত্বপূর্ণ নয় যে এগুলি ক্রসওয়েডেশন থেকে আসে (যদিও সত্য বলা যায়: আমি অনেকগুলি প্রকাশনা দেখেছি যা উল্লেখ করে না যে মূল ডেটাসেটে পারফরম্যান্স যাচাই করা থেকে কর্মক্ষমতা পরিমাপ করা হয়েছিল --- সুতরাং ক্রসওয়েডিয়েশন উল্লেখ করা আসলে আপনার ফলাফলকে আরও মূল্যবান করে তোলে )। আপনার জন্য, এটি কোনও সমস্যা হবে না, যেহেতু আপনার বৈধতা সেট রয়েছে।
একটি চূড়ান্ত সতর্কতা: যদি আপনার মডেল ফিটিংয়ের ফলে কিছু ঘনিষ্ঠ প্রতিযোগীদের ফলাফল আসে তবে পরে আপনার বৈধতা সেটটির উপর তাদের পারফরম্যান্সগুলি দেখার পক্ষে ভাল ধারণা, তবে এটির উপর আপনার চূড়ান্ত মডেল নির্বাচনকে ভিত্তি রাখবেন না : আপনি এটিকে সর্বোত্তমভাবে প্রশান্ত করতে আপনার ব্যবহার করতে পারেন বিবেক, তবে আপনার "চূড়ান্ত" মডেলটি অবশ্যই যাচাইকরণ সেটটিতে দেখার আগে অবশ্যই নেওয়া উচিত।
আপনার দ্বিতীয় প্রশ্নটি লিখেছেন: আমি বিশ্বাস করি সাইমন আপনার মন্তব্যে আপনার প্রয়োজনীয় সমস্ত উত্তর দিয়েছেন, তবে ছবিটি সম্পূর্ণ করার জন্য: প্রায়শই, এটি পক্ষপাত-বৈচিত্র্য বাণিজ্য বন্ধ হয়ে যায় যা কার্যকর হয়। যদি আপনি জানেন যে, গড়ে, আপনি সঠিক ফলাফলটিতে পৌঁছে যাবেন (পক্ষপাতহীনতা), দাম সাধারণত আপনার প্রতিটি পৃথক গণনা এটি থেকে অনেক দূরে থাকতে পারে (উচ্চ বৈকল্পিক)। পুরানো দিনগুলিতে, নিরপেক্ষতা হ'ল NEC প্লাস আলট্রা, বর্তমান সময়ে, কেউ একবারে (ছোট) পক্ষপাতিত্ব গ্রহণ করেছে (সুতরাং আপনি জানেন না যে আপনার গণনার গড়ের সঠিক ফলাফল হবে), যদি এটি হয় নিম্ন বৈকল্পিক ফলাফল। অভিজ্ঞতা দেখিয়েছে যে ভারসাম্যটি 10-ভাঁড়ের ক্রসওয়েডেশন সহ গ্রহণযোগ্য। আপনার জন্য, পক্ষপাত কেবলমাত্র আপনার মডেল অপ্টিমাইজেশনের জন্য সমস্যা হবে, যেহেতু আপনি বৈধতা সেটটিতে মানদণ্ডটি পরে (নির্বিচারে) নির্ধারণ করতে পারেন can যেমন, ক্রসওয়েডিয়েশন ব্যবহার না করার সামান্য কারণ রয়েছে।