k -ফোল্ড ক্রস বৈধকরণ
ধরুন আপনার কাছে 100 ডেটা পয়েন্ট রয়েছে। জন্য ক্রস বৈধতা ধা, এই 100 পয়েন্ট বিভক্ত সমান মাপের এবং পারস্পরিক একচেটিয়া 'ভাঁজে। জন্য = 10, আপনি দায়িত্ব অর্পণ পারে 1-10 পয়েন্ট # 2 ভাঁজ পৌঁছাতে # 1, 11-20 ভাঁজ, ইত্যাদি, বরাদ্দ পয়েন্ট 91-100 দ্বারা শেষ হচ্ছে # 10 ভাঁজ। এরপরে, আমরা পরীক্ষার সেট হিসাবে কাজ করতে একটি ভাঁজ নির্বাচন করি এবং প্রশিক্ষণ ডেটা গঠনের জন্য অবশিষ্ট ভাঁজগুলি ব্যবহার করি । প্রথম রানের জন্য, আপনি পরীক্ষার সেট হিসাবে 1-10 পয়েন্ট এবং প্রশিক্ষণের সেট হিসাবে 11-100 ব্যবহার করতে পারেন। পরের রানটি 11-10 পয়েন্টগুলি পরীক্ষার সেট হিসাবে ব্যবহার করবে এবং 1-10 পয়েন্ট 21-100 পয়েন্টগুলিতে ট্রেন করবে, এবং প্রতিটি ফোল্ড টেস্ট সেট হিসাবে একবার ব্যবহার না করা পর্যন্ত।kkkk−1
মন্টে-কার্লো ক্রস বৈধকরণ
মন্টি কার্লো কিছুটা আলাদাভাবে কাজ করে। প্রশিক্ষণ সেট গঠনের জন্য আপনি এলোমেলোভাবে আপনার ডেটার কিছু ভগ্নাংশ নির্বাচন করুন এবং তারপরে বাকী পয়েন্টগুলি পরীক্ষার সেটটিতে নির্ধারণ করুন। এই প্রক্রিয়াটি একাধিকবার পুনরাবৃত্তি হয়, প্রতিটি সময় (এলোমেলোভাবে) নতুন প্রশিক্ষণ এবং পরীক্ষার পার্টিশন তৈরি করে। উদাহরণস্বরূপ, ধরুন আপনি পরীক্ষার ডেটা হিসাবে আপনার 10% ডেটা ব্যবহার করতে পছন্দ করেছেন। তারপরে # 1 তে আপনার পরীক্ষার সেটটি points৪, 90 , 63, 42 , 65, 49, 10, 64, 96 এবং 48 পয়েন্ট হতে পারে the পরের রানে আপনার পরীক্ষার সেটটি 90 , 60, 23, 67 হতে পারে 16, 78, 42 , 17, 73, এবং 26. যেহেতু পার্টিশনগুলি প্রতিটি রানের জন্য স্বতন্ত্রভাবে সম্পন্ন হয়, একই পয়েন্টটি পরীক্ষার সেটটিতে একাধিকবার উপস্থিত হতে পারে,যা মন্টি কার্লো এবং ক্রস বৈধতার মধ্যে প্রধান পার্থক্য ।
তুলনা
প্রতিটি পদ্ধতির নিজস্ব সুবিধা এবং অসুবিধা রয়েছে। ক্রস বৈধকরণের অধীনে, প্রতিটি বিন্দু ঠিক একবার পরীক্ষা করা হয়, যা ন্যায্য বলে মনে হচ্ছে। যাইহোক, ক্রস-বৈধকরণ কেবলমাত্র আপনার ডেটা বিভাজন করা যেতে পারে এমন কয়েকটি সম্ভাব্য উপায়গুলি অনুসন্ধান করে। মন্টি কার্লো আপনাকে কিছুটা আরও বেশি সম্ভাব্য পার্টিশন অন্বেষণ করতে দেয়, যদিও আপনি সেগুলির পাওয়ার সম্ভাবনা নেই - এখানে সম্ভাব্য উপায়গুলি 50/50 একটি 100 ডাটা পয়েন্ট বিভক্ত করার সম্ভাব্য উপায়গুলি রয়েছে সেট (!)।(10050)≈1028
আপনি যদি অনুমানের চেষ্টা করছেন (অর্থাত্ পরিসংখ্যানগতভাবে দুটি অ্যালগরিদমের তুলনা করুন), ফোল্ড ক্রস বৈধকরণের ফলাফলের গড় গড় আপনাকে অ্যালগরিদমের পারফরম্যান্সের (প্রায়) নিরপেক্ষ অনুমান করে তবে উচ্চতর বৈকল্পিকতার সাথে (যেমন আপনি চান) কেবলমাত্র 5 বা 10 ডেটা পয়েন্ট থাকা উচিত)। যেহেতু আপনি, নীতিগতভাবে, এটি যতক্ষণ আপনি চান / সামর্থ্য করেন ততক্ষণ চালাতে পারেন, তাই মন্টি কার্লো ক্রস বৈধতা আপনাকে কম পরিবর্তনশীল, তবে আরও পক্ষপাতমূলক অনুমান দিতে পারে।k
5x2 ক্রস বৈধকরণের মত কিছু পন্থা দুটি ফিউজ করেছে ( ধারণাটির জন্য ডায়েটারিচ (1998) দেখুন , যদিও আমি মনে করি তখন থেকে আরও কিছু উন্নতি হয়েছে), বা পক্ষপাতিত্ব সংশোধন করে (যেমন, নাদাউ এবং বেঞ্জিও, 2003 ) ।