ওকামের রেজার নীতি:
দুটি অনুমান (এখানে, সিদ্ধান্তের সীমানা) রয়েছে যা একই অভিজ্ঞতাগত ঝুঁকি রয়েছে (এখানে, প্রশিক্ষণের ত্রুটি), একটি সংক্ষিপ্ত ব্যাখ্যা (এখানে, কম পরামিতি সহ একটি সীমানা) দীর্ঘ ব্যাখ্যার চেয়ে আরও বৈধ হতে পারে।
আপনার উদাহরণে, A এবং B উভয়েরই শূন্য প্রশিক্ষণের ত্রুটি রয়েছে, সুতরাং বি (সংক্ষিপ্ত ব্যাখ্যা) পছন্দ করা হয়।
প্রশিক্ষণের ত্রুটি যদি এক না হয় তবে কী হবে?
যদি সীমানা A এর বি এর চেয়ে ছোট প্রশিক্ষণের ত্রুটি থাকে তবে নির্বাচন করা জটিল হয়ে ওঠে। আমাদের "ব্যাখ্যা আকার" পরিমাণটিকে "অভিজ্ঞতামূলক ঝুঁকি" হিসাবে সমান করতে হবে এবং দুটিকে একটি স্কোরিং ফাংশনে একত্রিত করতে হবে, তারপরে A এবং B এর তুলনা চালিয়ে যেতে হবে উদাহরণ হ'ল আকাইকে তথ্য মানদণ্ড (এআইসি) যা অভিজ্ঞতাগত ঝুঁকির সাথে সংহত হয় (নেতিবাচক সাথে পরিমাপ করা হয়) লগ-সম্ভাবনা) এবং ব্যাখ্যা আকার (পরামিতি সংখ্যা সঙ্গে পরিমাপ করা) এক স্কোর।
পার্শ্ব নোট হিসাবে, এআইসি সমস্ত মডেলের জন্য ব্যবহার করা যাবে না, এআইসিরও অনেক বিকল্প রয়েছে।
বৈধতা সেট সম্পর্কিত
অনেক ব্যবহারিক ক্ষেত্রে, মডেল যখন আরও জটিলতার দিকে অগ্রসর হয় (বৃহত্তর ব্যাখ্যা) একটি নিম্ন প্রশিক্ষণের ত্রুটিতে পৌঁছানোর জন্য, তখন এআইসি এবং এর মতো একটি বৈধতা সেট (এমন একটি সেট যা মডেল প্রশিক্ষণপ্রাপ্ত নয়) দ্বারা প্রতিস্থাপন করা যেতে পারে। যখন বৈধতা ত্রুটি (বৈধতা সেটটিতে মডেলের ত্রুটি) বৃদ্ধি শুরু হয় তখন আমরা অগ্রগতিটি থামি। এইভাবে, আমরা নিম্ন প্রশিক্ষণের ত্রুটি এবং সংক্ষিপ্ত ব্যাখ্যার মধ্যে ভারসাম্য রোধ করি।