এমএনআইএসটি ডেটাসেটকে শ্রেণিবদ্ধকরণ সম্পর্কে সমস্যাটি বিবেচনা করা যাক।
মতে Yann LeCun এর MNIST ওয়েবপৃষ্ঠা , 'Ciresan এট অল।' কনভলিউশনাল নিউরাল নেটওয়ার্ক ব্যবহার করে এমএনআইএসটি পরীক্ষার সেটটিতে 0.23% ত্রুটি হার পেয়েছে।
আসুন এমএনআইএসটি প্রশিক্ষণকে ডি_ as হিসাবে সেট করুন , এমএনআইএসটি টেস্টকে ডি_ as হিসাবে সেট করুন , চূড়ান্ত হাইপোথিসিসটি তারা কে হিসাবে ব্যবহার করেছেন এবং ব্যবহার করে এমএনআইএসটি পরীক্ষায় তাদের ত্রুটির হার হিসাবে চিহ্নিত করেছেন ।
তাদের দৃষ্টিকোণ, যেহেতু এলোমেলোভাবে ইনপুট স্থান নির্বিশেষে থেকে টেস্ট সেট নমুনা হয় , তারা যে আউট-অফ-নমুনা তাদের চূড়ান্ত হাইপোথিসিস ত্রুটির কর্মক্ষমতা জিদ করতে হল অসমতা থেকে নিম্নলিখিত হিসাবে আবদ্ধ যেখানে।
অন্য কথায়, কমপক্ষে সম্ভাব্যতা , ই ও ইউ টি ( এইচ 1 ) ≤ ই টি ই এস টি ( এইচ 1 ) + √ √
আসুন অন্য দৃষ্টিভঙ্গি বিবেচনা করা যাক। মনে করুন যে কোনও ব্যক্তি এমএনআইএসটি পরীক্ষার সেটটি ভালভাবে শ্রেণিবদ্ধ করতে চায়। সুতরাং তিনি প্রথমে ইয়ান লেকুনের এমএনআইএসটি ওয়েবপৃষ্ঠায় দেখেছেন এবং ৮ টি ভিন্ন ভিন্ন মডেল ব্যবহার করে অন্যান্য লোকেরা প্রাপ্ত ফলাফলগুলি পেয়েছেন,
এবং তার মডেল যা 8 মডেলের মধ্যে এমএনআইএসটি পরীক্ষার সেটটিতে সেরা পারফর্ম করেছে।
তার জন্য, শিক্ষণ পদ্ধতি একটি হাইপোথিসিস অবচয় হয় যার উপর টেস্ট সেট শ্রেষ্ঠ সঞ্চালিত একটি হাইপোথিসিস সেট থেকে ।ডি টি ই গুলি টি এইচ টি R একটি আমি এন ই ঘ = { জ 1 , এইচ 2 , । । , জ 8 }
সুতরাং, পরীক্ষার সেট on ত্রুটিটি এই শেখার প্রক্রিয়াটির জন্য 'ইন-স্যাম্পল' ত্রুটি, সুতরাং তিনি নিম্নলিখিত বৈষম্য হিসাবে সীমাবদ্ধ অনুমানের সেটগুলির জন্য উপাচার্যকে আবদ্ধ করতে পারেন। P [ | E o u t ( g ) - E i n ( g ) | < ϵ ] ≥ 1 - 2 | এইচ টি আর এ আই এন ই ডি | e 2 ϵ 2 N t e s t
অন্য কথায়, কমপক্ষে সম্ভাব্যতা , ই ও ও টি ( জি ) ≤ ই টি ই এস টি ( জি ) + √ √
এই ফলাফলটি সূচিত করে যে আমরা যদি মডেলটিকে বিভিন্ন মডেলের মধ্যে সেরা পারফর্ম করি তবে টেস্ট সেটগুলিতে ওভারফিটিং থাকতে পারে।
এই ক্ষেত্রে, ব্যক্তি pick বাছাই করতে পারে যা সর্বনিম্ন ত্রুটির হার । যেহেতু এই নির্দিষ্ট পরীক্ষার সেট on এর 8 টি মডেলের মধ্যে সেরা অনুমান , তাই কিছুটা সম্ভাবনা থাকতে পারে যে M এমএনআইএসটি পরীক্ষার সেটটিতে একটি হাইপোথিসিস over E t e s t ( h 1 ) = 0.0023 h 1 D t e s t h 1
সুতরাং, এই ব্যক্তি নিম্নলিখিত অসমতা জোর করতে পারেন।
ফলস্বরূপ, আমরা দুটি অসমতা পেয়েছি এবং ।
যাইহোক, এই দুটি বৈষম্য অসম্পূর্ণ যে স্পষ্ট।
আমি কোথায় ভুল করছি? কোনটি সঠিক এবং কোনটি ভুল?
যদি পরবর্তীটি ভুল হয়, সেক্ষেত্রে সীমাবদ্ধ অনুমানের সেটগুলির জন্য উপাচার্যকে আবদ্ধ করার সঠিক উপায় কী?