স্ট্যাটিস্টিকাল লার্নিং থিয়োরিতে কি পরীক্ষার সেটটিতে ওভারফিট করার সমস্যা নেই?


16

এমএনআইএসটি ডেটাসেটকে শ্রেণিবদ্ধকরণ সম্পর্কে সমস্যাটি বিবেচনা করা যাক।

মতে Yann LeCun এর MNIST ওয়েবপৃষ্ঠা , 'Ciresan এট অল।' কনভলিউশনাল নিউরাল নেটওয়ার্ক ব্যবহার করে এমএনআইএসটি পরীক্ষার সেটটিতে 0.23% ত্রুটি হার পেয়েছে।

আসুন এমএনআইএসটি প্রশিক্ষণকে ডি_ as হিসাবে সেট করুন , এমএনআইএসটি টেস্টকে ডি_ as হিসাবে সেট করুন , চূড়ান্ত হাইপোথিসিসটি তারা কে হিসাবে ব্যবহার করেছেন এবং ব্যবহার করে এমএনআইএসটি পরীক্ষায় তাদের ত্রুটির হার হিসাবে চিহ্নিত করেছেন ।DtrainDtestDtrainh1h1Etest(h1)=0.0023

তাদের দৃষ্টিকোণ, যেহেতু এলোমেলোভাবে ইনপুট স্থান নির্বিশেষে থেকে টেস্ট সেট নমুনা হয় , তারা যে আউট-অফ-নমুনা তাদের চূড়ান্ত হাইপোথিসিস ত্রুটির কর্মক্ষমতা জিদ করতে হল অসমতা থেকে নিম্নলিখিত হিসাবে আবদ্ধ যেখানে।Dtesth1Eout(h1)

P[|Eout(h1)Etest(h1)|<ϵ|]12e2ϵ2Ntest

Ntest=|Dtest|

অন্য কথায়, কমপক্ষে সম্ভাব্যতা , ইউ টি ( এইচ 1 ) টি এস টি ( এইচ 1 ) + √ √1δ

Eout(h1)Etest(h1)+12Ntestln2δ

আসুন অন্য দৃষ্টিভঙ্গি বিবেচনা করা যাক। মনে করুন যে কোনও ব্যক্তি এমএনআইএসটি পরীক্ষার সেটটি ভালভাবে শ্রেণিবদ্ধ করতে চায়। সুতরাং তিনি প্রথমে ইয়ান লেকুনের এমএনআইএসটি ওয়েবপৃষ্ঠায় দেখেছেন এবং ৮ টি ভিন্ন ভিন্ন মডেল ব্যবহার করে অন্যান্য লোকেরা প্রাপ্ত ফলাফলগুলি পেয়েছেন,

এমএনআইএসটি শ্রেণিবিন্যাসের ফলাফল

এবং তার মডেল যা 8 মডেলের মধ্যে এমএনআইএসটি পরীক্ষার সেটটিতে সেরা পারফর্ম করেছে।g

তার জন্য, শিক্ষণ পদ্ধতি একটি হাইপোথিসিস অবচয় হয় যার উপর টেস্ট সেট শ্রেষ্ঠ সঞ্চালিত একটি হাইপোথিসিস সেট থেকে ।ডি টি গুলি টি এইচ টি R একটি আমি এন = { 1 , এইচ 2 , , 8 }gDtestএইচটিRএকটিআমিএন={1,2,,8}

সুতরাং, পরীক্ষার সেট on ত্রুটিটি এই শেখার প্রক্রিয়াটির জন্য 'ইন-স্যাম্পল' ত্রুটি, সুতরাং তিনি নিম্নলিখিত বৈষম্য হিসাবে সীমাবদ্ধ অনুমানের সেটগুলির জন্য উপাচার্যকে আবদ্ধ করতে পারেন। P [ | E o u t ( g ) - E i n ( g ) | < ϵ ] 1 - 2 | এইচ টি আর আই এন ডি | e 2 ϵ 2 N t e s tটিগুলিটি()

পি[|তোমার দর্শন লগ করাটি()-আমিএন()|<ε]1-2|এইচটিRএকটিআমিএন|2ε2এনটিগুলিটি

অন্য কথায়, কমপক্ষে সম্ভাব্যতা , টি ( জি ) টি এস টি ( জি ) + √ √1-δ

তোমার দর্শন লগ করাটি()টিগুলিটি()+ +12এনটিগুলিটিএন2|এইচটিRএকটিআমিএন|δ

এই ফলাফলটি সূচিত করে যে আমরা যদি মডেলটিকে বিভিন্ন মডেলের মধ্যে সেরা পারফর্ম করি তবে টেস্ট সেটগুলিতে ওভারফিটিং থাকতে পারে।

এই ক্ষেত্রে, ব্যক্তি pick বাছাই করতে পারে যা সর্বনিম্ন ত্রুটির হার । যেহেতু এই নির্দিষ্ট পরীক্ষার সেট on এর 8 টি মডেলের মধ্যে সেরা অনুমান , তাই কিছুটা সম্ভাবনা থাকতে পারে যে M এমএনআইএসটি পরীক্ষার সেটটিতে একটি হাইপোথিসিস over E t e s t ( h 1 ) = 0.0023 h 1 D t e s t h 11Etest(h1)=0.0023h1Dtesth1

সুতরাং, এই ব্যক্তি নিম্নলিখিত অসমতা জোর করতে পারেন।

Eout(h1)Etest(h1)+12Ntestln2|Htrained|δ

ফলস্বরূপ, আমরা দুটি অসমতা পেয়েছি এবং ।

P[Eout(h1)Etest(h1)+12Ntestln2δ]1δ
P[Eout(h1)Etest(h1)+12Ntestln2|Htrained|δ]1δ

যাইহোক, এই দুটি বৈষম্য অসম্পূর্ণ যে স্পষ্ট।

আমি কোথায় ভুল করছি? কোনটি সঠিক এবং কোনটি ভুল?

যদি পরবর্তীটি ভুল হয়, সেক্ষেত্রে সীমাবদ্ধ অনুমানের সেটগুলির জন্য উপাচার্যকে আবদ্ধ করার সঠিক উপায় কী?

উত্তর:


1

এই দুটি অসমতার মধ্যে আমার মনে হয় পরে ভুল হয়েছে। সংক্ষিপ্ত ইন, এখানে কি ভুল পরিচয় দেওয়া যে টেস্ট ডেটার একটি ফাংশন যখন একটি মডেল টেস্ট ডেটার স্বাধীন হয়।g=h1gh1

বস্তুত, 8 মডেলের অন্যতম যে শ্রেষ্ঠ ভবিষ্যদ্বাণী টেস্ট সেট ।gHtrained={h1,h2,...,h8}Dtest

অতএব, একটি ফাংশন । নির্দিষ্ট পরীক্ষার জন্য, (যেমন আপনি উল্লেখ করেছেন) এর জন্য এটি ঘটতে পারে , তবে সাধারণভাবে, পরীক্ষার সেটের উপর নির্ভর করে, যে কোন ভ্যালু নিতে পারে । অন্য দিকে মাত্র এক মান ।gDtestDtestg(Dtest)=h1g(Dtest)Htrainedh1Htrained

অন্য প্রশ্নের জন্য:

যদি পরবর্তীটি ভুল হয়, সেক্ষেত্রে সীমাবদ্ধ অনুমানের সেটগুলির জন্য উপাচার্যকে আবদ্ধ করার সঠিক উপায় কী?

শুধু প্রতিস্থাপন না দ্বারা , আপনি সঠিক আবদ্ধ (জন্য পাবেন , অবশ্যই) এবং এটি অন্যান্য আবদ্ধ (যার জন্য সঙ্গে কোন দ্বন্দ্ব থাকবে )।gh1gh1

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.