শেখার বক্ররেখাকে বিবেচনা করে কে ভাঁজ সংখ্যা নির্বাচন করা
আমি যুক্তি দিয়ে বলতে চাই যে সংখ্যার উপযুক্ত ভাঁজগুলি বেছে নেওয়া শেখার বক্ররেখার আকৃতি এবং অবস্থানের উপর অনেক বেশি নির্ভর করে, বেশিরভাগ ক্ষেত্রে পক্ষপাতের প্রভাবের কারণে । এই যুক্তিটি, যা ছাড়ার বাইরে থাকা সিভি পর্যন্ত প্রসারিত, মূলত "পরিসংখ্যান শিক্ষার উপাদানসমূহ" অধ্যায় 7.10, পৃষ্ঠা 243 পৃষ্ঠা থেকে নেওয়া হয়েছে।K
প্রভাব আলোচনা জন্য উপর ভ্যারিয়েন্স দেখতে এখানেK
সংক্ষিপ্তসার হিসাবে, যদি শিখনের বক্ররেখা প্রদত্ত প্রশিক্ষণ সেট আকারে যথেষ্ট slালু হয়, তবে পাঁচ-বা দশগুণ ক্রস-বৈধকরণটি সত্য ভবিষ্যদ্বাণী ত্রুটির উপর নজর রাখবে। এই পক্ষপাতটি বাস্তবে কোনও অসুবিধা কিনা তা নির্ভর করে উদ্দেশ্যের উপর। অন্যদিকে, লেভ-ওয়ান-আউট ক্রস-বৈধতার কম পক্ষপাত রয়েছে তবে উচ্চতর বৈকল্পিকতা থাকতে পারে।
একটি খেলনা উদাহরণ ব্যবহার করে একটি স্বজ্ঞাত দৃশ্য
এই যুক্তিটি চাক্ষুষভাবে বুঝতে, নীচের খেলনা উদাহরণটি বিবেচনা করুন যেখানে আমরা কোলাহলপূর্ণ সাইন বক্ররেখাতে বহু ডিগ্রি 4 ডিগ্রি ফিট করি:
স্বজ্ঞাত এবং দৃষ্টিভঙ্গি হিসাবে, আমরা আশা করি এই মডেলটি অতিরিক্ত ফিটিংয়ের কারণে ছোট ডেটাসেটগুলির জন্য খারাপভাবে ভাড়া দেবে। এই আচরণ শেখার বক্ররেখা প্রতিফলিত হয় যেখানে আমরা প্লটে বিভক্ত একসাথে বনাম প্রশিক্ষণ আকার মিন স্কয়ার ত্রুটি 1 স্ট্যান্ডার্ড ডেভিয়েশন। নোট করুন যে আমি ESL পৃষ্ঠা 243 তে ব্যবহৃত চিত্রটির পুনরুত্পাদন করতে 1 - এমএসই প্লট করার সিদ্ধান্ত নিয়েছি±1−±
যুক্তি নিয়ে আলোচনা হচ্ছে
প্রশিক্ষণের আকার 50 টি পর্যবেক্ষণে বৃদ্ধি পাওয়ার সাথে সাথে মডেলটির কর্মক্ষমতা উল্লেখযোগ্যভাবে উন্নত হয়। উদাহরণস্বরূপ সংখ্যাটি আরও 200 এ বৃদ্ধি করা কেবলমাত্র সামান্য সুবিধা দেয়। নিম্নলিখিত দুটি ক্ষেত্রে বিবেচনা করুন:
যদি আমাদের ট্রেনিং সেট 200 পর্যবেক্ষণ ছিল, ভাঁজ ক্রস বৈধতা 160 এর একটি প্রশিক্ষণ আকার উপর কর্মক্ষমতা যা ট্রেনিং সেট আকার জন্য কর্মক্ষমতা যেমন কার্যত একই অনুমান হবে 200. সুতরাং ক্রস বৈধতা অনেক পক্ষপাত ভোগা করবে না বাড়িয়ে করতে বৃহত্তর মানগুলি খুব বেশি সুবিধা বয়ে আনবে না ( বাম হাতের প্লট )কে5K
তবে যদি প্রশিক্ষণ সেটটিতে পর্যবেক্ষণ থাকে তবে মাপের ক্রস-বৈধতা 40 মাপের প্রশিক্ষণের সেটগুলির তুলনায় মডেলটির কার্যকারিতা অনুমান করতে পারে এবং শেখার বক্ররেখা থেকে এটি একটি পক্ষপাতদুষ্ট ফলাফলের দিকে পরিচালিত করবে। অতএব এই ক্ষেত্রে বাড়িয়ে পক্ষপাতিত্ব হ্রাস করতে প্রবণতা হবে। ( ডান হাতের চক্রান্ত )।5 কে505K
[আপডেট] - পদ্ধতি সম্পর্কে মন্তব্য
আপনি এই সিমুলেশন কোড জানতে পারেন এখানে । পদ্ধতির নিম্নলিখিত ছিল:
- ডিস্ট্রিবিউশন সাইন থেকে 50,000 পয়েন্ট তৈরি করুন যেখানে প্রকৃত জানা যায়ϵsin(x)+ϵϵ
- বার Iterate (উদাঃ 100 বা 200 বার)। প্রতিটি পুনরাবৃত্তিতে, মূল বিতরণ থেকে পয়েন্টগুলি পুনরায় মডেল করে ডেটাসেট পরিবর্তন করুনএনiN
- প্রতিটি ডেটা সেট করার জন্য :
i
- এক মান জন্য ক্রস বৈধতা কে-ভাঁজ সঞ্চালনK
- কে-ফোল্ডগুলি জুড়ে গড় গড় স্কোয়ার ত্রুটি (এমএসই) সঞ্চয় করুন
- একবার উপরের লুপটি সম্পূর্ণ হয়ে গেলে , একই মানের জন্য ডেটাসেট জুড়ে এমএসইর গড় এবং মান বিচ্যুতি গণনা করুনআমি কেiiK
- সমস্ত এর জন্য OO L সমস্ত এলইউসিভিতে যাওয়ার জন্য উপরের পদক্ষেপগুলি পুনরাবৃত্তি করুন{ 5 , । । । , এন }K{5,...,N}
একটি বিকল্প পদ্ধতির হয় রীস্যাম্পেল না প্রতিটি পুনরাবৃত্তির একটি নতুন ডেটা সেট এবং এর পরিবর্তে একই ডেটা সেটটি প্রতিটি সময় রদবদল। এটি একই রকম ফলাফল বলে মনে হচ্ছে।