আপনি না আছে আছে। আপনি 1 টি অন্তর্ভুক্ত করুন কিনা ক্ষতির ফাংশনে একই নূন্যতম রয়েছে বা এটি দমন। আপনি যদি এটি অন্তর্ভুক্ত করেন তবে আপনিডেটাপয়েন্টেগড়ত্রুটিহ্রাস করার (এক অর্ধেক) সুন্দর ব্যাখ্যাপাবেন। অন্য উপায় রাখুন, আপনিমোট ত্রুটির পরিবর্তেত্রুটিহারকেহ্রাস করছেন।1m
ভিন্ন আকারের দুটি ডেটা সেটগুলিতে পারফরম্যান্সের তুলনা বিবেচনা করুন। স্কোয়ার ত্রুটির কাঁচা অঙ্কটি সরাসরি তুলনামূলক নয়, কারণ বড় আকারের ডেটাসেটগুলির আকারের কারণে আরও মোট ত্রুটি থাকে। অন্যদিকে, datapoint প্রতি গড় ত্রুটি হয় ।
আপনি কিছুটা ব্যাখ্যা করতে পারেন?
অবশ্যই। আপনার ডেটা সেট ডাটা পয়েন্টের একটি সংগ্রহ । আপনার একবার মডেল এইচ হয়ে গেলে , একক ডেটা পয়েন্টে এইচ এর সর্বনিম্ন স্কোয়ার ত্রুটি{xi,yi}hh
(h(xi)−yi)2
এটি অবশ্যই প্রতিটি ডেটাপয়েন্টের জন্য আলাদা। এখন, আমরা যদি কেবল ত্রুটিগুলি সংশ্লেষ করি (এবং আপনি যে কারণে বর্ণনা করেছেন তার জন্য অর্ধেক গুণ করে) আমরা মোট ত্রুটি পাই
12∑i(h(xi)−yi)2
তবে যদি আমরা সমান সংখ্যার সাথে ভাগ করে থাকি তবে আমরা প্রতি পয়েন্ট প্রতি গড় ত্রুটি পাই
12m∑i(h(xi)−yi)2
গড় ত্রুটি সুবিধার যে আমরা আছে যদি দুই ডেটাসেট এবং { এক্স ' আমি , Y ' আমি } এর মাপ differeing , তাহলে আমরা গড় ত্রুটি তুলনা করতে পারবেন কিন্তু মোট ত্রুটি। যদি দ্বিতীয় ডেটা সেট হয়, বলুন, প্রথমটির আকারের দশগুণ বেশি, তবে আমরা একই মডেলের জন্য মোট ত্রুটিটি প্রায় দশগুণ বেশি হবে বলে আশা করব। অন্যদিকে, গড় ত্রুটি ডেটা সেটের আকারের প্রভাবকে বিভক্ত করে এবং তাই আমরা আশা করি যে একই রকম পারফরম্যান্সের মডেলগুলি বিভিন্ন ডেটা সেটগুলিতে একই গড় ত্রুটি থাকতে পারে।{xi,yi}{x′i,y′i}