যেমন অন্যান্য উত্তর থেকে বোঝা যায়, এসজিডি ব্যবহারের মূল কারণ হ'ল গ্রেডিয়েন্টের গণনা ব্যয় হ্রাস করা যখন এখনও বেশিরভাগ মিনি ব্যাচ বা নমুনাগুলির উপরে গড় হয় যখন গ্রেডিয়েন্ট দিকটি বজায় রাখে - এটি অবশ্যই আপনাকে স্থানীয় মিনিমাতে আনতে সহায়তা করে।
- মিনিবাচ কেন কাজ করে ।
পিঘa t aপি^ঘa t a
ছ= ইপিঘa t a( ∂)জে( θ )∂θ)
এসই( ছ^( ঢ ) )এসই( ছ^( মি ) )= মিএন---√
মিইপি^ঘa t a( ছ^( এম ) ) = ইপি^ঘa t a( ∂)জে( θ )∂θ)
মি
- মিনিব্যাচ কেন আরও ভাল কাজ করতে পারে ।
প্রথমত, ছোট ব্যাচের আকারের সাথে সংখ্যার হ্রাস হ্রাসের কারণে মিনিব্যাচ প্রযুক্তিগতভাবে অযোগ্য থেকে কিছু শিক্ষার সমস্যাগুলি সমাধান করতে সক্ষম করে।
দ্বিতীয়ত, হ্রাস ব্যাচের আকারের অগত্যা হ্রাস গ্রেডিয়েন্ট যথার্থতা বোঝায় না। প্রশিক্ষণের নমুনাগুলিতে অনেকেরই প্রচুর শোরগোল, বহিরাগত বা বায়াস রয়েছে। একটি এলোমেলোভাবে নমুনাযুক্ত মিনিবাচ আসল ডেটা তৈরির বিতরণকে মূল পূর্ণ ব্যাচের চেয়ে ভাল (বা আরও খারাপ নয়) প্রতিফলিত করতে পারে। যদি মিনিব্যাচ গ্রেডিয়েন্ট আপডেটগুলির কিছু পুনরাবৃত্তি আপনাকে আরও ভাল অনুমান দেয় তবে সামগ্রিকভাবে একটি যুগের গড় ফলাফল পূর্ণ ব্যাচ থেকে গ্রেডিয়েন্টের চেয়ে ভাল হতে পারে।
তৃতীয়ত, মিনিব্যাচ কেবল অপ্রীতিকর ডেটা নমুনাগুলি মোকাবেলা করতে সহায়তা করে না, পাশাপাশি অনেক স্থানীয় মিনিমা রয়েছে এমন অপ্রীতিকর ব্যয় ক্রিয়াকলাপেও সহায়তা করে। জেসন_এল_বেন্স যেমন উল্লেখ করেছেন, কখনও কখনও ত্রুটিটি বহুগুণে নিয়মিত গ্রেডিয়েন্টকে স্থানীয় মিনিমাতে আটকাতে সহজ হতে পারে, তবে মিনিব্যাচের সাথে গণনা করা অস্থায়ীভাবে এলোমেলো গ্রেডিয়েন্টকে ফাঁদে ফেলতে আরও বেশি অসুবিধা হয়।
অবশেষে, গ্রেডিয়েন্ট বংশোদ্ভূত সাথে, আপনি এক ধাপে বিশ্ব মিনিমে পৌঁছে যাচ্ছেন না, তবে বহুগুণে পুনরাবৃত্তি করছেন। গ্রেডিয়েন্ট মূলত আপনাকে পুনরাবৃত্তি করার দিকনির্দেশ দেয়। মিনিব্যাচ সহ, আপনি আরও দ্রুত পুনরাবৃত্তি করতে পারেন। অনেক ক্ষেত্রে, আরও পুনরাবৃত্তি, আপনি আরও ভাল পয়েন্টে পৌঁছাতে পারবেন। আপনি বিশ্বব্যাপী বা স্থানীয়ভাবে পয়েন্টটি সর্বোত্তম সর্বোত্তম আবহাওয়াতে সত্যই যত্ন নেন না। আপনি কেবল একটি যুক্তিসঙ্গত মডেলটিতে পৌঁছাতে চান যা আপনাকে গ্রহণযোগ্য সাধারণীকরণের ত্রুটি করে। মিনিব্যাচ এটি আরও সহজ করে তোলে।
আপনি ইয়ান গুডফেলো, "এট আল" র "ডিপ লার্নিং" বইটি পেতে পারেন, যদি আপনি এটিকে মনোযোগ সহকারে পড়েন তবে এই বিষয়ে বেশ ভাল আলোচনা হয়েছে।