আমি যখন মিনি ব্যাচের গ্রেডিয়েন্ট শালীন প্রয়োগ করেছি, তখন আমি প্রশিক্ষণ ব্যাচের সমস্ত উদাহরণের গ্রেডিয়েন্টগুলি গড়েছি। তবে, আমি লক্ষ্য করেছি যে অনলাইন গ্রেডিয়েন্ট শালীনের তুলনায় এখন অনুকূল শিক্ষার হার অনেক বেশি। আমার অন্তর্নিহিততা এটি কারণ হ'ল গড় গ্রেডিয়েন্টটি কম গোলমাল এবং এটি দ্রুত অনুসরণ করা যেতে পারে। সুতরাং সম্ভবত এটি কেবল একটি ব্যাচের গ্রেডিয়েন্টগুলি যোগ করে বোঝায়। মানগুলি যাইহোক ইতিবাচক এবং নেতিবাচক হতে পারে।
আমি জানি এটি কেবলমাত্র একটি ধ্রুবক ফ্যাক্টর যা শিক্ষার হারটি ব্যবহার করে ভারসাম্যপূর্ণ হতে পারে। তবে আমি অবাক হই যে বিজ্ঞানীরা কোন সংজ্ঞায় একমত হয়েছেন যাতে আমি নিউরাল নেটওয়ার্ক পেপারগুলি থেকে ফলাফলগুলি পুনরুত্পাদন করতে পারি।
কেউ কি সাধারণত ব্যাচের আকার দ্বারা একটি ব্যাচের যোগফল গ্রেডিয়েন্টকে বিভক্ত করে?