(মিনি) ব্যাচের গ্রেডিয়েন্ট শালীনের যোগফল বা গড়ের গড়?

আমি যখন মিনি ব্যাচের গ্রেডিয়েন্ট শালীন প্রয়োগ করেছি, তখন আমি প্রশিক্ষণ ব্যাচের সমস্ত উদাহরণের গ্রেডিয়েন্টগুলি গড়েছি। তবে, আমি লক্ষ্য করেছি যে অনলাইন গ্রেডিয়েন্ট শালীনের তুলনায় এখন অনুকূল শিক্ষার হার অনেক বেশি। আমার অন্তর্নিহিততা এটি কারণ হ'ল গড় গ্রেডিয়েন্টটি কম গোলমাল এবং এটি দ্রুত অনুসরণ করা যেতে পারে। সুতরাং সম্ভবত এটি কেবল একটি ব্যাচের গ্রেডিয়েন্টগুলি যোগ করে বোঝায়। মানগুলি যাইহোক ইতিবাচক এবং নেতিবাচক হতে পারে।

আমি জানি এটি কেবলমাত্র একটি ধ্রুবক ফ্যাক্টর যা শিক্ষার হারটি ব্যবহার করে ভারসাম্যপূর্ণ হতে পারে। তবে আমি অবাক হই যে বিজ্ঞানীরা কোন সংজ্ঞায় একমত হয়েছেন যাতে আমি নিউরাল নেটওয়ার্ক পেপারগুলি থেকে ফলাফলগুলি পুনরুত্পাদন করতে পারি।

কেউ কি সাধারণত ব্যাচের আকার দ্বারা একটি ব্যাচের যোগফল গ্রেডিয়েন্টকে বিভক্ত করে?

neural-networks gradient-descent backpropagation

— danijar
সূত্র

গড়।

উদাহরণস্বরূপ: অ্যালেক্স হোলহাউস দ্বারা সংকলিত কুরসেরায় অ্যান্ড্রু এনজির মেশিন লার্নিং কোর্সের নোটস ।

স্বতন্ত্র নমুনাগুলির কারণে গ্রেডিয়েন্টগুলির সংমিশ্রণ আপনি একটি খুব মসৃণ গ্রেডিয়েন্ট পাবেন। ওজন আপডেট করার ক্ষেত্রে বৃহত্তর ব্যাচটি মসৃণ ফলাফলের গ্রেডিয়েন্ট ব্যবহৃত হয়।

ব্যাচের আকার অনুসারে যোগফলকে ভাগ করে নেওয়া এবং গড় গ্রেডিয়েন্ট গ্রহণের প্রভাব রয়েছে:

ওজনের परिमाण অনুপাতের বাইরে বৃদ্ধি পায় না। ওজন আপডেটে এল 2 নিয়মিতকরণ যুক্ত করা বড় ওজনের মানগুলিকে দন্ড দেয় izes এটি প্রায়শই উন্নত সাধারণীকরণের কর্মক্ষমতা বাড়ে। গড় হিসাবে, বিশেষত যদি গ্রেডিয়েন্টগুলি একই দিকে নির্দেশ করে তবে ওজন খুব বেশি বাড়ানো থেকে বিরত রাখুন।
গ্রেডিয়েন্টের প্রস্থতা ব্যাচের আকার থেকে স্বতন্ত্র। এটি বিভিন্ন ব্যাচের আকার ব্যবহার করে অন্যান্য পরীক্ষাগুলির থেকে ওজনের তুলনা করতে দেয়।
শিক্ষার হারের সাথে ব্যাচের আকারের প্রভাব মোকাবিলা করা সংখ্যাগতভাবে সমতুল্য হতে পারে তবে আপনি সেই শিক্ষার হারের সাথে সমাপ্ত হন যা বাস্তবায়ন নির্দিষ্ট। আপনি যদি ব্যবহার করছেন এমন প্যারামিটারগুলির স্কেলগুলি লোকেরা যদি সম্পর্কিত না করে এবং আপনার পরীক্ষার পুনরুত্পাদন করতে তাদের সমস্যা হয় তবে এটি আপনার ফলাফলগুলি এবং পরীক্ষামূলক সেটআপ যোগাযোগ করতে অসুবিধা সৃষ্টি করে।

গড়পড়তা সুস্পষ্ট তুলনামূলক সক্ষম করে এবং গ্রেডিয়েন্ট আকারকে ব্যাচের আকার থেকে পৃথক রাখতে সক্ষম করে। একটি ব্যাচের আকার নির্বাচন করা আপনার মাঝে থাকা গণনাগত সংস্থান দ্বারা কখনও কখনও বাধা সৃষ্টি হয় এবং আপনি আপনার মডেলটি মূল্যায়ন করার সময় এর প্রভাবকে প্রশমিত করতে চান m

— ypx
সূত্র

লিঙ্কটি এখন মারা গেছে

— সিডিটারম্যান

আপডেট হওয়া লিঙ্ক, মূল স্লাইডগুলিতে আর লিঙ্ক করতে পারে না তাই অ্যালেক্স হোলহাউস দ্বারা সংকলিত নোটগুলির জন্য পছন্দ করা ।

— ypx

এই টিউটোরিয়ালটি গড়ের পরিবর্তে সামিটের

— এডি