আপনি যদি ডকুমেন্টেশনটি http://keras.io/optimizer/ দেখুন তবে ক্ষয়র জন্য এসজিডিতে একটি প্যারামিটার রয়েছে। আমি জানি এটি সময়ের সাথে শিক্ষার হার হ্রাস করে। তবে এটি ঠিক কীভাবে কাজ করে তা আমি বুঝতে পারি না। এটি কী এমন মূল্য যা শিক্ষার হার দ্বারা গুণিত হয় lr = lr * (1 - decay)
যেমন এটি তাত্পর্যপূর্ণ? এছাড়াও আমার মডেল কী শিখার হার ব্যবহার করছে তা আমি কীভাবে দেখতে পারি? আমি যখন model.optimizer.lr.get_value()
কয়েকটি যুগের উপরে ফিট রাখার পরে মুদ্রণ করি তখন এটি ক্ষয় স্থির করে নিলেও মূল শিক্ষার হার ফিরিয়ে দেয়।
এছাড়াও আমাকে নেস্টেরভ সেট করতে হবে = গতি ব্যবহারের জন্য সত্য বা আমি ব্যবহার করতে পারি এমন দুটি ভিন্ন ধরণের গতি আছে। উদাহরণস্বরূপ এটি করার একটি বিন্দু আছেsgd = SGD(lr = 0.1, decay = 1e-6, momentum = 0.9, nesterov = False)
self.iterations
পৃথক এসজিডি পদক্ষেপের সংখ্যা বোঝায়, পর্বের সংখ্যা নয়, র্যাগ?