অদৃশ্য গ্রেডিয়েন্টটি এক-মাত্রিক ক্ষেত্রে সর্বোত্তমভাবে ব্যাখ্যা করা হয়েছে। বহুমাত্রিক আরও জটিল তবে মূলত সাদৃশ্যপূর্ণ। আপনি এই দুর্দান্ত কাগজে এটি পর্যালোচনা করতে পারেন [1]।
ধরে আমরা একটি গোপন রাষ্ট্র আছে সময় পদে পদে । আমরা যদি জিনিসগুলিকে সহজ করে এবং পক্ষপাত এবং ইনপুটগুলি সরিয়ে
তারপরে আপনি এটি প্রদর্শন করতে পারেন ন জ ন = σ ( W জ ন - 1 ) ।জটিটি
জটি= σ( ডাব্লু এইচ)t - 1) ।
∂জটি'∂জটি= ∏কে = 1টি'- টিডাব্লু σ'( ডাব্লু এইচ)টি'- কে)= ডাব্লুটি'- টি! ! !Πকে = 1টি'- টিσ'( ডাব্লু এইচ)টি'- কে)
সাথে চিহ্নিত ফ্যাক্টর !!! অত্যন্ত গুরুত্বপূর্ণ।
ওজন 1 এর সমান না থাকে, এটা হয় শুন্যতে ব্যাখ্যা মূলকভাবে দ্রুত ক্ষয়ে যাবে, , বা ব্যাখ্যা মূলকভাবে ফাস্ট হত্তয়াটি'- টি ।
LSTM- এ আপনার সেল স্টেট । ব্যুৎপন্ন ফর্ম নেই
এখানে হ'ল ভুলে যাওয়া গেটের ইনপুট। আপনি দেখতে পাচ্ছেন, এতে কোনও দ্রুত ক্ষয়কারী ফ্যাক্টর জড়িত নেই। ফলস্বরূপ, কমপক্ষে একটি পথ রয়েছে যেখানে গ্রেডিয়েন্টটি বিলুপ্ত হয় না। সম্পূর্ণ বিকাশের জন্য, দেখুন [২]।গুলিটিভিটি
∂গুলিটি'∂গুলিটি= ∏কে = 1টি'- টিσ( vটি + কে) ।
বনামটি
[1] পাসকানু, রাজভান, টমাস মিকোলভ এবং যোশুয়া বেনজিও। "পুনরাবৃত্ত নিউরাল নেটওয়ার্ক প্রশিক্ষণের অসুবিধা সম্পর্কে"। আইসিএমএল (3) 28 (2013): 1310-1318।
[২] বায়ার, জাস্টিন সাইমন। সিকোয়েন্স প্রতিনিধিত্ব শেখা। Diss,। মেনচেন, টেকনিশে ইউনিভার্সিটি মেনচেন, ডিস, 2015, 2015।