সম্পূর্ণ GRU ইউনিট
c~t=tanh(Wc[Gr∗ct−1,xt]+bc)
Gu=σ(Wu[ct−1,xt]+bu)
Gr=σ(Wr[ct−1,xt]+br)
ct=Gu∗c~t+(1−Gu)∗ct−1
at=ct
এলএসটিএম ইউনিট
c~t=tanh(Wc[at−1,xt]+bc)
Gu=σ(Wu[at−1,xt]+bu)
Gf=σ(Wf[at−1,xt]+bf)
Go=σ(Wo[at−1,xt]+bo)
ct=Gu∗c~t+Gf∗ct−1
at=Go∗tanh(ct)
সমীকরণগুলি থেকে দেখা যাবে এলএসটিএমগুলির একটি পৃথক আপডেট গেট রয়েছে এবং ভুলে যাওয়ার গেট রয়েছে। এটি পরিষ্কারভাবে এলএসটিএমকে আরও পরিশীলিত করে তবে একই সাথে আরও জটিল করে তোলে। আপনার নির্দিষ্ট ব্যবহারের ক্ষেত্রে কোনটি ব্যবহার করবেন তা সিদ্ধান্ত নেওয়ার সহজ উপায় নেই। পারফরম্যান্স পরীক্ষা করতে আপনার সর্বদা ট্রায়াল এবং ত্রুটি করতে হয়। তবে, জিআরইউ এলএসটিএম এর চেয়ে সহজ, প্রশিক্ষণে জিআরইউগুলি খুব কম সময় নেবে এবং আরও দক্ষ।
ক্রেডিট: অ্যান্ড্রু এনজি