দুর্দান্ত প্রশ্ন!
tl; dr: সেল স্টেট এবং লুকানো অবস্থা দুটি আলাদা জিনিস, তবে লুকানো অবস্থা কোষের রাজ্যের উপর নির্ভরশীল এবং তাদের প্রকৃত আকার একই রকম হয়।
দীর্ঘ ব্যাখ্যা
নীচের চিত্রটি (একই ব্লগের অংশ) থেকে দুজনের মধ্যে পার্থক্যটি দেখা যায়:
সেল স্টেটটি এমন সাহসী রেখা যা পশ্চিম থেকে পূর্ব পর্যন্ত শীর্ষে ভ্রমণ করে। পুরো সবুজ ব্লককে বলা হয় 'সেল'।
পূর্ববর্তী সময় পদক্ষেপের লুকানো অবস্থা বর্তমান সময়ের ধাপে ইনপুটটির অংশ হিসাবে বিবেচিত হবে।
তবে পুরো ওয়াকথ্রু না করে দুজনের মধ্যে নির্ভরতা দেখা একটু কঠিন। আমি এটি এখানে করব, অন্য দৃষ্টিকোণ সরবরাহ করার জন্য, তবে ব্লগ দ্বারা ভারী প্রভাবিত। আমার স্বীকৃতি একই হবে, এবং আমি আমার ব্যাখ্যায় ব্লগের চিত্রগুলি ব্যবহার করব।
আমি ব্লগে যেভাবে তাদের উপস্থাপন করা হয়েছিল তার থেকে কিছুটা আলাদাভাবে অপারেশনগুলির ক্রম সম্পর্কে ভাবতে চাই। ব্যক্তিগতভাবে, ইনপুট গেট থেকে শুরু করার মতো। আমি নীচের সেই দৃষ্টিকোণটি উপস্থাপন করব, তবে দয়া করে মনে রাখবেন যে ব্লগটি খুব সম্ভবত একটি এলএসটিএম কম্পিউটেশনাল সেট আপ করার সর্বোত্তম উপায় হতে পারে এবং এই ব্যাখ্যাটি নিখুঁত ধারণাগত।
যা হচ্ছে তা এখানে:
ইনপুট গেট
সময়ে ইনপুট হল এবং । এগুলি কনটেনেটেড হয়ে একটি ননলাইনার ফাংশনে খাওয়ানো হয় (এক্ষেত্রে সিগময়েড)। এই সিগময়েড ফাংশনটিকে 'ইনপুট গেট' বলা হয় কারণ এটি ইনপুটটির স্টপগ্যাপ হিসাবে কাজ করে। এটি বর্তমান স্তরের ইনপুটের ভিত্তিতে আমরা এই টাইমস্টেপে কোন মানগুলি আপডেট করতে যাচ্ছি তা স্থির করে সিদ্ধান্ত দেয় idesx t h t - 1টিএক্সটিজটি - 1
এটি হ'ল, (আপনার উদাহরণ অনুসরণ করে), যদি আমাদের কাছে একটি ইনপুট ভেক্টর এবং পূর্ববর্তী লুকানো অবস্থা তবে ইনপুট গেটটি নিম্নলিখিতটি করে:জ ন = [ 4 , 5 , 6 ]এক্সটি= [ ১ , ২ , ৩ ]জটি= [ 4 , 5 , 6 ]
ক) CONCATENATE এবং আমাদের দিতেএক্সটিজটি - 1[ 1 , 2 , 3 , 4 , 5 , 6 ]
খ) ভেক্টরকে কয়েক বার গণনা করুন এবং পক্ষপাতটি যুক্ত করুন (গণিতে: , যেখানে হ'ল ইনপুট ভেক্টর থেকে অরৈখিকতায় ওজন ম্যাট্রিক্স; ইনপুট পক্ষপাত)।ওয়াটআমিওয়াটআমি⋅ [ এক্সটি, এইচটি - 1] + খআমিওয়াটআমিখআমি
আসুন ধরে নেওয়া যাক আমরা একটি ছয়-মাত্রিক ইনপুট (সংক্ষিপ্ত ইনপুট ভেক্টরের দৈর্ঘ্য) থেকে কী আপডেট হবে তা নিয়ে ত্রি-মাত্রিক সিদ্ধান্তে যাচ্ছি। এর অর্থ আমাদের একটি 3x6 ওজন ম্যাট্রিক্স এবং একটি 3x1 বায়াস ভেক্টর প্রয়োজন। আসুন সেগুলি কিছু মান দিন:
ওয়াটআমি= ⎡⎣⎢123123123123123123⎤⎦⎥
খআমি= ⎡⎣⎢111⎤⎦⎥
গণনাটি হবে:
⎡⎣⎢123123123123123123⎤⎦⎥⋅ ⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢123456⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥+ + ⎡⎣⎢111⎤⎦⎥= ⎡⎣⎢224262⎤⎦⎥
গ) পূর্ববর্তী ফিড করুন:আমিটি= σ( ডাব্লুআমি⋅ [ এক্সটি, এইচটি - 1] + খআমি)
σ( এক্স ) = 11 + ই এক্স পি ( - এক্স ) (আমরা এই উপাদানটি ভেক্টরের এর মানগুলিতে প্রয়োগ করি )এক্স
σ( ⎡)⎣⎢224262⎤⎦⎥) = [ 11 + ই এক্স পি ( - 22 ), ঘ1 + ই এক্স পি ( - 42 ), ঘ1 + ই এক্স পি ( - 62 )] = [ 1 , 1 , 1 ]
ইংরাজীতে, এর অর্থ আমরা আমাদের সমস্ত রাজ্য আপডেট করতে যাচ্ছি।
ইনপুট গেটের দ্বিতীয় অংশ রয়েছে:
d)সিটি~= t a n h ( ডাব্লুসি[ এক্সটি, এইচটি - 1] + খসি)
এই অংশটির মূল বিষয় হল আমরা কীভাবে রাষ্ট্রটি আপডেট করব তা গণনা করা we এটি নতুন ইনপুট থেকে সেল স্টেটে পদক্ষেপের অবদান। গণনা উপরে বর্ণিত একই পদ্ধতি অনুসরণ করে তবে সিগময়েড ইউনিটের পরিবর্তে তানহ ইউনিট সহ।
আউটপুট সেই বাইনারি ভেক্টর দ্বারা গুণিত হয় , তবে আমরা যখন সেল আপডেটে পৌঁছে যাব তখন আমরা তা আবরণ করব। ইটিসিটি~আমিটি
একসাথে, আমাদের জানায় যে আমরা কোন আপডেটে আপডেট করতে চাই এবং আমাদের কীভাবে সেগুলি আপডেট করতে চাই তা জানায়। এটি আমাদের জানায় যে আমরা এখন পর্যন্ত আমাদের উপস্থাপনায় কী নতুন তথ্য যুক্ত করতে চাই।~ C tআমিটিসিটি~
তারপরে আসে ভুলে যাওয়া গেট, যা ছিল আপনার প্রশ্নের উত্স।
ভুলে গেট
ভুলে যাওয়া গেটের উদ্দেশ্য হ'ল আগের-শিখে থাকা তথ্যগুলি সরিয়ে ফেলা যা আর প্রাসঙ্গিক নয়। ব্লগে প্রদত্ত উদাহরণটি ভাষা-ভিত্তিক, তবে আমরা একটি স্লাইডিং উইন্ডোও ভাবতে পারি। আপনি যদি এমন একটি সময় সিরিজ মডেলিং করছেন যা প্রাকৃতিকভাবে ইন্টিজারগুলি দ্বারা উপস্থাপিত হয় যেমন কোনও রোগের প্রাদুর্ভাবের সময় কোনও অঞ্চলে সংক্রামক ব্যক্তির সংখ্যা গণ্য হয়, তবে সম্ভবত রোগটি কোনও অঞ্চলে মারা যাওয়ার পরে আপনি আর সেই অঞ্চলটিকে বিবেচনা করে বিরক্ত করতে চান না রোগটি কীভাবে পরের দিকে ভ্রমণ করবে সে সম্পর্কে চিন্তাভাবনা করছি।
ইনপুট স্তরের মতোই, ভুলে যাওয়া স্তরটি পূর্ববর্তী সময় পদক্ষেপ এবং বর্তমান সময়ের ধাপ থেকে নতুন ইনপুট থেকে লুকানো পরিস্থিতি গ্রহণ করে এবং তাদেরকে সম্মতি দেয়। মূল বিষয়টি হ'ল কী ভুলে যাওয়া উচিত এবং কোনটি মনে রাখা উচিত oc পূর্ববর্তী গণনায়, আমি সমস্ত 1 এর একটি সিগময়েড স্তর আউটপুট দেখিয়েছি, কিন্তু বাস্তবে এটি 0.999 এর কাছাকাছি ছিল এবং আমি বৃত্তাকারটি পেয়েছিলাম।
গণনাটি দেখতে অনেকটা দেখতে আমরা ইনপুট স্তরটিতে যা করেছি:
চটি= σ( ডাব্লুচ[ এক্সটি, এইচটি - 1] + খচ)
এটি আমাদের 0 এবং 1 এর মধ্যে মান সহ 3 মাপের ভেক্টর দেবে যা যাক এটি ভান করে:
[ 0.5 , 0.8 , 0.9 ]
তারপরে আমরা তথ্যের এই তিনটি অংশকে কোনটি ভুলে যাওয়া উচিত এই মানগুলির উপর ভিত্তি করে stochastically সিদ্ধান্ত নিই। এটি করার একটি উপায় হ'ল ইউনিফর্ম (0, 1) বিতরণ থেকে একটি সংখ্যা উত্পন্ন করা এবং যদি সেই সংখ্যাটি ইউনিটটির 'টার্নিং' এর সম্ভাবনার চেয়ে কম হয় (0.5, 0.8, এবং 0.9 ইউনিট 1, 2, এবং 3 যথাক্রমে), তারপরে আমরা সেই ইউনিটটি চালু করি। এই ক্ষেত্রে, এর অর্থ হ'ল আমরা সেই তথ্যটি ভুলে যাচ্ছি।
দ্রুত দ্রষ্টব্য: ইনপুট স্তর এবং ভুলে যাওয়া স্তরটি স্বাধীন। আমি যদি বাজি ধরার লোক হয়ে থাকি তবে আমি বাজি ধরতাম যে এটি সমান্তরালতার জন্য ভাল জায়গা।
কক্ষের অবস্থা আপডেট করা হচ্ছে
সেল স্টেট আপডেট করার জন্য আমাদের এখন যা দরকার তা আছে। আমরা ইনপুট এবং ভুলে যাওয়া গেটস থেকে তথ্যের সংমিশ্রণ গ্রহণ করি:
সিটি= চটি। সিটি - 1+ iটি। সিটি~
∘
পাশে: হাদামারড পণ্য
এক্স1= [ ১ , ২ , ৩ ]এক্স2= [ 3 , 2 , 1 ]
এক্স1। X2= [ ( 1 ⋅ 3 ) , ( 2 ⋅ 2 ) , ( 3 ⋅ 1 ) ] = [ 3 , 4 , 3 ]
একদিকে শেষ
এইভাবে, আমরা সেল স্টেট (ইনপুট) এ যা যুক্ত করতে চাই সেগুলি আমরা সেল স্টেট থেকে দূরে নিতে চাই তা দিয়ে (একত্রে) একত্রিত করি। ফলাফলটি নতুন সেল স্টেট।
আউটপুট গেট
এটি আমাদেরকে নতুন লুকানো অবস্থা দেবে। মূলত আউটপুট গেটের বিন্দুটি সিদ্ধান্ত নেওয়া হয় যে পরবর্তী সেল স্টেট আপডেট করার সময় আমরা মডেলটির পরবর্তী অংশটি অ্যাকাউন্টে নেওয়া উচিত। ব্লগের আবার উদাহরণ, ভাষা: বিশেষ্যটি বহুবচন হলে, পরবর্তী পদক্ষেপে ক্রিয়া সংযোগ পরিবর্তন হবে। একটি রোগের মডেলগুলিতে, যদি কোনও নির্দিষ্ট অঞ্চলের ব্যক্তির সংবেদনশীলতা অন্য অঞ্চলের তুলনায় আলাদা হয়, তবে সংক্রমণ অর্জনের সম্ভাবনা পরিবর্তন হতে পারে।
আউটপুট স্তরটি আবার একই ইনপুট নেয়, তবে তারপরে আপডেট হওয়া সেল অবস্থা বিবেচনা করে:
ণটি= σ( ডাব্লুণ[ এক্সটি, এইচটি - 1] + খণ)
আবার এটি আমাদের সম্ভাবনার একটি ভেক্টর দেয়। তারপরে আমরা গণনা:
জটি= ওটি∘ টি একটি এন এইচ ( সিটি)
সুতরাং বর্তমান সেল স্টেট এবং আউটপুট গেটটি অবশ্যই কী আউটপুট করবেন সে বিষয়ে একমত হতে হবে।
t a n h ( সিটি)[ 0 , 1 , 1 ]ণটি[ 0 , 0 , 1 ][ 0 , 0 , 1 ]
জটিYটি= σ( ডাব্লু⋅ এইচটি)
জটি
এলএসটিএমগুলিতে প্রচুর বৈকল্পিক রয়েছে তবে এটি আবশ্যকীয় বিষয়গুলি কভার করে!