প্রতিক্রিয়া আরএনএন এবং এলএসটিএম / জিআরইউয়ের মধ্যে পার্থক্য


20

সময় সিরিজের ডেটাতে প্রয়োগ করার জন্য আমি বিভিন্ন পুনরাবৃত্ত নিউরাল নেটওয়ার্ক (আরএনএন) আর্কিটেকচারগুলি বোঝার চেষ্টা করছি এবং আরএনএন বর্ণনা করার সময় ঘন ঘন ব্যবহৃত হওয়া বিভিন্ন নামের সাথে আমি কিছুটা বিভ্রান্ত হয়ে পড়ছি। দীর্ঘ স্বল্পমেয়াদী মেমরি (এলএসটিএম) এবং গেটেড পুনরাবৃত্ত ইউনিট (জিআরইউ) এর কাঠামোটি কি মূলত একটি প্রতিক্রিয়া লুপ সহ একটি আরএনএন?


2
দয়া করে আপনার সংক্ষিপ্ত শব্দটি বানান।
গুং - মনিকা পুনরায়

উত্তর:


34

সমস্ত আরএনএনগুলির পুনরাবৃত্ত স্তরগুলিতে প্রতিক্রিয়া লুপ রয়েছে। এটি তাদের সময়ের সাথে সাথে 'মেমরি'তে তথ্য বজায় রাখতে দেয়। তবে, দীর্ঘমেয়াদী অস্থায়ী নির্ভরতা শিখতে সমস্যাগুলির সমাধানের জন্য স্ট্যান্ডার্ড আরএনএন প্রশিক্ষণ দেওয়া কঠিন হতে পারে। এর কারণ হ'ল ক্ষতির ফাংশনের গ্রেডিয়েন্ট সময়ের সাথে দ্রুত ক্ষয় হয় (বলা যায় বিলুপ্ত গ্রেডিয়েন্ট সমস্যা)। এলএসটিএম নেটওয়ার্কগুলি এক প্রকার আরএনএন যা মানক ইউনিট ছাড়াও বিশেষ ইউনিট ব্যবহার করে। এলএসটিএম ইউনিটগুলিতে একটি 'মেমরি সেল' অন্তর্ভুক্ত থাকে যা দীর্ঘ সময়ের জন্য স্মৃতিতে তথ্য বজায় রাখতে পারে। তথ্য যখন মেমরিতে প্রবেশ করে, কখন এটি আউটপুট দেয় এবং কখন ভুলে যায় তা নিয়ন্ত্রণের জন্য গেটের একটি সেট ব্যবহার করা হয়। এই স্থাপত্য তাদের দীর্ঘমেয়াদী নির্ভরতা শিখতে দেয়। জিআরইউগুলি এলএসটিএম এর মতো, তবে একটি সরল কাঠামো ব্যবহার করে।

এই কাগজটি একটি ভাল ওভারভিউ দেয়:

চুং এট আল। (2014) । সিকোয়েন্স মডেলিংয়ে গেটেড পুনরাবৃত্ত নিউরাল নেটওয়ার্কগুলির অভিজ্ঞতাগত মূল্যায়ন।


5

স্ট্যান্ডার্ড আরএনএন (পুনরাবৃত্ত নিউরাল নেটওয়ার্কগুলি) বিলুপ্ত হওয়া এবং বিস্ফোরিত গ্রেডিয়েন্ট সমস্যায় ভুগছে। এলএসটিএম (লং শর্ট টার্ম মেমোরি) নতুন গেটগুলি যেমন ইনপুট এবং ভুলে যাওয়া গেটগুলি প্রবর্তন করে এই সমস্যাগুলির সাথে মোকাবিলা করে, যা গ্রেডিয়েন্ট প্রবাহকে আরও ভাল নিয়ন্ত্রণের সুযোগ দেয় এবং "দীর্ঘ-পরিসরের নির্ভরতা" এর আরও ভাল সংরক্ষণ সক্ষম করে।


2

এলএসটিএমগুলি প্রায়শই অভিনব আরএনএন হিসাবে পরিচিত। ভ্যানিলা আরএনএনগুলির সেল স্টেট নেই। তাদের কেবল লুকানো রাজ্য রয়েছে এবং সেই লুকানো রাজ্যগুলি আরএনএনগুলির জন্য স্মৃতি হিসাবে কাজ করে।

এদিকে, এলএসটিএমের কোষের রাজ্য এবং একটি গোপন রাজ্য উভয়ই রয়েছে। সেল স্টেটে "গেটস" দ্বারা নিয়ন্ত্রিত কক্ষে তথ্য সরিয়ে বা সংযুক্ত করার ক্ষমতা রয়েছে। এবং তাত্ত্বিকভাবে এই "সেল" এর কারণে, LSTM দীর্ঘমেয়াদী নির্ভরতা পরিচালনা করতে সক্ষম হওয়া উচিত (বাস্তবে এটি করা খুব কঠিন difficult)


-1

টি এল; ডিআর

আমরা এটি বলতে পারি, যখন আমরা আরএনএন থেকে এলএসটিএম (লং শর্ট টার্ম মেমরি) এ চলে যাই, আমরা প্রশিক্ষণযুক্ত ওজন অনুসারে ইনপুটগুলির প্রবাহ এবং মিশ্রণকে নিয়ন্ত্রণ করে আরও বেশি নিয়ন্ত্রণকারী নোবস প্রবর্তন করছি। এবং এইভাবে, আউটপুটগুলি নিয়ন্ত্রণে আরও নমনীয়তা বয়ে আনে। সুতরাং, এলএসটিএম আমাদের সবচেয়ে নিয়ন্ত্রণ-ক্ষমতা দেয় এবং এইভাবে আরও ভাল ফলাফল। তবে আরও জটিলতা এবং অপারেটিং ব্যয় নিয়ে আসে।

উল্লেখ


[ দ্রষ্টব্য ]:

এলএসটিএম জিআরইউর একটি বর্ধিত সংস্করণ version


এই চিত্রটি তাদের মধ্যে পার্থক্য প্রদর্শন করে:

এখানে চিত্র বর্ণনা লিখুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.