এলএসটিএম, বিএলএসটিএম কী এবং সেগুলি কখন ব্যবহার করবেন?


11

আমি ডিপ লার্নিংয়ে খুব নতুন এবং আমি বিশেষত এলএসটিএম এবং বিএলএসটিএম কী কী এবং সেগুলি কখন ব্যবহার করতে হবে তা জানতে আগ্রহী। আরএনএন এর চেয়ে এলএসটিএম এবং বিলসটিএম কেন বেশি জনপ্রিয়?

আমরা কি এই গভীর শিক্ষার আর্কিটেকচারকে অচলিত সমস্যাগুলিতে ব্যবহার করতে পারি?


2
বিএলএসটিএম অর্থ দ্বি-নির্দেশমূলক এলএসটিএম, যার অর্থ সংকেত পিছনের পাশাপাশি সময়ের সাথে এগিয়েও প্রচার করে। আপনি অন্যান্য আরএনএনগুলিতেও এই স্থাপত্যটি প্রয়োগ করতে পারেন। বিস্তারিত জানার জন্য অনুগ্রহ করে পড়ুন en.wikipedia.org/wiki/Bidirectional_recurrent_neural_networks এবং colah.github.io/posts/2015-08-Understanding-LSTMs সাইটে আপনাকে স্বাগতম!
এমরে

এখানে একটি পোস্ট , আরএনএন এবং এলএসটিএমের মধ্যে পার্থক্য রয়েছে এবং এখানে এলএসটিএম এবং দ্বিদ্বন্দ্বী-এলটিএসএম-এর মধ্যে পার্থক্য প্রদর্শনের জন্য একটি ব্লগ রয়েছে
বেনিয়ামিন জাফারি

উত্তর:


7

RNNআর্কিটেকচারগুলি এমন LSTMএবং BiLSTMএমন সময়ে ব্যবহৃত হয় যেখানে শেখার সমস্যাটি অনুক্রমিক, যেমন আপনার একটি ভিডিও রয়েছে এবং আপনি কী জানতে চান যে কোনও এজেন্ট আপনার জন্য নথির একটি লাইন পড়তে চান যা পাঠ্যের চিত্র এবং এটি পাঠ্য বিন্যাসে নয়। আমি আপনাকে এখানে একবার তাকান অত্যন্ত উত্সাহ ।

LSTMsএবং তাদের দ্বি-নির্দেশমূলক রূপগুলি জনপ্রিয় কারণ তারা কীভাবে এবং কখন ভুলে যেতে হবে এবং কখন তাদের স্থাপত্যে গেট ব্যবহার করবেন না তা শিখার চেষ্টা করেছেন। পূর্ববর্তী RNNস্থাপত্যগুলিতে, গ্রেডিয়েন্টগুলি উধাও হওয়াই একটি বড় সমস্যা ছিল এবং সেই জালগুলি এত কিছু না শিখায়।

দ্বি নির্দেশমূলক ব্যবহার করে LSTMsআপনি শেখার অ্যালগরিদমকে একবার থেকে শুরু থেকে শেষ এবং একবার থেকে শুরু পর্যন্ত একবারে মূল ডেটা দিয়ে খাওয়ান। এখানে বিতর্ক রয়েছে তবে এটি কার্যত নির্ভর করে যদিও এটি এক দিকনির্দেশক পদ্ধতির চেয়ে দ্রুত শিখতে পারে।

হ্যাঁ, আপনি এগুলি আপনার কাজের উপর নির্ভর করে আনসারভিজড লার্নিংয়ে ব্যবহার করতে পারেন। কটাক্ষপাত করা এখানে এবং এখানে


1
চমত্কার উত্তরের জন্য অনেক ধন্যবাদ। আমরা কী এনএলপিতে কীওয়ার্ড আহরণের জন্য lstm ব্যবহার করতে পারি?
ভোলকা

আসলে এগুলি সম্পর্কে প্রচুর কাগজপত্র রয়েছে, যেমন আপনি এখানে এবং এখানে দেখতে পারেন ।
মিডিয়া

অনেক ধন্যবাদ. আমি কেবল ভাবছি যে আমরা ব্যবহার করতে পারি এমন অফ-দ্য-শেল্ফ কীওয়ার্ড নিষ্কাশন গভীর শেখার পদ্ধতির কী আছে?
ভোলকা

আসলে আমি দেখিনি, সম্ভবত এটি জিজ্ঞাসা করা আরও ভাল :)
মিডিয়া

4

মানুষ প্রতি সেকেন্ডে স্ক্র্যাচ থেকে তাদের চিন্তাভাবনা শুরু করে না। আপনি এই প্রবন্ধটি পড়ার সাথে সাথে প্রতিটি শব্দটি আপনার আগের শব্দগুলির বোঝার উপর ভিত্তি করে বুঝতে পারবেন understand আপনি সবকিছু ফেলে দেবেন না এবং আবার স্ক্র্যাচ থেকে চিন্তা শুরু করুন। আপনার চিন্তা জেদী আছে।

Ditionতিহ্যবাহী নিউরাল নেটওয়ার্কগুলি এটি করতে পারে না এবং এটি একটি বড় ঘাটতির মতো বলে মনে হচ্ছে seems উদাহরণস্বরূপ, কল্পনা করুন যে আপনি সিনেমার প্রতিটি পয়েন্টে কী ধরণের ঘটনা ঘটছে তা শ্রেণিবদ্ধ করতে চান। এটি স্পষ্ট নয় যে কোনও traditionalতিহ্যবাহী নিউরাল নেটওয়ার্ক কীভাবে ছবিটির পূর্ববর্তী ঘটনাগুলি সম্পর্কে তার যুক্তিগুলি পরবর্তী কোনও ঘটনাগুলি জানাতে পারে।

পুনরাবৃত্ত নিউরাল নেটওয়ার্কগুলি এই সমস্যাটি দেখায়। এগুলি এগুলির মধ্যে লুপযুক্ত নেটওয়ার্ক, যাতে তথ্য অবিচল থাকে।

আরও পড়ার জন্য কোহেনের ব্লগে যান


2

LSTM তুলনায়, BLSTMবা BiLSTMদুটি নেটওয়ার্কের এক অ্যাক্সেস আছে pastতথ্য forwardদিক এবং অন্য এক্সেস futureমধ্যে reverseদিক। WIKI

Bidirectionalঅফিসিয়াল ডক অনুযায়ী এখানে একটি নতুন ক্লাস যুক্ত হয়েছে :

model = Sequential()
model.add(Bidirectional(LSTM(num_channels, 
        implementation = 2, recurrent_activation = 'sigmoid'),
        input_shape=(input_length, input_dim)))

আইএমডিবি ডেটা ব্যবহারের সম্পূর্ণ উদাহরণটি এরকম হবে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.