আমি ফোনমে ক্লাসিফিকেশনে গ্র্যাভস ২০০৫ এর কাগজের মাধ্যমে সিকোয়েন্স লেবেলিংয়ের জন্য আরএনএনগুলির উচ্চ-স্তরের অ্যাপ্লিকেশনটি বোঝার চেষ্টা করছি ।
সমস্যার সংক্ষিপ্তসার হিসাবে: আমাদের কাছে একক বাক্যগুলির (ইনপুট) অডিও ফাইল এবং (আউটপুট) বিশেষজ্ঞের লেবেলযুক্ত শুরুর সময়, স্টপ টাইম এবং পৃথক ফোনমেসগুলির জন্য লেবেল (কিছু "বিশেষ" ফোনমাস যেমন নীরবতা, যেমন প্রতিটি অডিও ফাইলের প্রতিটি নমুনায় কিছু ফোনম চিহ্ন সহ লেবেলযুক্ত থাকে))
এই সমস্যার জন্য লুকানো স্তরে এলএসটিএম মেমরি কোষগুলির সাথে একটি আরএনএন প্রয়োগ করা কাগজের জোর। (তিনি তুলনামূলকভাবে বেশ কয়েকটি রূপ এবং অন্যান্য বেশ কয়েকটি কৌশল প্রয়োগ করেন things বিষয়গুলি সহজ রাখতে আমি কেবলমাত্র একমুখী LSTM এ আগ্রহী সেই মুহুর্তের জন্য))
আমি বিশ্বাস করি যে আমি নেটওয়ার্কটির আর্কিটেকচারটি বুঝতে পেরেছি: অডিও ফাইলগুলির 10 এমএস উইন্ডোর সাথে সম্পর্কিত একটি ইনপুট স্তর, অডিও কাজের মানকে প্রাক প্রসেস করা; এলএসটিএম সেলগুলির একটি গোপন স্তর এবং সমস্ত সম্ভব 61 ফোন চিহ্নের এক-গরম কোডিং সহ একটি আউটপুট স্তর।
আমি বিশ্বাস করি যে আমি এলএসটিএম ইউনিটগুলির মাধ্যমে ফরোয়ার্ড পাস এবং পিছনের পাসের (জটিল তবে সরল) সমীকরণগুলি বুঝতে পারি। এগুলি কেবল ক্যালকুলাস এবং চেইন রুল।
আমি যা বুঝতে পারি না, এই কাগজটি এবং বেশ কয়েকটি অনুরূপগুলি বেশ কয়েকবার পড়ার পরে, ঠিক কখন ব্যাকপ্রোপেজেশন অ্যালগরিদম প্রয়োগ করতে হয় এবং ঠিক কখন নিউরনে বিভিন্ন ওজন আপডেট করা যায়।
দুটি করণীয় পদ্ধতি বিদ্যমান:
1) ফ্রেম অনুযায়ী ব্যাকপ্রপ এবং আপডেট
Load a sentence.
Divide into frames/timesteps.
For each frame:
- Apply forward step
- Determine error function
- Apply backpropagation to this frame's error
- Update weights accordingly
At end of sentence, reset memory
load another sentence and continue.
বা,
2) বাক্য অনুসারে ব্যাকপ্রপ এবং আপডেট:
Load a sentence.
Divide into frames/timesteps.
For each frame:
- Apply forward step
- Determine error function
At end of sentence:
- Apply backprop to average of sentence error function
- Update weights accordingly
- Reset memory
Load another sentence and continue.
মনে রাখবেন যে এটি আরএনএন প্রশিক্ষণ সম্পর্কে একটি সাধারণ প্রশ্ন যা গ্র্যাভ পেপারকে পয়েন্ট (এবং ব্যক্তিগতভাবে প্রাসঙ্গিক) উদাহরণ হিসাবে ব্যবহার করে: যখন আরএনএনগুলি সিকোয়েন্সগুলিতে প্রশিক্ষণ দেওয়া হয়, তখন প্রতিটি টাইমস্টেপে ব্যাকপ্রপ প্রয়োগ করা হয়? ওজন কি প্রতিটি টাইমপেশে সমন্বয় করা হয়? বা, কঠোরভাবে ফিড-ফরোয়ার্ড আর্কিটেকচারের উপর ব্যাচ প্রশিক্ষণের একটি আলগা উপমা অনুসারে, ব্যাকপ্রপ এবং ওজন আপডেটগুলি প্রয়োগ করার আগে ত্রুটিগুলি নির্দিষ্ট ক্রমগুলির চেয়ে বেশি জমে এবং গড় হয়?
নাকি আমি তার থেকেও বেশি বিভ্রান্ত?