এম্বেডিং স্তরটি কেরাস এম্বেডিং স্তরটিতে কীভাবে প্রশিক্ষিত হয়

14

কেরাস এম্বেডিং স্তরটিতে এম্বেডিং স্তরটি কীভাবে প্রশিক্ষিত হয়? (টেনসরফ্লো ব্যাকএন্ড ব্যবহার করে বলুন, এর অর্থ এটি ওয়ার্ড টুভেক, গ্লোভ বা ফাস্টটেক্সটের সমান)

ধরে নিন আমরা একটি পূর্বনির্ধারিত এম্বেডিং ব্যবহার করি না।

deep-learning keras word-embeddings

— william007
সূত্র

colah.github.io/posts/2014-07-NLP-RNN-- প্রেরণ -> এই ব্লগ পোস্টটি কেরাস এম্বেডিং স্তরটিতে এম্বেডিং স্তরটি কীভাবে প্রশিক্ষিত হয় সে সম্পর্কে স্পষ্টভাবে ব্যাখ্যা করেছে । আশাকরি এটা সাহায্য করবে.

— অক্ষয় উ প্রভু

24

কেরাসে এম্বেডিং স্তরগুলি আপনার নেটওয়ার্ক আর্কিটেকচারের অন্যান্য স্তরের মতোই প্রশিক্ষিত হয়: নির্বাচিত অপ্টিমাইজেশন পদ্ধতিটি ব্যবহার করে ক্ষতির ফাংশন হ্রাস করতে এগুলি সুর করা হয়। অন্যান্য স্তরগুলির সাথে প্রধান পার্থক্য হ'ল তাদের আউটপুটটি ইনপুটটির গাণিতিক ফাংশন নয়। পরিবর্তে স্তরটিতে ইনপুট এম্বেডিং ভেক্টরগুলির সাথে একটি টেবিল সূচীকরণ করতে ব্যবহৃত হয় [1]। যাইহোক, অন্তর্নিহিত স্বয়ংক্রিয় পার্থক্য ইঞ্জিনের ক্ষতির ক্রিয়াকে হ্রাস করতে এই ভেক্টরগুলিকে অনুকূল করতে সমস্যা নেই ...

সুতরাং, আপনি বলতে পারবেন না যে কেরাসের এম্বেডিং স্তরটি ওয়ার্ড 2vec [2] এর মতোই করছে। মনে রাখবেন যে ওয়ার্ড টুভেক একটি খুব নির্দিষ্ট নেটওয়ার্ক সেটআপকে বোঝায় যা শব্দের শব্দার্থক শব্দকে ধারণ করে এমন একটি এম্বেডিং শেখার চেষ্টা করে। কেরাসের এম্বেডিং স্তরটির সাহায্যে আপনি ক্ষতির ফাংশনটি হ্রাস করার চেষ্টা করছেন, সুতরাং উদাহরণস্বরূপ যদি আপনি কোনও সংবেদনশীল শ্রেণিবিন্যাসের সমস্যা নিয়ে কাজ করছেন, তবে শিখে নেওয়া এম্বেডিং সম্ভবত সম্পূর্ণ শব্দার্থবিজ্ঞানগুলি ক্যাপচার করবে না তবে কেবল তাদের সংবেদনশীল মেরুদণ্ডের ...

উদাহরণস্বরূপ, [3] থেকে তোলা নীচের চিত্রটিতে ক্লিকবাইট শিরোনাম (বাম) এবং প্রাক প্রশিক্ষিত ওয়ার্ড 2vec এম্বেডিংস (ডান) সনাক্তকরণের জন্য নকশাকৃত নেটওয়ার্কের অংশ হিসাবে স্ক্র্যাচ থেকে প্রশিক্ষিত একটি কেরাস এম্বেডিং স্তর সহ তিনটি বাক্য এম্বেডিং দেখানো হয়েছে । যেমন আপনি দেখতে পাচ্ছেন, ওয়ার্ড টুভেক এম্বেডিংগুলি বাক্যাংশ খ) এবং গ এর মধ্যে অর্থপূর্ণ মিলকে প্রতিফলিত করে। বিপরীতভাবে, কেরাসের এম্বেডিং স্তর দ্বারা উত্পন্ন এম্বেডিংগুলি শ্রেণিবিন্যাসের জন্য দরকারী হতে পারে তবে খ) এবং গ) এর শব্দার্থগত মিল খুঁজে পাওয়া যায় না।

এটি ব্যাখ্যা করে কেন আপনার যখন প্রশিক্ষণের নমুনার সীমিত পরিমাণ থাকে, আপনার এম্বেডিং স্তরটি ওয়ার্ড 2 ওয়েভ ওজনের সাহায্যে সূচনা করা ভাল ধারণা হতে পারে , তাই আপনার মডেল স্বীকৃতি দেয় যে "আল্পস" এবং "হিমালয়" একই রকম জিনিস, এমনকি তারা ডন না করলেও উভয়ই আপনার প্রশিক্ষণ ডেটাসেটের বাক্যে ঘটে।

[1] কেরাস 'এম্বেডিং' স্তর কীভাবে কাজ করে?

[2] https://www.tensorflow.org/tutorials/word2vec

[3] https://link.springer.com/article/10.1007/s10489-017-1109-7

দ্রষ্টব্য: প্রকৃতপক্ষে, চিত্রটি এম্বেডিং স্তরটির পরে স্তরটির সক্রিয়করণগুলি দেখায়, তবে এই উদাহরণের জন্য এটি কোনও বিষয় নয় ... আরও বিশদটি দেখুন [3]

— ড্যানিয়েল ল্যাপেজ
সূত্র

2

ঠিক এই ব্যাখ্যাটি আমি খুঁজছিলাম! আমি মনে করি এই বাক্যটি সাহসের সাথে হওয়া উচিত: "মনে রাখবেন যে ওয়ার্ড টুভেক একটি খুব নির্দিষ্ট নেটওয়ার্ক সেটআপকে বোঝায় যা শব্দের শব্দার্থকে কমন করে এমন একটি এম্বেডিং শেখার চেষ্টা করে।"

— কেভিন

0

এম্বেডিং স্তরটি একটি অবিচ্ছিন্ন এবং ঘন সুপ্ত স্থানে বিচ্ছিন্ন এবং বিচ্ছিন্ন 1-গরম-ভেক্টর থেকে কেবল একটি প্রক্ষেপণ। এটি (এন, মি) এর একটি ম্যাট্রিক্স যেখানে এন হল আপনার শব্দভান্ডার আকার এবং এন হ'ল আপনার পছন্দসই সুপ্ত স্থানের মাত্রা। কেবল অনুশীলনে, ম্যাট্রিক্সের গুণটি করার দরকার নেই এবং পরিবর্তে আপনি সূচকটি ব্যবহার করে গনণে সঞ্চয় করতে পারেন। সুতরাং অনুশীলনে, এটি একটি স্তর যা ধনাত্মক পূর্ণসংখ্যার মানচিত্র (শব্দের সাথে সম্পর্কিত সূচকগুলি) স্থির আকারের ঘন ভেক্টরগুলিতে (এম্বেডিং ভেক্টরগুলি) তৈরি করে।

আপনি এড়াতে-গ্রাম বা সিবিওউ ব্যবহার করে ওয়ার্ড 2 ভেক এমবেডিং তৈরি করতে এটি প্রশিক্ষণ দিতে পারেন। অথবা আপনি আপনার নির্দিষ্ট কাজের জন্য আপনার এম্বেডিং উপযুক্ত পেতে এটি আপনার নির্দিষ্ট সমস্যার উপর প্রশিক্ষণ দিতে পারেন। আপনি প্রাক-প্রশিক্ষিত এম্বেডিংগুলি (যেমন ওয়ার্ড টুভেক, গ্লোভ ইত্যাদি) লোড করতে পারেন এবং তারপরে আপনার নির্দিষ্ট সমস্যা (স্থানান্তর শেখার একধরণের) সম্পর্কে প্রশিক্ষণ চালিয়ে যেতে পারেন।

— ডেভিড রেফেলি
সূত্র