নামযুক্ত সত্তার স্বীকৃতি পাওয়ার জন্য ওয়ার্ড 2Vec


25

আমি একটি নামকৃত সত্তার স্বীকৃতি সিস্টেম তৈরি করতে গুগলের ওয়ার্ড 2vec প্রয়োগ ব্যবহার করতে চাইছি। আমি শুনেছি কাঠামোর মাধ্যমে পিছনে বর্ধনের সাথে পুনরাবৃত্ত হওয়া নিউরাল নেটগুলি নামধারী সত্তার স্বীকৃতি কার্যের জন্য উপযুক্ত, তবে আমি এই ধরণের মডেলের জন্য একটি শালীন বাস্তবায়ন বা একটি শালীন টিউটোরিয়াল খুঁজে পেতে সক্ষম হয়েছি। যেহেতু আমি একটি অ্যাটপিকাল কর্পাসের সাথে কাজ করছি, এনএলটিকে এবং এর অনুরূপ স্ট্যান্ডার্ড এনইআর সরঞ্জামগুলি খুব খারাপভাবে পারফর্ম করেছে এবং দেখে মনে হচ্ছে আমাকে নিজের সিস্টেমটি প্রশিক্ষণ দিতে হবে।

সংক্ষেপে, এই ধরণের সমস্যার জন্য কোন সংস্থানগুলি উপলব্ধ? মানক পুনরাবৃত্তাকার নিউরাল নেট বাস্তবায়ন উপলব্ধ?


আপনি কি আপনার কর্পাসে স্ট্যানফোর্ড এনইআর প্রশিক্ষণের চেষ্টা করেছেন? এখানে একটি টিউটোরিয়াল আছে
এমরে

আমার নেই - এটি কীভাবে ভাড়া নেয় তা দেখার জন্য এটি দেওয়া উচিত।
ম্যাডিসন মে

আমি ওয়ার্ড টুভেক বৈশিষ্ট্যগুলি বা অনুরূপ ব্যবহার করতে চাই, যদিও আমার তুলনামূলকভাবে একটি ছোট লেবেলযুক্ত ডেটাসেট অ্যাক্সেস রয়েছে এবং আমার হাতে থাকা লেবেলযুক্ত বেশিরভাগ ডেটা তৈরি করা দরকার।
ম্যাডিসন মে

উত্তর:


6

"ব্যাক প্রসারণ সহ পুনরাবৃত্তিশীল নিউরাল নেট" এর পরিবর্তে আপনি ফ্র্যান্টজি, ইত্যাদি ব্যবহারের পদ্ধতিকে বিবেচনা করতে পারেন। অল। জন্য ম্যানচেস্টার বিশ্ববিদ্যালয়ের পাঠ্য মাইনিং ন্যাশনাল সেন্টার ফর (NaCTeM) এ Termine (দেখুন: http://www.nactem.ac.uk/index.php এবং http://personalpages.manchester.ac.uk/staff/sophia। ananiadou / IJODL2000.pdf ) গভীর স্নায়ুবহুল জালের পরিবর্তে তারা "ভাষাগত এবং পরিসংখ্যান সম্পর্কিত তথ্য একত্রিত করে"।


7

দুটি সাম্প্রতিক কাগজ এই সমস্যাটি মোকাবেলায় CharWNN নামে একটি গভীর শিক্ষার আর্কিটেকচার ব্যবহার করে। চারডব্লিউএনএন প্রথমে একটি ইংরেজী কর্পাসে অংশ দেওয়ার স্পিচ (পিওএস) পার্ট অফ স্পিটে আর্টের ফলাফলগুলি (হস্তশিল্পের বৈশিষ্ট্য ছাড়াই) পাওয়ার জন্য ব্যবহার করা হয়েছিল ।

দ্বিতীয় কাগজ একই লেখক দ্বারা পূর্বাভাসের একটি শব্দ 10 স্বত্ত্বার নাম শ্রেণীর জন্যে কিনা, শিল্প ফলাফল আপাত রাষ্ট্রের সঙ্গে একই (অথবা অনুরূপ) স্থাপত্য ব্যবহার করে।


মজাদার. এটি ভাগ করে নেওয়ার জন্য ধন্যবাদ। আমি আশ্চর্য হয়েছি কেন তারা ইংরেজী কর্পোরায় এই পদ্ধতির পরীক্ষা করেনি।
ম্যাটিকডিবা

3

Http://DPeLear4j.org/word2vec.html চেষ্টা করুন । এটিতে এনইআর এবং অন্যান্য এনএলপি কাজের জন্য ব্যাগ অফ ওয়ার্ডের পরিবর্তে ওয়ার্ড 2ভেকের প্রয়োগ রয়েছে।


1
ওয়ার্ড টুভেক বাস্তবায়নগুলি খুঁজে পেতে আমার কোনও সমস্যা হয়নি, তবে আমি ব্যবহারের জন্য একটি ওয়ার্কিং রিকারসিভ নেট খুঁজে পেতে সক্ষম হয়েছি।
ম্যাডিসন মে

লিঙ্কটি আর সক্রিয় নেই, যদি সম্ভব হয় তবে দয়া করে নতুন
কার্যত

1

এনইআর এর জন্য শব্দ ভেক্টর কীভাবে ব্যবহার করতে হয় সে সম্পর্কে কিছু ধারণা এখানে রইল, যা বেশিরভাগ নিরীক্ষণযোগ্য শব্দ 2 বেইক-কেন্দ্রিক পদ্ধতির গ্রহণ করে।

  1. শব্দের ভেক্টরগুলির একটি সেট দেওয়া হয়েছে (হয় আপনি প্রশিক্ষিত কিছু, বা গুগলিনিউজ-ভেক্টর-নেগেটিভ 300 এই ক্লাস্টারগুলি মূলত বিভিন্ন নামবিহীন ধারণার জন্য আপনার সংজ্ঞা।
  2. ন্যূনতম তদারকির সাহায্যে, আপনি অজ্ঞাতনামা ক্লাস্টারগুলিকে মানব জ্ঞানের সাথে মেলে তুলতে মানচিত্র / রূপান্তর করতে পারেন, এইভাবে পরিচিত শব্দ ভেক্টর এবং নামবিহীন ধারণাগুলির শীর্ষে ভিত্তিক নাম ধারণাগুলি তৈরি করতে পারেন। উদাহরণস্বরূপ, কোনও পদ্ধতি findCluster(['joy', 'surprise', 'disgust', 'trust', 'fear', 'sadness', 'anger', 'anticipation'])প্রায়শই সংবেদন সম্পর্কিত শব্দের সমন্বিত একটি তালিকা ফিরে আসতে পারে। আপনি যদি এই তালিকার নাম 'আবেগ' রাখেন, তবে সেখানে আপনার ভেক্টরের স্পেসের উপর ভিত্তি করে একটি নামকরণ ধারণা 'সংবেদন' রয়েছে।
  3. দুটি প্রদত্ত ব্যক্তির মধ্যে মধ্যবর্তী ধারণাটি খুঁজতে আপনি ভেক্টর গণিতও করতে পারেন। উদাহরণস্বরূপ, ভেক্টর গণিত আপনাকে বলতে পারে যে দুটি শব্দ 'আশ্চর্য' এবং 'বিতৃষ্ণা' দেওয়া হলে দু'জনের মধ্যে নিম্নলিখিতটি পাওয়া যায়: হতাশা, বিস্ময়, হতাশা, বিস্ময়, বিস্ময়, হতাশা, অবিশ্বাস, শক ইত্যাদি। আপনি ধারণার মধ্যে সম্পর্ক স্থাপন করতে।
  4. আপনি উপরের পুনরাবৃত্তি করতে পারেন বিভিন্ন ধরণের নামযুক্ত কনম্পটগুলি তৈরি করতে, যেমন: সপ্তাহের দিন, সমস্ত আবেগ, খুশি আবেগ, যানবাহন ইত্যাদি
  5. একবার আপনি নাম ধারণার স্তরগুলি তৈরি করার পরে, আপনি নাম ধারণাগুলির সাথে সংযোজন করা একটি পাঠ্য কর্পাসে একটি আরএনএনকে প্রশিক্ষণ দিতে পারেন, সুতরাং 'বাদামী শিয়াল জাম্প' এছাড়াও '{বর্ণ} {প্রাণী} ক্রিয়া}' ইত্যাদি is এইভাবে আরএনএনকে কিছুটা অবলম্বনমূলক পদ্ধতিতে কিছু প্রাথমিক ব্যাকরণ শিখতে হবে।
  6. যদি আপনি উপরের থেকে যথেষ্ট শক্তিশালী ব্যাকরণ তৈরি করে থাকেন তবে আপনার এটি আপনার কিছু NER কার্যক্রমে প্রয়োগ করতে সক্ষম হওয়া উচিত।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.