এনএলটিকে এনইআর সম্পর্কিত সহায়তা


12

আমি পাইথনটি ব্যবহার করার জন্য কিছুক্ষণ NLTK এ কাজ করছি। আমি যে সমস্যার মুখোমুখি হচ্ছি তা হ'ল এগুলি আমার কাস্টম ডেটা দিয়ে NLTK এ NER প্রশিক্ষণ দেওয়ার জন্য কোনও সহায়তা পাওয়া যায় না। তারা ম্যাক্সেন্ট ব্যবহার করেছে এবং এটি ACE কর্পাসে প্রশিক্ষিত করেছে। আমি ওয়েবে প্রচুর অনুসন্ধান করেছি কিন্তু এনএলটিকে'র এনইআর প্রশিক্ষণ দেওয়ার জন্য কোনও উপায় খুঁজে পেলাম না।

যদি কেউ আমাকে এমন কোনও লিঙ্ক / নিবন্ধ / ব্লগ ইত্যাদি সরবরাহ করতে পারেন যা আমাকে প্রশিক্ষণ ডেটাসেটস ফর্ম্যাটে NLTK এর NER প্রশিক্ষণে ব্যবহৃত হতে পারে তবে আমি সেই নির্দিষ্ট ফর্ম্যাটে আমার ডেটাসেটগুলি প্রস্তুত করতে পারি। এবং যদি আমাকে এমন কোনও লিঙ্ক / নিবন্ধ / ব্লগ ইত্যাদির দিকে পরিচালিত করা হয় যা আমার নিজের ডেটার জন্য NLTK এর NER প্রশিক্ষণে সহায়তা করতে পারে।

এটি ব্যাপকভাবে অনুসন্ধান করা এবং কমপক্ষে উত্তর দেওয়া একটি প্রশ্ন। ভবিষ্যতে কারও জন্য সহায়ক হতে পারে যার সাথে NER এর সাথে কাজ করছেন।


উপর বিপরীত পোস্ট quora.com/Help-on-training-NLTKs-NER
ফ্রাঙ্ক Dernoncourt

উত্তর:


4

একটি মডেল, এর সাথে সম্পর্কিত প্রশিক্ষণ তথ্য নিষ্কাশন , সাধারণ, এবং স্বত্ত্বার নাম স্বীকৃতি / রেজোলিউশন (নেরের) , বিশেষ করে, এর মধ্যে বিস্তারিতভাবে বর্ণনা করা হয়েছে অধ্যায় 7 এর NLTK বুক : এই URL- এ অনলাইনে পাওয়া HTTP: //www.nltk .org / book / ch07.html

উপরন্তু, আমি মনে করি যে আপনি উপযোগী আমার পেতে পারে সংশ্লিষ্ট উত্তর উপর ক্রস যাচাই সাইট। এটিতে এনইআর সম্পর্কিত সম্পর্কিত উত্স এবং সম্পর্কিত বিষয়গুলির পাশাপাশি বিভিন্ন সম্পর্কিত সফ্টওয়্যার সরঞ্জামগুলির জন্য প্রচুর উল্লেখ রয়েছে ।


তারা কাস্টম ডেটাতে এনইআর মডেলকে কীভাবে প্রশিক্ষণ দেবেন তা উল্লেখ করেন না, আপনি কীভাবে এটি করবেন তা বলতে পারবেন?
হিমা বর্ষা

1
@ হিমাবার্ষা আমি এই অঞ্চলে বিশেষজ্ঞ নই। যাইহোক, ... আমি মনে করি যে এনএলটিকে এনইআর মডেল কনল২০০০ কর্পাসে প্রাক প্রশিক্ষণ প্রাপ্ত , সুতরাং এনএলটিকে বইয়ের কোনও তথ্য নেই। নিম্নলিখিত সংস্থানগুলি পরীক্ষা করুন: 1. nltk-trainer.readthedocs.io (আপনার সম্ভবত যা প্রয়োজন সম্ভবত; সম্ভবত প্রশিক্ষণ আইওবি চঙ্কার্স বিভাগ)। 2. sujitpal.blogspot.com/2012/11/… (পাশাপাশি কার্যকর হতে পারে)। ৩. nlp.stanford.edu/software/crf-faq.shtml#a (আপনি যদি স্ট্যানফোর্ড NER সফ্টওয়্যার ব্যবহার করেন বা সিদ্ধান্ত নেবেন তবে)।
আলেকসান্দ্র ব্লেক 21

আমি মনে করি স্ট্যানফোর্ডসিআরএফ বাস্তবায়ন কাস্টম ডেটা নেয় না, তবে এনটিএলকে এনইআর কেবল প্রাক প্রশিক্ষিত হয়। প্রশিক্ষণ আইওবি চুনকার্স ঠিক ঠিক ছিঁড়ে ফেলা হচ্ছে? বা এটি এমনকি NER না?
হিমা বর্ষা

@ হিমাবার্ষা দয়া করে আপনার যে পরামর্শ পাচ্ছেন তার প্রতি বেশি মনোযোগ দিন। আপনি যদি উপরে লিঙ্ক # 2 এর মাধ্যমে সাবধানতার সাথে পোস্টটি পড়েন তবে আপনি দেখতে পাবেন যে সেখানে কোডটি NER মডেল প্রশিক্ষণ এবং চলমান উভয়ই করে। আমি মনে করি না উপরের পরামর্শের বাইরে আমি আপনাকে সহায়তা করতে পারি।
আলেকসান্দ্র ব্লেক

3

এই নিবন্ধটি কি যথেষ্ট ভাল? http://www.succeed-project.eu/wiki/index.php/NLTK#Input_format_for_training

কর্পাস কেমন হওয়া উচিত সে সম্পর্কে ব্যাখ্যা রয়েছে।

এটিকে কাজ করতে আপনার ডেটা আইওবি ফর্ম্যাটে (ওয়ার্ড ট্যাগ চঙ্কট্যাগ) থাকা দরকার।
এরিক এনএনপি বি-পার্সন
হলেন গুগল এনএনপি বি-অর্গানাইজেশন ইন ইন
বি বি এনপি
সিইও এনএন আই-এনপি



1
এই উত্তরে নিবন্ধের একটি সংক্ষিপ্তসার পোস্ট করা আদর্শ হবে।
শেলডোনক্রেগার ২৩:৫৩ এ

1

আমি এই টিউটোরিয়ালটি বেশ সহায়ক বলে খুঁজে পেয়েছি: পাইথনের সাথে আপনার নিজস্ব নামযুক্ত সত্তা সনাক্তকারী তৈরি করতে সম্পূর্ণ গাইড তিনি তাঁর NER অংশকে প্রশিক্ষণের জন্য গ্রোনিঞ্জেন অর্থ ব্যাংক (জিএমবি) কর্পস ব্যবহার করেন।

এর পরে আপনি একই ব্যক্তির কাছ থেকে এই টিউটোরিয়ালটি যাচাই করতে পারেন: একটি বড় ডেটা सेट ব্যবহার করে একটি NER সিস্টেম প্রশিক্ষণ যেখানে তিনি স্কাইকিট ব্যবহার করেন তার সিস্টেমের কর্মক্ষমতা উন্নত করতে।

পরিশেষে কিছু সত্যিকারের দরকারী টিউটোরিয়াল এখানে পাওয়া যাবে: এনএলটিকি টিউটোরিয়াল এই লোকটির অনেকগুলি টিউটোরিয়াল (এমএল, এনএলপি, পাইথন ...) সহ একটি ইউটিউব চ্যানেল রয়েছে guy

আশা করি এটা সাহায্য করবে.

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.