অজগরে সিআরএফ এর বাস্তবায়ন


32

সেখানে একটি জনপ্রিয় বাস্তবায়ন শর্তসাপেক্ষ এলোমেলো ক্ষেত্রসমূহ মধ্যে পাইথন ?

আমি বহুল ব্যবহৃত এবং জনপ্রিয় যে কোনও খুঁজে পাচ্ছি না!


Have a look at my Github Repo(ScikitCRF_NER) for python implementation of scikitCRF
Manikandan Thangavelu

উত্তর:


13

সিআরএফ ++ সাধারণভাবে একটি জনপ্রিয় পছন্দ এবং পাইথন বাইন্ডিং রয়েছেসিআরএফএসউইটের এখানেও নথিবদ্ধ রয়েছে , তবে সিআরএফ ++ এর মতো বিস্তৃত ব্যবহার দেখা যায় বলে মনে হয় না। এই লেখার হিসাবে, উচ্চ স্তরের মেশিন লার্নিং ফ্রেমওয়ার্ক যেমন সাইকিট-লার্নের সিআরএফ সমর্থনের অভাব রয়েছে ( এই টানুন অনুরোধটি দেখুন )।


15

সিআরএফ ++ এর আরও আগত লিঙ্ক রয়েছে কারণ এটি একটি পুরানো গ্রন্থাগার।
সিআরএফএসউইট আমার মতে উচ্চতর।

আপনি যদি পাইথন বাইন্ডিংসের সন্ধান করছেন তবে সিআরএফএসউইট আরও ভাল কারণ আপনি পাইথনের একটি মডেলকে প্রশিক্ষণ দিতে পারবেন, যখন সিআরএফ ++ এ আপনি কেবল পাইথনের বিদ্যমান মডেলগুলি পরীক্ষা করতে পারবেন। (এটি ছিল আমার জন্য চুক্তিভঙ্গকারী)) সিআরএফএসউইট পাইথনের উদাহরণ কোডের একটি গুচ্ছ নিয়ে আসে, যেমন এনইআর, চুনকিং এবং পস ট্যাগিং।


3
আপনি কীভাবে সিআরএফএসউইট দ্বারা সরবরাহিত NER এবং চুনকিং ব্যবহার করবেন তা বিশদভাবে বলতে পারেন? দেখে মনে হচ্ছে এটি অন্য কোনও ফর্ম্যাটের প্রশিক্ষণের ডেটা প্রত্যাশা করে। আমি এটি কোথায় খুঁজে পাব?
কিংবদন্তি

14

এখানে আরও কয়েকটি র‌্যাপার / বাস্তবায়ন রয়েছে:

  • https://github.com/adsva/python-wapiti - http://wapiti.limsi.fr/ এর জন্য পাইথনের মোড়ক । ওয়াপিতি দ্রুত; ক্রাফসুয়েট বেঞ্চমার্কগুলি ওয়াপিতির পক্ষে ন্যায়সঙ্গত নয় কারণ ওয়াপিতি একাধিক সিপিইউ কোরের সাথে এল-বিএফজিএস প্রশিক্ষণের সমান্তরাল করতে পারে, এবং এই বৈশিষ্ট্যটি মানদণ্ডে ব্যবহৃত হয়নি। ওয়াপিতির সমস্যা হ'ল এটি গ্রন্থাগার হিসাবে লেখা হয় না। মোড়ক এটি কাটিয়ে উঠার জন্য কঠোর চেষ্টা করে, তবে আপনি এখনও একটি অপ্রকাশযোগ্য পেতে পারেন exit(), এবং আমি প্রশিক্ষণের সময় মেমরি ফাঁস দেখেছি। এছাড়াও, ওয়াপিতি এমন একধরণের বৈশিষ্ট্যে সীমাবদ্ধ যা এটি উপস্থাপন করতে পারে তবে সিআরএফসুয়েটও সীমিত (অন্যভাবে)। ওয়াপিতি একটি মোড়কে আবদ্ধ হয়, এটি আলাদাভাবে ইনস্টল করার দরকার নেই।
  • https://github.com/jakevdp/pyCRFsuite - ক্রফসুইটের জন্য একটি মোড়ক। মোড়ক বেশ উন্নত এবং স্কিপি স্পার্স ম্যাট্রিক্সকে একটি ইনপুট হিসাবে ব্যবহার করার অনুমতি দেয় তবে মনে হয় কিছু অমীমাংসিত সমস্যা রয়েছে, কিছু ক্ষেত্রে সেগফ্ল্ট পাওয়া সম্ভব।
  • https://github.com/tpeng/python-crfsuite - আরেকটি crfsuite মোড়ক। এই এক বরং সহজ; এটি সহজ ইনস্টলেশন জন্য crfsuite বান্ডিল এবং ঠিক 'পাইপ ইনস্টল পাইথন-crfsuite' দিয়ে ইনস্টল করা যাবে।
  • https://github.com/larmans/seqlearn স্ট্রাকচার্ড পারসেপট্রন সরবরাহ করে যা অনেক ক্ষেত্রে সিআরএফের প্রতিস্থাপন হতে পারে। সিক্লার্নে স্ট্রাকচারড পারসেপ্ট্রন বাস্তবায়ন খুব দ্রুত। এখানে একটি জনসংযোগ রয়েছে (লেখার সময় একীভূত হয়নি) যা সিক্লেয়ারনে সিআরএফ সমর্থন যুক্ত করে; এটা শক্ত দেখাচ্ছে।
  • https://github.com/timvieira/crf - এটি বেশ প্রাথমিক and

আমি পারলে সিক্লার্ন ব্যবহার করার পরামর্শ দিচ্ছি, সিআরএফসুইট ট্রেনিং অ্যালগরিদম এবং প্রশিক্ষণের গতি প্রয়োজন হলে পাইথারফুসুইট আপনার যদি আরও উন্নত সিআরএফসুইট ইন্টিগ্রেশন প্রয়োজন হয় এবং কিছু অসুবিধার মুখোমুখি হতে প্রস্তুত, পাইথন-ওয়াপিটি যদি আপনার প্রয়োজন হয় ট্র্যাফিক অ্যালগরিদম বা বৈশিষ্ট্য সি / সি ++ কম্পাইলারের কাজ করার কোনও উপায় না থাকলে সিআরএফসুয়েটে (ট্রানজিশনে স্বতন্ত্র পর্যবেক্ষণের কন্ডিশনের মতো) এবং টিমভিয়ের ক্রাফে উপলভ্য নয়, তবে একটি প্রাক-বিল্ট অলপ পাওয়া যায়।


7

আমি মনে করি আপনি যা খুঁজছেন তা পাই স্ট্রস্ট্রাক্ট

পাইস্ট্রাক্টের লক্ষ্য হল সহজেই ব্যবহারযোগ্য কাঠামোগত শিক্ষা এবং ভবিষ্যদ্বাণী গ্রন্থাগার হওয়া being বর্তমানে এটি কেবলমাত্র সর্বাধিক-মার্জিন পদ্ধতি এবং একটি পেরসেপ্ট্রন প্রয়োগ করে, তবে অন্যান্য অ্যালগরিদমগুলি অনুসরণ করতে পারে।

পাইস্ট্রাস্টের লক্ষ্যটি হল গবেষকদের পাশাপাশি অ-বিশেষজ্ঞদের কাঠামোগত ভবিষ্যদ্বাণী অ্যালগরিদমগুলি ব্যবহার করার জন্য একটি ভাল-ডকুমেন্টেড সরঞ্জাম সরবরাহ করা। ডিজাইনটি বৈজ্ঞানিক-শেখার ইন্টারফেস এবং কনভেনশনগুলির যতটা সম্ভব কাছে থাকার চেষ্টা করে।

PyStructভাল ডকুমেন্টেশন সহ আসে , এবং এটি সক্রিয়ভাবে গিথুবে বিকাশিত ।

নীচে পাইস্ট্রাক্ট থেকে পাইক এবং অন্যান্য প্যাকেজগুলির PyStructসাথে তুলনা করা একটি টেবিল রয়েছে - পাইথনে কাঠামোগত পূর্বাভাস :CRFsuite

Comparison of structured prediction software packages

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.