রিসোর্স u'tokenizer / punkt / english.pickle 'পাওয়া যায় নি


99

আমার কোড:

import nltk.data
tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')

ভুল বার্তা:

[ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py
Traceback (most recent call last):
File "mapper_local_v1.0.py", line 16, in <module>

    tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')

File "/usr/lib/python2.6/site-packages/nltk/data.py", line 774, in load

    opened_resource = _open(resource_url)

File "/usr/lib/python2.6/site-packages/nltk/data.py", line 888, in _open

    return find(path_, path + ['']).open()

File "/usr/lib/python2.6/site-packages/nltk/data.py", line 618, in find

    raise LookupError(resource_not_found)

LookupError:

Resource u'tokenizers/punkt/english.pickle' not found.  Please
use the NLTK Downloader to obtain the resource:

    >>>nltk.download()

Searched in:
- '/home/ec2-user/nltk_data'
- '/usr/share/nltk_data'
- '/usr/local/share/nltk_data'
- '/usr/lib/nltk_data'
- '/usr/local/lib/nltk_data'
- u''

আমি ইউনিক্স মেশিনে এই প্রোগ্রামটি চালানোর চেষ্টা করছি:

ত্রুটির বার্তা অনুসারে, আমি আমার ইউনিক্স মেশিন থেকে পাইথন শেলটিতে লগইন করেছি তারপরে আমি নীচের কমান্ডগুলি ব্যবহার করেছি:

import nltk
nltk.download()

এবং তারপরে আমি ডাউন-লোডার এবং এল-তালিকা বিকল্পগুলি ব্যবহার করে সমস্ত উপলভ্য জিনিসগুলি ডাউনলোড করেছি তবে তবুও সমস্যাটি থেকেই যায়।

ইন্টারনেটে সমাধানটি সন্ধান করার জন্য আমি যথাসাধ্য চেষ্টা করেছি তবে আমার উপরের পদক্ষেপগুলিতে উল্লিখিত হিসাবে আমি যা করেছি তা-তেমন সমাধান পেয়েছি।


উত্তর:


172

আলভাসের উত্তরে যুক্ত করতে , আপনি কেবল কর্পসটি ডাউনলোড করতে পারেন punkt:

nltk.download('punkt')

ডাউনলোড allকরা আমার কাছে ওভারকিলের মতো শোনাচ্ছে। যদি না আপনি এটি চান না।


Nltk কর্পাস নামের জন্য ধন্যবাদ।
অস্টিন এ

Nltk.download ('পাঙ্কট') কাজ করতে আমাকে সর্বশেষতম nltk সংস্করণ 3.2.5 এ আপগ্রেড করতে হয়েছিল।
চার্লস gomes

উপরের কোডটি চালানোর পরে এটিই আমি পেয়েছি: [nltk_data] পাঙ্ক লোড করার সময় ত্রুটি: <urlopen ত্রুটি [এর্নো 111] সংযোগ [nltk_data] প্রত্যাখ্যান করেছে>
পল

আমার আগের সমস্যাটি সম্পর্কে, আমার যা করতে হয়েছিল তা হ'ল আমার ভিপিএন বন্ধ করে দেওয়া।
পল

60

আপনি যদি কেবল punktমডেলটি ডাউনলোড করতে চান :

import nltk
nltk.download('punkt')

আপনি কোন ডেটা / মডেলটির প্রয়োজন তা যদি নিশ্চিত না হন তবে আপনি এনএলটিকে থেকে জনপ্রিয় ডেটাসেট, মডেল এবং ট্যাগগুলি ইনস্টল করতে পারেন :

import nltk
nltk.download('popular')

উপরের কমান্ডের সাথে, ডেটাসেটগুলি ডাউনলোড করতে জিইউআই ব্যবহার করার দরকার নেই।


34

আমি সমাধান পেয়েছি:

import nltk
nltk.download()

একবার NLTK ডাউনলোডার শুরু হয়

d) ডাউনলোড l) তালিকা u) আপডেট গ) কনফিগার h) সহায়তা q) প্রস্থান করুন

ডাউনলোডার> ডি

কোন প্যাকেজ ডাউনলোড করুন (l = list; x = বাতিল)? সনাক্তকারী> পাঙ্ক্ট


27

শেল থেকে আপনি কার্যকর করতে পারেন:

sudo python -m nltk.downloader punkt 

আপনি যদি জনপ্রিয় এনএলটি কে কর্পোরেশন / মডেলগুলি ইনস্টল করতে চান তবে:

sudo python -m nltk.downloader popular

আপনি যদি সমস্ত এনএলটি কে কর্পোরেশন / মডেল ইনস্টল করতে চান তবে :

sudo python -m nltk.downloader all

ডাউনলোড করা সংস্থানগুলি তালিকাভুক্ত করতে:

python -c 'import os; import nltk; print os.listdir(nltk.data.find("corpora"))'
python -c 'import os; import nltk; print os.listdir(nltk.data.find("tokenizers"))'

12
import nltk
nltk.download('punkt')

পাইথন প্রম্পটটি খুলুন এবং উপরের বিবৃতিগুলি চালান run

Sent_tokenize ফাংশনের একটি দৃষ্টান্ত ব্যবহার PunktSentenceTokenizer থেকে nltk.tokenize.punkt মডিউল। এই উদাহরণটি ইতিমধ্যে প্রশিক্ষিত হয়েছে এবং অনেক ইউরোপীয় ভাষার জন্য ভাল কাজ করে। সুতরাং এটি কী বিরামচিহ্ন এবং অক্ষরগুলি একটি বাক্যটির শেষে এবং একটি নতুন বাক্যের শুরুতে চিহ্নিত করে।


9

আমার সাথে সম্প্রতি একই ঘটনা ঘটেছে, আপনার কেবল "পাঙ্ক্ট" প্যাকেজটি ডাউনলোড করা দরকার এবং এটি কাজ করা উচিত।

আপনি যখন "সমস্ত উপলভ্য জিনিসগুলি ডাউনলোড" করার পরে "তালিকা" (l) চালাবেন, তখন কি সবকিছু নীচের লাইনের মতো চিহ্নিত করা যায় ?:

[*] punkt............... Punkt Tokenizer Models

যদি আপনি তারার সাথে এই লাইনটি দেখতে পান তবে এর অর্থ এটি আপনার কাছে রয়েছে এবং এনল্টকে এটি লোড করতে সক্ষম হওয়া উচিত।


4
আরে @ সুপ্রিথ-মেকা, আপনি সমাধানটি পেয়েছিলেন বলে আমি আনন্দিত, এটিই আমি আপনাকে পরামর্শ দিয়েছি, আপনি কি আমার উত্তরটিকে "স্বীকৃত" হিসাবে চিহ্নিত করতে পারেন?
eeelnico

5

টাইপ করে পাইথন কনসোলে যান

y পাইথন

আপনার টার্মিনালে তারপরে, আপনার পাইথন শেলের সাথে সম্পর্কিত প্যাকেজগুলি ইনস্টল করতে নিম্নলিখিত দুটি কমান্ড লিখুন:

>> nltk.download ('পাঙ্কট') >> nltk.download ('গড়_প্রেসেট্রন_ট্যাগার')

এটি আমার জন্য সমস্যাটি সমাধান করেছে।



3

নিম্নলিখিতগুলি আমদানি করেও আমি একটি ত্রুটি পেয়েছি,

import nltk
nltk.download()

তবে গুগল কোলাবের জন্য এটি আমার সমস্যার সমাধান করেছে।

   !python3 -c "import nltk; nltk.download('all')"

2

আমার ইস্যুটি আমি ডেকেছিলাম nltk.download('all') রুট ব্যবহারকারী হিসাবে , তবে শেষ পর্যন্ত nltk ব্যবহার করা প্রক্রিয়াটি এমন আরেকজন ব্যবহারকারী ছিল যেখানে সামগ্রীটি ডাউনলোড করা হয়েছে যেখানে / root / nltk_data অ্যাক্সেস নেই।

সুতরাং আমি সহজেই ডাউনলোডের অবস্থান থেকে এনএলটিকে যেভাবে পাথ খুঁজে পেয়েছিলাম তার মধ্যে একটির কাছে ডাউনলোডের অবস্থান থেকে সমস্ত কিছু অনুলিপি করে অনুলিপি করেছিলাম:

cp -R /root/nltk_data/ /home/ubuntu/nltk_data

2

সরল nltk.download () এই সমস্যার সমাধান করবে না। আমি নীচে চেষ্টা করেছিলাম এবং এটি আমার জন্য কাজ করেছে:

nltk ফোল্ডারে একটি টোকেনাইজার ফোল্ডার তৈরি করুন এবং আপনার পাঙ্ক ফোল্ডারটি টোকেনাইজার ফোল্ডারে অনুলিপি করুন।

এটি কাজ করবে! ছবিতে প্রদর্শিত ফোল্ডারের কাঠামোটি হওয়া দরকার


2
  1. নিম্নলিখিত কোডটি কার্যকর করুন:

    import nltk
    nltk.download()
    
  2. এর পরে, এনএলটিকে ডাউনলোডার পপ আউট হবে।

  3. সমস্ত প্যাকেজ নির্বাচন করুন।
  4. পাঙ্কট ডাউনলোড করুন।

1

আপনি নতুন করে সাজানো আপনার ফোল্ডার আপনার সরান প্রয়োজন tokenizersমধ্যে ফোল্ডারের nltk_dataফোল্ডার। এই আপনি আছে যদি কাজ না করে nltk_dataফোল্ডার corporaফোল্ডার tokenizersফোল্ডার


1

উপরের কিছুই আমার জন্য কাজ করা হয়নি, তাই আমি ওয়েব সাইট http://www.nltk.org/nltk_data/ থেকে স্রেফ সমস্ত ফাইল ডাউনলোড করেছি এবং এগুলি হাতে "এনটেলকি_ডাটা" এর ভিতরে একটি "টোকেনাইজার" ফাইল হাতে রেখেছি them "ফোল্ডার সুন্দর সমাধান নয় তবুও একটি সমাধান।


0

আমি একই সমস্যা সম্মুখীন। সবকিছু ডাউনলোড করার পরে, এখনও 'পাঙ্ক্ট' ত্রুটি ছিল। আমি আমার উইন্ডোজ মেশিনে সি: \ ব্যবহারকারী \ বৈভব \ অ্যাপডাটা hav রোমিং lt nltk_data \ টোকেনাইজারগুলিতে প্যাকেজটি অনুসন্ধান করেছি এবং আমি সেখানে উপস্থিত 'পাঙ্কট.জিপ' দেখতে পাচ্ছি। আমি বুঝতে পারি যে কোনওভাবে জিপটি সি: \ ব্যবহারকারীদের \ বৈভব \ অ্যাপডাটা \ রোমিং \ nltk_data \ টোকেনাইজারস izers পাঙ্কে সরানো হয়নি। আমি একবার জিপটি বের করেছি, এটি সংগীতের মতো কাজ করেছিল।


0

আপনি Jupyterনোটবুক এবং একটি নোটবুক ব্যবহার করছেন তা নিশ্চিত করুন, নিম্নলিখিতটি করুন:

import nltk

nltk.download()

তারপরে একটি পপআপ উইন্ডো আসবে (তথ্য https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml দেখায় ) সেখান থেকে আপনাকে সবকিছু ডাউনলোড করতে হবে।

তারপরে আপনার কোডটি পুনরায় চালু করুন।


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.