প্রশ্ন ট্যাগ «nltk»

প্রাকৃতিক ভাষা টুলকিট গণ্য ভাষাতাত্বিক জন্য একটি পাইথন গ্রন্থাগার is

7
"এনট্রপি এবং তথ্য লাভ" কী?
আমি এই বইটি পড়ছি ( এনএলটিকে ) এবং এটি বিভ্রান্তিকর। এনট্রপি হয় হিসাবে সংজ্ঞায়িত : এন্ট্রপি হ'ল প্রতিটি লেবেলের সেই একই লেবেলের লগ সম্ভাবনার বারের সম্ভাবনার যোগফল পাঠ্য খনির ক্ষেত্রে আমি কীভাবে এনট্রপি এবং সর্বোচ্চ এনট্রপি প্রয়োগ করতে পারি ? কেউ আমাকে একটি সহজ, সহজ উদাহরণ (চাক্ষুষ) দিতে পারেন?

15
Nltk.data.load দিয়ে ইংলিশ.পিকল লোড করা ব্যর্থ
punktটোকনাইজারটি লোড করার চেষ্টা করার সময় ... import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') ... একটি LookupErrorউত্থাপিত হয়েছিল: > LookupError: > ********************************************************************* > Resource 'tokenizers/punkt/english.pickle' not found. Please use the NLTK Downloader to obtain the resource: nltk.download(). Searched in: > - 'C:\\Users\\Martinos/nltk_data' > - 'C:\\nltk_data' > - 'D:\\nltk_data' > - 'E:\\nltk_data' > …
144 python  jenkins  nltk 


15
পাইথনে এন-গ্রাম, চার, পাঁচ, ছয় গ্রাম?
আমি কোনও পাঠ্যকে এন-গ্রামে বিভক্ত করার উপায় খুঁজছি। সাধারণত আমি এমন কিছু করতাম: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams আমি জানি যে এনল্টক কেবল বিগ্রাম এবং ট্রিগার সরবরাহ করে তবে আমার পাঠ্যকে চার-গ্রাম, পাঁচ-গ্রাম বা এমনকি …
137 python  string  nltk  n-gram 

9
পাইথনের সাথে কোনও শব্দ ইংরেজি শব্দ কিনা তা কীভাবে পরীক্ষা করবেন?
ইংরেজী অভিধানে যদি একটি শব্দ থাকে তবে আমি পাইথন প্রোগ্রামটি পরীক্ষা করতে চাই। আমি বিশ্বাস করি যে এনটিএলকে ওয়ার্ডনেট ইন্টারফেসটি হয়তো যাওয়ার উপায় হতে পারে তবে এ জাতীয় কোনও সহজ কাজের জন্য এটি কীভাবে ব্যবহার করতে হয় সে সম্পর্কে আমার কোনও ধারণা নেই। def is_english_word(word): pass # how to I …
134 python  nltk  wordnet 


11
কীভাবে এনএলটিকে টোকেনাইজার ব্যবহার করে বিরামচিহ্ন থেকে মুক্তি পাবেন?
আমি কেবল এনএলটিকে ব্যবহার শুরু করছি এবং পাঠ্য থেকে কীভাবে শব্দের একটি তালিকা পাবেন তা আমি যথেষ্ট বুঝতে পারি না। আমি যদি ব্যবহার করি তবে আমি nltk.word_tokenize()শব্দ এবং বিরামচিহ্নগুলির একটি তালিকা পেয়েছি get পরিবর্তে আমার কেবল শব্দগুলি দরকার। আমি কীভাবে যতিচিহ্ন থেকে মুক্তি পেতে পারি? এছাড়াও word_tokenizeএকাধিক বাক্য সাথে কাজ …
125 python  nlp  tokenize  nltk 

12
এনল্টক বা পাইথন ব্যবহার করে স্টপ শব্দগুলি কীভাবে সরিয়ে ফেলা যায়
সুতরাং আমার কাছে একটি ডেটাসেট রয়েছে যা আমি ব্যবহার বন্ধ করে শব্দগুলি সরিয়ে দিতে চাই stopwords.words('english') আমি কীভাবে এই কোডগুলিতে কেবল এই শব্দগুলি ব্যবহার করতে পারি তা ব্যবহার করে লড়াই করছি। এই ডেটাসেটের শব্দের একটি তালিকা আমার কাছে ইতিমধ্যে রয়েছে, আমি যে অংশটির সাথে লড়াই করছি তার সাথে তালিকার তুলনা …
110 python  nltk  stop-words 

26
পাইপ ইস্যু প্রায় কোনও গ্রন্থাগার ইনস্টল
পাইপ ব্যবহার করার সময় প্রায় কোনও কিছু ইনস্টল করতে আমার অসুবিধা হয়। আমি কোডিংয়ে নতুন, তাই আমি ভেবেছিলাম সম্ভবত এটিই আমি ভুল করে চলেছি এবং আমার যা করা প্রয়োজন তা সর্বাধিক পাওয়ার জন্য ইজি_ইনস্টল বেছে নেওয়া হয়েছে, যা সাধারণত কাজ করেছে। যাইহোক, এখন আমি nltk গ্রন্থাগারটি ডাউনলোড করার চেষ্টা করছি, …
106 python  pip  nltk  easy-install 

7
এনটিলেটকের কোন সংস্করণ কীভাবে চেক করবেন, সাইকিট শিখবেন?
শেল স্ক্রিপ্টে আমি এই প্যাকেজগুলি ইনস্টল করা আছে কিনা তা যাচাই করে দেখছি, ইনস্টল না থাকলে ইনস্টল করুন। সুতরাং শেল স্ক্রিপ্ট সহ: import nltk echo nltk.__version__ তবে এটি importলাইনে শেল স্ক্রিপ্ট থামায় লিনাক্স টার্মিনালে এই পদ্ধতিতে দেখার চেষ্টা করেছিল: which nltk যা এটি ইনস্টল করা হয়েছে কিছুই ভাবেন না। শেল …

17
রিসোর্স u'tokenizer / punkt / english.pickle 'পাওয়া যায় নি
আমার কোড: import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') ভুল বার্তা: [ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py Traceback (most recent call last): File "mapper_local_v1.0.py", line 16, in <module> tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') File "/usr/lib/python2.6/site-packages/nltk/data.py", line 774, in load opened_resource = _open(resource_url) File "/usr/lib/python2.6/site-packages/nltk/data.py", line 888, in _open return find(path_, path + ['']).open() File "/usr/lib/python2.6/site-packages/nltk/data.py", line …
99 python  unix  nltk 

6
পাইথন: tf-idf-cosine: নথির মিল খুঁজে পেতে similar
আমি একটি টিউটোরিয়াল অনুসরণ করছিলাম যা পর্ব 1 এবং পার্ট 2 এ উপলব্ধ ছিল । দুর্ভাগ্যক্রমে লেখকের চূড়ান্ত বিভাগের জন্য সময় ছিল না যা আসলে দুটি নথির মধ্যে দূরত্ব খুঁজে পেতে কোসাইন অনুরূপ ব্যবহার করে জড়িত। আমি নিবন্ধের উদাহরণগুলি স্ট্যাকওভারফ্লো থেকে নিম্নলিখিত লিঙ্কটির সাহায্যে অনুসরণ করেছি , উপরের লিঙ্কে উল্লিখিত …



4
এনএলটিকে দিয়ে একটি নতুন কর্পাস তৈরি করা হচ্ছে
আমি গণনা করেছি যে প্রায়শই আমার শিরোনামের উত্তর ডকুমেন্টেশনগুলি পড়তে হয়, তবে আমি এনএলটিকে বইটি চালিয়েছিলাম তবে এটি উত্তর দেয় না। আমি পাইথনে এক ধরণের নতুন। আমার কাছে অনেকগুলি .txtফাইল রয়েছে এবং আমি NLTK কর্পাসের জন্য সরবরাহ করা কর্পাস ফাংশনগুলি ব্যবহার করতে সক্ষম হতে চাই nltk_data। আমি চেষ্টা করেছি PlaintextCorpusReaderকিন্তু …
83 python  nlp  nltk  corpus 
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.