প্রশ্ন ট্যাগ «nlp»

প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (এনএলপি) কম্পিউটার বিজ্ঞান, কৃত্রিম বুদ্ধিমত্তা এবং কম্পিউটার এবং মানব (প্রাকৃতিক) ভাষার মধ্যে মিথস্ক্রিয়া সম্পর্কিত একটি ভাষাতত্ত্ব field যেমনটি, এনএলপি মানুষের কম্পিউটারের মিথস্ক্রিয়া সম্পর্কিত ক্ষেত্রের সাথে সম্পর্কিত। এনএলপিতে অনেকগুলি চ্যালেঞ্জগুলি প্রাকৃতিক ভাষা বোঝার সাথে জড়িত, তা হ'ল কম্পিউটারগুলি মানব বা প্রাকৃতিক ভাষার ইনপুট থেকে অর্থ অর্জনে সক্ষম করে, এবং অন্যরা প্রাকৃতিক ভাষা উত্পন্ন করে।

4
লেটেন্ট ডিরিচলেট বরাদ্দ বনাম হায়ারারিকাল ডিরিচলেট প্রক্রিয়া
লেটেন্ট ডিরিচলেট অলোকেশন (এলডিএ) এবং হায়ারার্কিকাল ডিরিচলেট প্রক্রিয়া (এইচডিপি) উভয়ই বিষয় মডেলিং প্রক্রিয়া। প্রধান পার্থক্যটি হল এলডিএর বিষয়গুলির সংখ্যার স্পেসিফিকেশন প্রয়োজন, এবং এইচডিপি হ'ল না। কেন যে এত? এবং উভয় বিষয় মডেলিং পদ্ধতিতে পার্থক্য, উপকার এবং কনস কী?
49 nlp  topic-model  lda 

5
নথির মধ্যে দূরত্ব গণনার কয়েকটি মানক উপায় কী?
আমি যখন "ডকুমেন্ট" বলি তখন আমার উইকিপিডিয়া নিবন্ধ এবং নিউজ স্টোরিগুলির মতো ওয়েব পৃষ্ঠাগুলি মনে থাকে। আমি উত্তরগুলি পছন্দ করি ভ্যানিলা লেজিকাল দূরত্বের মেট্রিকগুলি বা অত্যাধুনিক সিমেটিক দূরত্বের মেট্রিকগুলি উত্তরগুলির জন্য আরও দৃference় পছন্দ সহ giving

1
এক্সজিবিস্ট স্কলারন গ্রেডিয়েন্টবুস্টিং ক্লাসিফায়ারের চেয়ে এত দ্রুত কেন?
আমি 100 সংখ্যার বৈশিষ্ট্য সহ 50 কে উদাহরণের মাধ্যমে গ্রেডিয়েন্ট বুস্টিং মডেলটি প্রশিক্ষণের চেষ্টা করছি। XGBClassifierআমার মেশিনে 43 সেকেন্ডের মধ্যে 500 গাছ হ্যান্ডল করে, যখন GradientBoostingClassifier1 মিনিট 2 সেকেন্ডের মধ্যে কেবল 10 টি গাছ (!) পরিচালনা করে :( আমি কয়েক ঘন্টা লাগবে বলে 500 গাছ বাড়ানোর চেষ্টা করতে বিরক্ত করিনি। …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

4
পুনঃসূচনা তথ্যের উপর ভিত্তি করে কাজের শ্রেণিবদ্ধকরণ করতে আমার কোন অ্যালগরিদম ব্যবহার করা উচিত?
দ্রষ্টব্য যে আমি আর-তে সবকিছু করছি সমস্যা অনুসরণ হিসাবে: মূলত, আমার কাছে পুনঃসূচনাগুলির একটি তালিকা রয়েছে (সিভি)। কিছু প্রার্থীর আগে কাজের অভিজ্ঞতা থাকবে এবং কিছু না থাকুক। এখানে লক্ষ্যটি হ'ল: তাদের সিভিগুলির পাঠ্যের উপর ভিত্তি করে, আমি তাদের বিভিন্ন কাজের ক্ষেত্রে শ্রেণিবদ্ধ করতে চাই। আমি সেই ক্ষেত্রে বিশেষভাবে রয়েছি, যেখানে …

3
বাক্য থেকে মূল পাঠ্য বের করার জন্য সাধারণ পদ্ধতি (এনপিএল)
একটি বাক্য দেওয়া হয়েছে: Complimentary gym access for two for the length of stay ($12 value per person per day) জিম বা জিম অ্যাক্সেস শব্দের শনাক্ত করার জন্য আমি কোন সাধারণ পন্থা নিতে পারি?

4
নামযুক্ত সত্তার স্বীকৃতি পাওয়ার জন্য ওয়ার্ড 2Vec
আমি একটি নামকৃত সত্তার স্বীকৃতি সিস্টেম তৈরি করতে গুগলের ওয়ার্ড 2vec প্রয়োগ ব্যবহার করতে চাইছি। আমি শুনেছি কাঠামোর মাধ্যমে পিছনে বর্ধনের সাথে পুনরাবৃত্ত হওয়া নিউরাল নেটগুলি নামধারী সত্তার স্বীকৃতি কার্যের জন্য উপযুক্ত, তবে আমি এই ধরণের মডেলের জন্য একটি শালীন বাস্তবায়ন বা একটি শালীন টিউটোরিয়াল খুঁজে পেতে সক্ষম হয়েছি। যেহেতু …

3
এনএলপি এবং মেশিন লার্নিং সম্প্রদায়গুলি গভীর শিক্ষায় আগ্রহী কেন?
আমি আশা করি আপনি আমাকে সহায়তা করতে পারবেন, কারণ এই বিষয়ে আমার কিছু প্রশ্ন রয়েছে। আমি গভীর শিক্ষার ক্ষেত্রে নতুন এবং কিছু টিউটোরিয়াল করার সময় আমি ধারণাগুলি একে অপরের থেকে সম্পর্কিত বা আলাদা করতে পারি না।

3
ট্রান্সফর্মার মডেলটিতে অবস্থানগত এনকোডিং কী?
আমি এমএল এ নতুন এবং এটি আমার এখানে প্রথম প্রশ্ন, তাই দুঃখিত যদি আমার প্রশ্নটি মূর্খ হয়। আমি কাগজটি পড়ার এবং বোঝার চেষ্টা করছি আপনার দৃষ্টি আকর্ষণ করা দরকার এবং এটিতে একটি চিত্র রয়েছে: অবস্থানগত এনকোডিং কী তা আমি জানি না । কিছু ইউটিউব ভিডিও শুনে আমি জানতে পেরেছি যে …

3
ওয়ার্ড 2ভেকের জন্য আরও ভাল ইনপুট কী?
এটি আরও একটি সাধারণ এনএলপি প্রশ্নের মতো। ওয়ার্ড 2 ভেক এমবেডিং শব্দের প্রশিক্ষণের জন্য উপযুক্ত ইনপুট কী? কোনও নিবন্ধের সাথে সম্পর্কিত সমস্ত বাক্যগুলি কর্পাসের আলাদা দলিল হওয়া উচিত? বা প্রতিটি নিবন্ধটি কর্পাসের ডকুমেন্ট হওয়া উচিত? এটি পাইথন এবং জিনসিম ব্যবহারের উদাহরণ মাত্র। কার্পাস বাক্য দ্বারা বিভক্ত: SentenceCorpus = [["first", "sentence", …

3
আমি কীভাবে জেনসিমের সাথে ফাস্টটেক্সট প্রিটেইনড মডেলটি লোড করব?
আমি এখান থেকে fastText pretrained মডেল লোড করার চেষ্টা Fasttext মডেল । আমি wiki.simple.en ব্যবহার করছি from gensim.models.keyedvectors import KeyedVectors word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', binary=True) কিন্তু, এটি নিম্নলিখিত ত্রুটিগুলি দেখায় Traceback (most recent call last): File "nltk_check.py", line 28, in <module> word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', binary=True) File "P:\major_project\venv\lib\sitepackages\gensim\models\keyedvectors.py",line 206, in load_word2vec_format header …
21 nlp  gensim 

2
ওয়ার্ড 2vec মডেল ব্যবহার করে কোনও শব্দের পূর্বাভাস
"যখন আমি খোলা: একটি বাক্য দেওয়া ?? দরজা এটি স্বয়ংক্রিয়ভাবে গরম শুরু হয়" আমি সম্ভাব্য শব্দের তালিকা পেতে চাই ?? একটি সম্ভাবনা সঙ্গে। ওয়ার্ড টুভেক মডেলে ব্যবহৃত মূল ধারণাটি আশেপাশের প্রসঙ্গে প্রদত্ত একটি শব্দটির "পূর্বাভাস" দেওয়া। একবার মডেলটি তৈরি হয়ে গেলে, নতুন বাক্যে আমার ভবিষ্যদ্বাণীটি কার্য সম্পাদন করতে সঠিক প্রসঙ্গ …

4
আমি কীভাবে শব্দের অর্থগত মিলের পরিমাপ করতে পারি?
শব্দের অর্থগত মিল খুঁজে বের করার সেরা উপায় কী? ওয়ার্ড টুভেক ঠিক আছে, তবে আদর্শ নয়: # Using the 840B word Common Crawl GloVe vectors with gensim: # 'hot' is closer to 'cold' than 'warm' In [7]: model.similarity('hot', 'cold') Out[7]: 0.59720456121072973 In [8]: model.similarity('hot', 'warm') Out[8]: 0.56784095376659627 # Cold is …

3
প্রাথমিক কীওয়ার্ডের উপর নির্ভর করে কীভাবে সম্পর্কিত শব্দের একটি তালিকা বাড়ানো যায়?
আমি সম্প্রতি শীতল বৈশিষ্ট্যটি দেখেছি যা একবার গুগল শিটগুলিতে পাওয়া যায়: আপনি ধারাবাহিক কক্ষে কয়েকটি সম্পর্কিত কীওয়ার্ড লিখে শুরু করুন, বলুন: "নীল", "সবুজ", "হলুদ" এবং এটি স্বয়ংক্রিয়ভাবে অনুরূপ কীওয়ার্ড তৈরি করে (এই ক্ষেত্রে , অন্যান্য রঙ)। এই ইউটিউব ভিডিওতে আরও উদাহরণ দেখুন । আমি এটি আমার নিজস্ব প্রোগ্রামে পুনরুত্পাদন করতে …

3
অনানুষ্ঠানিক পাঠ্যে নামকরণ করা স্বত্তা স্বীকৃতির জন্য ডেটাসেট
আমি বর্তমানে অনানুষ্ঠানিক পাঠ্য (ট্যুইটের অনুরূপ কিছু) থেকে নামযুক্ত সত্তাগুলি বের করার জন্য একটি মডেলকে প্রশিক্ষণের জন্য লেবেলযুক্ত ডেটাসেটগুলি অনুসন্ধান করছি। যেহেতু মূলধন এবং ব্যাকরণে প্রায়শই আমার ডেটাসেটে দস্তাবেজগুলির অভাব থাকে, তাই আমি ডোমেন ডেটা খুঁজে বের করি যা সংবাদ নিবন্ধ এবং জার্নাল এন্ট্রিগুলির তুলনায় কিছুটা "অনানুষ্ঠানিক" যে সত্ত্বার স্বীকৃতি …
18 dataset  nlp 

4
মেটা-ডেটা সহ টেক্সট ডকুমেন্টগুলি কীভাবে টীকা দেবেন?
প্রচুর পাঠ্য দলিল রয়েছে (প্রাকৃতিক ভাষায়, কাঠামোগত), কিছু শব্দার্থিক মেটা-ডেটা দিয়ে এগুলি বর্ণনা করার সম্ভাব্য উপায়গুলি কী কী? উদাহরণস্বরূপ, একটি সংক্ষিপ্ত দস্তাবেজ বিবেচনা করুন: I saw the company's manager last day. এ থেকে তথ্য আহরণ করতে সক্ষম হতে, এটি কম অস্পষ্ট হওয়ার জন্য অতিরিক্ত ডেটা দিয়ে মন্তব্য করা উচিত। এই …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.