হ্যাঁ, আপনি প্রাক প্রশিক্ষিত মডেলগুলির সুবিধা নিতে পারেন। গুগল নিউজডাটা প্রশিক্ষিত মডেল হিসাবে সর্বাধিক বিখ্যাত একজন আপনি এখানে খুঁজে পেতে পারেন।
প্রাক-প্রশিক্ষিত শব্দ এবং বাক্যাংশের ভেক্টর https://drive.google.com/file/d/0B7XkCwpI5KDYNlNUTTlSS21pQmM/edit?usp=sharing
তারপরে আপনি নীচের মতন জেনসিম ব্যবহার করে আপনার মডেলটিতে বাইনারি ফর্ম্যাটে ভেক্টরগুলি লোড করতে পারেন।
>>> model = Word2Vec.load_word2vec_format('/tmp/vectors.txt', binary=False) # C text format
>>> model = Word2Vec.load_word2vec_format('/tmp/vectors.bin', binary=True) # C binary format
এখানে ইংরাজী উইকিপিডিয়াটির জন্য একটি আলাদা প্রাক-বিল্ট মডেল রয়েছে:
https://github.com/idio/wiki2vec/raw/master/torrents/enwiki-gensim-word2vec-1000-nostem-10cbow.torrent
সূত্র: https://github.com/idio/wiki2vec/
একটি প্রাক বিল্ট মডেল ব্যবহার করে
Get python 2.7
Install gensim: pip install gensim
uncompress downloaded model: tar -xvf model.tar.gz
Load model in gensim:
from gensim.models import Word2Vec
model = Word2Vec.load("path/to/word2vec/en.model")
model.similarity('woman', 'man')
আপনি স্ট্যানফোর্ড এনএলপি গ্লোভও ব্যবহার করতে পারেন
এখানে প্রাক-প্রশিক্ষিত ওয়ার্ড টু ওয়েভ মডেলগুলির একটি দুর্দান্ত সংকলন রয়েছে।
কিছু অতিরিক্ত প্রাক প্রশিক্ষিত মডেল:
জিন্সিম এবং কোড সম্পর্কে এখানে আরও: https://radimrehurek.com/gensim/models/word2vec.html
একই প্রশ্নের সাথে কোরা ফোরাম