উত্তর:
আপনি যে সফ্টওয়্যারটি ব্যবহার করতে পারবেন তা হ'ল সিএম ইউএসফিনেক্স । অন্য উত্তরে প্রস্তাবিত হিসাবে পৃথক জুলিয়াস উপযুক্ত নয় কারণ এর জন্য মডেল প্রয়োজন। জুলিয়াসের জন্য বৃহত ভোকাবুলারি বক্তৃতা স্বীকৃতির মডেলগুলি উপলভ্য নয়।
আপনি অডিও ফাইল রূপান্তর করতে পকেটসফিনেক্স ব্যবহার করতে পারেন । এই দুটি আদেশ অবশ্যই কাজটি করবে do প্রথমে আপনি ফাইলটিকে প্রয়োজনীয় ফর্ম্যাটে রূপান্তর করুন এবং তারপরে আপনি এটি সনাক্ত করতে পারবেন:
ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
রান পকেটসফিনেক্স
pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > result.txt
ফলাফল ফলাফল.txt সংরক্ষণ করা হবে।
speech recognition
এবং voice command
সরঞ্জামের একটি দুর্দান্ত ডেমো রয়েছে : youtube.com/…
pocketsphinx_continuous -infile file.wav -hmm en_US/hub4wsj_sc_8k -lm en_US/hub4.5000.DMP 2> pocketsphinx.log
কাজ। হতে পারে তারা সর্বোত্তম প্যাকেজ নয়, তবে এগুলি সংগ্রহস্থলগুলিতে আমি খুঁজে পেতাম best
আমি জানি এটি পুরানো, তবে নিকোলার উত্তরটি প্রসারিত করতে এবং ভবিষ্যতে কারও পকেটফিনেক্সের একটি আধুনিক সংস্করণ পেতে গিথাব বা সোর্সফোর্জ সংগ্রহস্থল থেকে এটি সঙ্কলন করতে হবে (নিশ্চিত নয়) যা আপ টু ডেট রাখে)। মনে রাখবেন -j8 এর অর্থ সম্ভব হলে সমান্তরালে 8 টি পৃথক কাজ চালান; আপনার যদি আরও সিপিইউ কোর থাকে তবে আপনি সংখ্যাটি বাড়াতে পারবেন।
git clone https://github.com/cmusphinx/sphinxbase.git
cd sphinxbase
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
git clone https://github.com/cmusphinx/pocketsphinx.git
cd pocketsphinx
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
তারপর, থেকে: https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English/
এর সবচেয়ে নতুন সংস্করণ ডাউনলোড cmusphinx-en-us-....tar.gz
এবংen-70k-....lm.gz
tar -xzf cmusphinx-en-us-....tar.gz
gunzip en-70k-....lm.gz
তারপরে আপনি শেষ পর্যন্ত নিকোলয়ের উত্তর থেকে পদক্ষেপগুলি নিয়ে এগিয়ে যেতে পারেন:
ffmpeg -i book.mp3 -ar 16000 -ac 1 book.wav
pocketsphinx_continuous -infile book.wav \
-hmm cmusphinx-en-us-8khz-5.2 -lm en-70k-0.2.lm \
2>pocketsphinx.log >book.txt
স্পিঙ্কস ঠিকঠাক কাজ করে। আমি পাঠ্যের একটি পাঠযোগ্য সংস্করণ তৈরি করার জন্য এটির উপর নির্ভর করব না, তবে এটি যথেষ্ট ভাল যে আপনি যদি কোনও নির্দিষ্ট উদ্ধৃতি সন্ধান করছেন তবে আপনি এটি অনুসন্ধান করতে পারেন। এটি বিশেষত ভাল কাজ করে যদি আপনি জ্যাপিয়ান ( http://www.lesbonscomptes.com/recoll/ ) এর মতো কোনও অনুসন্ধান অ্যালগরিদম ব্যবহার করেন যা ওয়াইল্ডকার্ডগুলি গ্রহণ করে এবং সঠিক অনুসন্ধানের এক্সপ্রেশনগুলির প্রয়োজন হয় না।
আশাকরি এটা সাহায্য করবে.
pocketsphinx_continuous: error while loading shared libraries: libpocketsphinx.so.3: cannot open shared object file: No such file or directory
-------> export LD_LIBRARY_PATH=/usr/local/lib
------->export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
আমি আপনাকে বক্তৃতাটিকে পাঠ্যে রূপান্তর করতে চাইছি আপনি নিজের উবুন্টু সফ্টওয়্যার কেন্দ্র খোলার চেষ্টা করতে পারেন এবং জুলিয়াসের সন্ধান করতে পারেন
বিবরণ
"জুলিয়াস" উচ্চ-পারফরম্যান্স, স্পিচ-সম্পর্কিত গবেষক এবং বিকাশকারীদের জন্য দ্বি-পাস বৃহত ভোকাবুলারি অবিচ্ছিন্ন ভাষণ স্বীকৃতি (এলভিসিএসআর) ডিকোডার সফ্টওয়্যার।
বা অন্য একটি বিকল্প যা সফ্টওয়্যার সেন্টারে নেই তা হ'ল সাইমন
... একটি ওপেন-সোর্স স্পিচ সনাক্তকরণ প্রোগ্রাম এবং মাউস এবং কীবোর্ড প্রতিস্থাপন করে।
রেফারেন্স লিংক
http://julius.sourceforge.jp/en_index.php
আপনি স্পিচপ্যাড.পিডাব্লু ট্রান্সক্রিপশন প্যানেল ব্যবহার করতে পারেন