এমপি 3 কে পাঠ্যে রূপান্তর করতে স্পিচ-রিকগনিশন অ্যাপ?


27

অডিওকে পাঠ্যে রূপান্তর করতে পারে এমন কোনও অ্যাপ্লিকেশন সম্পর্কে কেউ কি জানেন? আমি উবুন্টু 12.04 এলটিএস চালাচ্ছি।


আমি ধরে নিলাম এটি কথ্য পাঠ্য। সেই পাঠ্যটি কোন ভাষায় রয়েছে?
মার্টিন উডিং

স্পিচ টেক্সটটি সহজ ইংরেজী।
কোপানো

উত্তর:


21

আপনি যে সফ্টওয়্যারটি ব্যবহার করতে পারবেন তা হ'ল সিএম ইউএসফিনেক্স । অন্য উত্তরে প্রস্তাবিত হিসাবে পৃথক জুলিয়াস উপযুক্ত নয় কারণ এর জন্য মডেল প্রয়োজন। জুলিয়াসের জন্য বৃহত ভোকাবুলারি বক্তৃতা স্বীকৃতির মডেলগুলি উপলভ্য নয়।

আপনি অডিও ফাইল রূপান্তর করতে পকেটসফিনেক্স ব্যবহার করতে পারেন । এই দুটি আদেশ অবশ্যই কাজটি করবে do প্রথমে আপনি ফাইলটিকে প্রয়োজনীয় ফর্ম্যাটে রূপান্তর করুন এবং তারপরে আপনি এটি সনাক্ত করতে পারবেন:

ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

রান পকেটসফিনেক্স

pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > result.txt

ফলাফল ফলাফল.txt সংরক্ষণ করা হবে।


এছাড়াও, এই উত্তরের সংযোজন হিসাবে, এখানে উভয় speech recognitionএবং voice commandসরঞ্জামের একটি দুর্দান্ত ডেমো রয়েছে : youtube.com/…
দাইথ

আপনি কীভাবে সিস্টেমে অ্যাকোস্টিক মডেল যুক্ত করবেন?
জার্নো

আপনি কেবল এটি ডাউনলোড করে আনপ্যাক করুন, "সিস্টেমে অ্যাড করুন"
নিকোলে শ্মেরেভ

@ নিকোলেশ্মিরেভ আমি পকেটসফিনেক্স_কন্টিনিয়াস এটি খুঁজে পেলাম তবে আমি এটি কোথায় আনপ্যাক করব?
জার্নো

4
ঠিক আছে, আমি উবুন্টু 14.04 এর মহাবিশ্বের ভাণ্ডারে পকেটসফিনেক্স-ইউসস, পকেটসফিনেক্স-এইচএম-এন-হাব 4 উইজ এবং পকেটসফিনেক্স-এলএম-এন-হাব 4 প্যাকেজ ইনস্টল করেছি। তারপর pocketsphinx_continuous -infile file.wav -hmm en_US/hub4wsj_sc_8k -lm en_US/hub4.5000.DMP 2> pocketsphinx.logকাজ। হতে পারে তারা সর্বোত্তম প্যাকেজ নয়, তবে এগুলি সংগ্রহস্থলগুলিতে আমি খুঁজে পেতাম best
জার্নো

12

আমি জানি এটি পুরানো, তবে নিকোলার উত্তরটি প্রসারিত করতে এবং ভবিষ্যতে কারও পকেটফিনেক্সের একটি আধুনিক সংস্করণ পেতে গিথাব বা সোর্সফোর্জ সংগ্রহস্থল থেকে এটি সঙ্কলন করতে হবে (নিশ্চিত নয়) যা আপ টু ডেট রাখে)। মনে রাখবেন -j8 এর অর্থ সম্ভব হলে সমান্তরালে 8 টি পৃথক কাজ চালান; আপনার যদি আরও সিপিইউ কোর থাকে তবে আপনি সংখ্যাটি বাড়াতে পারবেন।

git clone https://github.com/cmusphinx/sphinxbase.git
cd sphinxbase
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
git clone https://github.com/cmusphinx/pocketsphinx.git
cd pocketsphinx
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..

তারপর, থেকে: https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English/ এর সবচেয়ে নতুন সংস্করণ ডাউনলোড cmusphinx-en-us-....tar.gzএবংen-70k-....lm.gz

tar -xzf cmusphinx-en-us-....tar.gz
gunzip en-70k-....lm.gz

তারপরে আপনি শেষ পর্যন্ত নিকোলয়ের উত্তর থেকে পদক্ষেপগুলি নিয়ে এগিয়ে যেতে পারেন:

ffmpeg -i book.mp3 -ar 16000 -ac 1 book.wav
pocketsphinx_continuous -infile book.wav \
    -hmm cmusphinx-en-us-8khz-5.2 -lm en-70k-0.2.lm \
    2>pocketsphinx.log >book.txt

স্পিঙ্কস ঠিকঠাক কাজ করে। আমি পাঠ্যের একটি পাঠযোগ্য সংস্করণ তৈরি করার জন্য এটির উপর নির্ভর করব না, তবে এটি যথেষ্ট ভাল যে আপনি যদি কোনও নির্দিষ্ট উদ্ধৃতি সন্ধান করছেন তবে আপনি এটি অনুসন্ধান করতে পারেন। এটি বিশেষত ভাল কাজ করে যদি আপনি জ্যাপিয়ান ( http://www.lesbonscomptes.com/recoll/ ) এর মতো কোনও অনুসন্ধান অ্যালগরিদম ব্যবহার করেন যা ওয়াইল্ডকার্ডগুলি গ্রহণ করে এবং সঠিক অনুসন্ধানের এক্সপ্রেশনগুলির প্রয়োজন হয় না।

আশাকরি এটা সাহায্য করবে.


4
প্রতিটি জিনিস কবজির মতো কাজ করে তবে আমার ক্ষেত্রে আমাকে ঠিক করার জন্য নিম্নলিখিত কমান্ডটি চালাতে হয়েছিল pocketsphinx_continuous: error while loading shared libraries: libpocketsphinx.so.3: cannot open shared object file: No such file or directory-------> export LD_LIBRARY_PATH=/usr/local/lib------->export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
বিজয় দোহার


11

আমি আপনাকে বক্তৃতাটিকে পাঠ্যে রূপান্তর করতে চাইছি আপনি নিজের উবুন্টু সফ্টওয়্যার কেন্দ্র খোলার চেষ্টা করতে পারেন এবং জুলিয়াসের সন্ধান করতে পারেন

বিবরণ

"জুলিয়াস" উচ্চ-পারফরম্যান্স, স্পিচ-সম্পর্কিত গবেষক এবং বিকাশকারীদের জন্য দ্বি-পাস বৃহত ভোকাবুলারি অবিচ্ছিন্ন ভাষণ স্বীকৃতি (এলভিসিএসআর) ডিকোডার সফ্টওয়্যার।

বা অন্য একটি বিকল্প যা সফ্টওয়্যার সেন্টারে নেই তা হ'ল সাইমন

... একটি ওপেন-সোর্স স্পিচ সনাক্তকরণ প্রোগ্রাম এবং মাউস এবং কীবোর্ড প্রতিস্থাপন করে।

রেফারেন্স লিংক

http://julius.sourceforge.jp/en_index.php

http://sourceforge.net/projects/speech2text/

http://simon-listens.org/index.php?id=122&L=1


1

আপনি স্পিচপ্যাড.পিডাব্লু ট্রান্সক্রিপশন প্যানেল ব্যবহার করতে পারেন

প্রতিলিপি ব্যবহারের ভিডিও দেখুন


এটি দেখতে দুর্দান্ত লাগছে যদিও আমি মনে করি না যে এটি একটি প্রশ্নের উত্তর দেয় যা একটি বিদ্যমান ফাইলের প্রতিলিপি পেতে হয়েছিল। বলা হচ্ছে, আমি স্ফিংসটি চেষ্টা করেছি এবং এটি মারাত্মকভাবে ব্যর্থ হয়েছে ... প্রতিলিপিটি 99.9% ভুল ছিল।
অ্যালেক্সিস উইলক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.