উত্তর:
অবতীর্ণ জনপ্রিয়তার ক্রম :
বলে শ্রবণযোগ্য বক্তৃতা GNUstep বক্তৃতা ইঞ্জিন ব্যবহার পাঠ্য পরিবর্তন করে।
sudo apt-get install gnustep-gui-runtime
say "hello"
উত্সব সাধারণ বহু-ভাষী বক্তৃতা সংশ্লেষ সিস্টেম।
sudo apt-get install festival
echo "hello" | festival --tts
spd-say স্পিচ-প্রেরককে পাঠ্য-থেকে-স্পিচ আউটপুট অনুরোধ প্রেরণ করে
sudo apt-get install speech-dispatcher
spd-say "hello"
espeak একটি বহুভাষিক সফ্টওয়্যার স্পিচ সিনথেসাইজার।
sudo apt-get install espeak
espeak "hello"
spd-say
14.04 মধ্যে প্রাক ইনস্টল প্রদর্শিত হবে তা করা এবং পরে: releases.ubuntu.com/trusty/...
sudo pip install gTTS
, (গুগল পাঠ্য থেকে স্পিচ / github.com/pndurette/gTTS ) এরপরে gtts-cli "hello" -o hello.mp3
আপনি এটিতে পাইপও করতে পারেন mpg123 -
। gtts-cli "why, hello there" | mpg123 -
।
spd-say
একসাথে
espeak
/ spd-say
মেমসের জন্য সেরা (অন্যরা "মেম" শব্দটি সঠিকভাবে উচ্চারণও করতে পারে না)। শ্রেষ্ঠ আমি বলতে পারি spd-say
ব্যবহারসমূহ espeak
তার ব্যাকএন্ড হিসাবে (কণ্ঠ একই শব্দ)।
espeak
একটি সুন্দর ছোট সরঞ্জাম।
আমি ঠিক এটির সাথে একটি কমান্ড লাইনে খেলা পছন্দ করি। আপনি এটি পুলসৌদিওর সাথে সাংঘর্ষিক মনে করতে পারেন তাই আমি একটি দীর্ঘ-বায়ুযুক্ত সংস্করণ ব্যবহার করছি যা এটি সঠিকভাবে সেট আপ করতে অস্বীকার করে।
sudo apt-get install espeak
espeak --stdout "this is a test" | paplay
espeak --help
পড়ার গতি, পিচ, ভয়েস ইত্যাদি ক্যালিব্রেট করার বিকল্পগুলি আপনাকে প্রদর্শন করবে
আপনি যখন আপনার নোটগুলি করছেন, তাদের পাঠ্য ফাইল হিসাবে সংরক্ষণ করুন এবং তারপরে:
echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"
এরপরে আপনি পিসিএম থেকে এমপি 3 বা ওজিজি এর মতো আরও কিছু ব্যবস্থাপনার থেকে কমপ্রেস করতে ffmeg et al এর সাথে চারপাশে খেলতে পারেন। তবে এটি আলাদা গল্প।
থেকে man spd-say
:
NAME এর spd-say - পাঠ্য-থেকে-স্পিচ আউটপুট অনুরোধটি স্পিচ-প্রেরককে প্রেরণ করুন সংক্ষিপ্তসার spd-say [অপশন] "কিছু পাঠ্য" বর্ণনা এসপিডি-বলুন বক্তৃতা-প্রেরণকারী প্রক্রিয়াতে পাঠ্য থেকে স্পিচ আউটপুট অনুরোধ প্রেরণ করে যা এটি পরিচালনা করে এবং ফলাফলটি ফলাফলকে আউটপুট দেয় অডিও সিস্টেমে। পছন্দসমূহ -আর, --রেট কথার হার নির্ধারণ করুন (-100 এবং +100 এর মধ্যে, ডিফল্ট: 0) -পি, - পিচ স্পিচটির পিচ সেট করুন (-100 এবং +100 এর মধ্যে, ডিফল্ট: 0) -আই, - ভলিউম কথার ভলিউম (তীব্রতা) সেট করুন (-100 এবং +100 এর মধ্যে, ডিফল্ট: 0)
অতএব আপনি নিম্নলিখিত কমান্ডের মাধ্যমে পাঠ্য থেকে স্পিচ পেতে পারেন:
spd-say "<type text>"
উদা:
spd-say "Welcome to Ubuntu Linux"
আপনি স্পিচ রেট, পিচ, ভলিউম ইত্যাদি সেট করতে পারেন ম্যান পৃষ্ঠাটি দেখুন।
spd-say -t female2 "text"
এটি সহনীয় করে তোলে
১১.১০ সাল থেকে এমব্রোলা কাজ করে না।
এসভিওএক্স (পিকো) সরঞ্জামগুলি ইনস্টল করা সহজ, ব্যবহার করা সহজ এবং উবুন্টুতে ভাল মানের ভয়েস নিয়ে আসে। এটি ইনস্টল করুন:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
আরও সহজ, আপনি "পঠন পাঠ্য" এক্সটেনশনটি ইনস্টল করে এসভিওএক্স (পিকো) সরঞ্জামগুলির সাথে লিবারে অফিস ব্যবহার করতে পারেন এবং এই দুর্দান্ত টিটিএস সফ্টওয়্যারটির জন্য আপনি একটি "জিইউআই" পান:
সরঞ্জামগুলি সহ অ্যাড-অনস - পঠন পাঠ্য এক্সটেনশনের বিকল্পগুলি সেট আপ করুন .... বহিরাগত প্রোগ্রাম হিসাবে / usr / বিন / পাইথন ব্যবহার করুন। একটি কমান্ড লাইন বিকল্প নির্বাচন করুন যাতে টোকেন (PICO_READ_TEXT_PY) অন্তর্ভুক্ত রয়েছে।
পাইথন গুগল স্পীচ:
pip install google_speech
google_speech "Test the hello world"
অ্যান্ড্রয়েড থেকে স্বভক্স:
apt-get install svox-pico
pico2wave --wave=test.wav "Test the hello world"
play test.wav
স্বভক্স ন্যানোটস:
git clone https://github.com/gmn/nanotts.git
cd nanotts
make
./nanotts -v en-US "Test the hello world"
লিঙ্কস - উইকি:
google_speech
উবুন্টু 18.04 আমি ইনস্টল করার ছিল উপর python3-pip
এবং libsox-fmt-mp3
এবং ব্যবহার pip3 install google_speech
।
নিম্নলিখিতটি কোনও FLOSS সমাধান নয়, তবে আপনি এটি সার্থক হতে পারেন। (এটি একটি ওয়াইন সমাধান),
আমি ব্যক্তিগতভাবে টিটিএসের প্রতি খুব আগ্রহী, আমি এটি প্রায়শই ব্যবহার করি ... যেমন। একটি দুরন্ত বক্তৃতা শুনছি যা আমি কখনই অন্যরকমের সাথে লেগে থাকতে বিরক্ত করব না (কারণ আমার আরও একটি কাপ কফি পান করা দরকার ... :)
কয়েকটি জিনিস আমি পথ ধরে আবিষ্কার করেছি .. বা আমি কী বলতে পারি, যে জিনিসগুলি আমি পথে আবিষ্কার করি নি ... কথায় কথায় বলতে হবে: FOSS TTS ভয়েস সফ্টওয়্যারটির প্রতিটি অংশ আমি চেষ্টা করেছি এবং তাই যে কোনও আধা-দীর্ঘায়িত শোনার জন্য অনুপযুক্ত ...
আমি বর্তমানে এটিএনটির ন্যাচারালভয়েস ব্যবহার করি। এটি কেবল উইন্ডোজের জন্য (সম্ভবত ম্যাক) উপলভ্য, তবে এটি wine
উবুন্টুতে চলতে পারে .. (এটির মাইনাল গ্লিচ রয়েছে, যেখানে আমি পাঠক থেকে দূরে সরে যাওয়ার সময় প্যানেলটিতে ক্লিক করতে হয় ... এটি একটি ছোটখাটো নেটওয়ালওয়য়েসের কাছ থেকে বক্তৃতার মানের দ্বারা লাভিত সুবিধার সাথে তুলনা করলে ইস্যু করুন।
অর্ধ-বোধগম্য শ্রবণ অভিজ্ঞতার জন্য আমি অন্য কিছু জিনিস কার্যত অপরিহার্য বলে মনে করেছি, সেগুলি ... ...
এই টিটিএস প্রগামাগুলি বুদ্ধিমান নয় (তাত্ক্ষণিকভাবে তরুণ বুনুনের মতো বুদ্ধিমান) .. তাই তাদের পেতে পারে এমন প্রতিটি বিট সহায়তা প্রয়োজন। এবং একটি আছে (এবং কেবলমাত্র একটি রিডার প্রোগ্রাম আমি পেয়েছি যা এটি এতে ব্যাপক সহায়তা করে .. অ্যাপটিকে বলা হয় ReadPlease (2003 Pro)
... এটি আপনাকে শব্দগুলির শব্দের এবং গোষ্ঠীগুলিকে বিশেষভাবে সংশোধন করার অনুমতি দেয় যাতে আপনি এটি চান হিসাবে উচ্চারণ করা যায় ... এটি এটি কোনওভাবেই নিখুঁত নয়, তবে আমার জন্য এটি পুরো প্রক্রিয়াটি ব্যবহারযোগ্য এবং ব্যবহারযোগ্য না হওয়ার মধ্যে পার্থক্য তৈরি করেছে ...
প্রাকৃতিক ভয়েসেসের ভাষণটি "ঠিক আছে" তবে এটি কিছুটা বিরক্তিকর। অন্যান্য ভাল পণ্যগুলিও রয়েছে, তবে সেগুলি উইন্ডোজের জন্য, দুর্ভাগ্যক্রমে) ..
এটি কখনও কখনও অবাক করে দেয় খুব ভাল .. তবে ওএমজি, প্রথমদিকে এটি ব্যথা! .. সুতরাং # 2 হ'ল * ধৈর্য ... এবং আপনার "বিশেষ শব্দ" তালিকার প্রচুর আপডেট করা হচ্ছে ... ধৈর্য ধরে আমি বলতে চাইছি আপনি (আমি) আসলে আমার বিশেষ বাবুনের বক্তৃতার ধরণগুলিতে অভ্যস্ত হয়েছি:) ... এবং উপায়, আমার কাছে প্রায় 3000 শব্দ রয়েছে যা এখন "মানব" হিসাবে যথেষ্ট শোনায় যে আমি যখন সেগুলি শুনি তখন আর আর সঙ্কুচিত হই না।
3 .. "বাউন্সিং বল অনুসরণ করুন" ... আবার কারণ প্রকৃত স্পিকারের মতো কণ্ঠস্বরটি কখনও ভাল হয় না, তাই বিষয়গুলিকে মাঝে মাঝে পরিষ্কার করা প্রয়োজন। আমি যে রিডার প্রোগ্রামটি ব্যবহার করি তার একটি বৈশিষ্ট্য রয়েছে যার জন্য আমি এমনকি এর চতুর চেহারার ইন্টারফেসও রেখেছি .... এটি একটি "বর্তমানে পঠনযোগ্য নির্বাচন করা হচ্ছে" শব্দের বিকল্পটি রয়েছে .. অনেক পাঠকই এগুলি রাখেন, তবে রিডপ্লেইস বর্তমান লাইনে ব্যঙ্গ রাখে পর্দার কেন্দ্র .. আপনি যা মিস করেছেন তা দ্রুত পুনরায় পড়তে সামনে এবং পিছনে দেখতে সক্ষম হওয়া এটি অমূল্য (তাই নিরাময়কারী রেখাটি স্বয়ংক্রিয়ভাবে কেন্দ্র করে নেওয়া ভাল) ...
ওয়েল এটি আমার অভিজ্ঞতা .. আমি এখন একটি কফি তৈরি করতে যাচ্ছি, এবং এটি করার সময় আমি এটি শুনব, এটি কীভাবে "পড়ছে" তা দেখার জন্য .... টিটিএস অবাক করার জন্য দুর্দান্ত টাইপো (আমি প্রচুর টাইপো তৈরি করি) ...
এটিএনটি ন্যাচারালভয়েসের মতো ভাল কিছু যদি উবুন্টু সংগ্রহস্থলের উপরে উঠে যায় তবে আমি এদিকে ঝাঁপিয়ে পড়ব।
প্রাকৃতিক ভয়েসেসের কয়েকটি নমুনার লিঙ্কটি এখানে : আমি "মাইক" ব্যবহার করি
এসভিওক্স পিকো 2 ওয়েভ
এটাই আমি ব্যবহার করি। এবং এটি স্বাভাবিক বলে মনে হচ্ছে, এটি বোঝা সহজ, এটি ইউনিটগুলি (মি, ডিগ্রি সেন্টিগ্রেড, কেজি, ...) সনাক্ত করে
পিকোওয়েভে আমার প্রথম পোস্ট এখানে
স্পিচ থেকে প্রাকৃতিক সাউন্ডিং পাঠ্য?
আপনার যা করতে হবে তা হ'ল:
উবুন্টু সফটওয়্যার সেন্টারে যান এবং "পিকো" অনুসন্ধান করুন। আপনি "ছোট পদাঙ্ক লিংগ ..." এর সাথে 4 বা 5 টি এন্ট্রি পাবেন। সেগুলি ইনস্টল করুন।
পিকোওয়েভের সম্ভাব্য ব্যবহারটি আমার প্রথম পোস্টে বর্ণিত হয়েছে (উপরের লিঙ্কটি অনুসরণ করুন)।
বিদায়
জন্য festival
(ভয়েস আমাকে আরও স্বাভাবিক বলে মনে হয়):
sudo apt-get install festival
echo "hello" | festival --tts
পিচ এবং গতির কনফিগারেশন:
তৈরি করুন ~/.festivalrc
:
(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100")
(Parameter.set 'Audio_Method 'Audio_Command)
Http://www.solomonson.com/content/ubuntu-linux-text-speech দেখুন
আপডেট: অন্য উবুন্টু কম্পিউটারে চেষ্টা করা হয়েছে। উত্সবটি সঠিকভাবে কাজ করার জন্য ইংরাজী স্পিচ ইঞ্জিন প্যাকেজটি ইনস্টল করতে হয়েছিল:
sudo apt-get install festvox-kallpc16k
এছাড়াও play
একটি ক্লাইম কমান্ড যা sox
প্যাকেজ সহ আসে :
sudo apt-get install sox
যদিও আপনি ইতিমধ্যে একটি উত্তর গ্রহণ করেছেন, আমি উল্লেখ করতে চেয়েছিলাম festival
, যা আমি খুব পছন্দ করি। উবুন্টু ফোরামের এই পোস্টে এর জন্য খুব সুন্দর ভয়েস সেট আপ করার বিষয়ে প্রচুর তথ্য রয়েছে।
মিলিত হন espeak-ng
- একটি বহুভাষিক সফ্টওয়্যার স্পিচ সিনথেসাইজার:
espeak-ng "text to read"
espeak-ng -f "~/file to read"
এটি একটি ডিফল্ট ইংলিশ ভয়েস ব্যবহার করে তবে অন্যান্য ভাষা এবং এমনকি উপভাষাগুলির জন্য অসংখ্য অন্যান্য ভয়েস রয়েছে এবং espeak-ng --voices
(সকলের জন্য) বা উদাহরণস্বরূপ espeak-ng --voices=en
(ইংরাজির জন্য ) তালিকাভুক্ত করা যেতে পারে । -v
ভাষা সংক্ষেপণ বা ফাইলের নামের সাথে এগুলি একসাথে সেট করা যেতে পারে , যেমন স্কটিশ বা সোয়াহিলি:
espeak-ng -v en-gb-scotland "text to read" # language name
espeak-ng -v bnt/sw "text to read" # file name: “bnt” for Bantu, “sw” for Swahili
আরও অনেক অপশন উপলব্ধ রয়েছে, উদাহরণস্বরূপ -s
গতির জন্য এবং -w
একটি ওয়েভ ফাইলে আউটপুট লিখতে নীচে লিঙ্কিত ম্যানপেজটি দেখুন।
espeak-ng
("পরবর্তী প্রজন্মের জন্য" "এনজি") মূল espeak
স্পিচ সিনথেসাইজার সফ্টওয়্যারটির সক্রিয়ভাবে বিকশিত কাঁটাচামচ , উইকিপিডিয়ায় ইতিহাস অধ্যায়টি দেখুন । উভয়ই প্যাকেজের মাধ্যমে espeak
বা espeak-ng
যথাক্রমে সরকারী উত্স থেকে উপলব্ধ ।
ওয়াইনের অধীনে বালাবোলকা এসএপিআই 4 ভয়েসেসের সাথে (আমার জন্য) ভাল কাজ করে (এসপিআই 5 ভয়েসগুলি আমার লিনাক্স সিস্টেমে সনাক্ত করা যায় না)। এটি ফাইলগুলি খুলতে এবং পড়া শুরু করতে পারে।
বালাবোলকায় ওয়াইনের অ্যাপডিবি প্রবেশের লিঙ্কটি এখানে: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859
পাঠ্য থেকে অডিও ফাইলগুলি তৈরি করতে জিটিটিএস সরঞ্জামটি দুর্দান্ত। এটি গুগল ট্রান্সলেট এর টেক্সট টু স্পিচ এপিআই ব্যবহার করে এবং এমপি 3 ফাইল তৈরি করে।
এটি pip
ইনস্টলেশনের জন্য ব্যবহার করে তা দেওয়া , আমি আপনাকে দৃ Min়ভাবে মিনিকোন্ডা ইনস্টল করার পরামর্শ দিচ্ছি এবং তারপরে conda
আপনি এমন একটি পরিবেশ তৈরি করতে ব্যবহার করুন যেখানে আপনি জিটিটিএস ইনস্টল করতে পারেন। আপনি এখান থেকে মিনিকোন্ডা ডাউনলোড করতে পারেন:
https://docs.conda.io/en/latest/miniconda.html
জিটিটিএসের জন্য গিটহাবের সংগ্রহস্থলটি হ'ল:
https://github.com/pndurette/gTTS
এবং আপনি এখানে জিটিটিএসের ডকুমেন্টেশনগুলি খুঁজে পেতে পারেন: