কমান্ড-লাইন ব্যবহার করে টেক্সট-টু-স্পিচ আউটপুট কীভাবে করবেন?


84

কমান্ড-লাইন ব্যবহার করে প্রবেশ করা পাঠ্য থেকে স্পিচ আউটপুট কীভাবে পাবেন ?

সাধারণ কমান্ড ব্যবহার করে স্পিচ রেট, পিচ, ভলিউম ইত্যাদি পরিবর্তন করার সুবিধা ।


উত্তর:


125

অবতীর্ণ জনপ্রিয়তার ক্রম :

  • বলে শ্রবণযোগ্য বক্তৃতা GNUstep বক্তৃতা ইঞ্জিন ব্যবহার পাঠ্য পরিবর্তন করে।

    sudo apt-get install gnustep-gui-runtime
    say "hello"
    
  • উত্সব সাধারণ বহু-ভাষী বক্তৃতা সংশ্লেষ সিস্টেম।

    sudo apt-get install festival
    echo "hello" | festival --tts
    
  • spd-say স্পিচ-প্রেরককে পাঠ্য-থেকে-স্পিচ আউটপুট অনুরোধ প্রেরণ করে

    sudo apt-get install speech-dispatcher
    spd-say "hello"
    
  • espeak একটি বহুভাষিক সফ্টওয়্যার স্পিচ সিনথেসাইজার।

    sudo apt-get install espeak
    espeak "hello"
    

13
spd-say14.04 মধ্যে প্রাক ইনস্টল প্রদর্শিত হবে তা করা এবং পরে: releases.ubuntu.com/trusty/...
সিরো Santilli新疆改造中心法轮功六四事件

3
এছাড়াও sudo pip install gTTS, (গুগল পাঠ্য থেকে স্পিচ / github.com/pndurette/gTTS ) এরপরে gtts-cli "hello" -o hello.mp3আপনি এটিতে পাইপও করতে পারেন mpg123 -gtts-cli "why, hello there" | mpg123 -
এলিজা লিন

দুর্ভাগ্যক্রমে, spd-sayএকসাথে
একবারে টিটিএস

@ElijahLynn কাজ করে না
Dims

espeak/ spd-sayমেমসের জন্য সেরা (অন্যরা "মেম" শব্দটি সঠিকভাবে উচ্চারণও করতে পারে না)। শ্রেষ্ঠ আমি বলতে পারি spd-sayব্যবহারসমূহ espeakতার ব্যাকএন্ড হিসাবে (কণ্ঠ একই শব্দ)।
কিওয়ার্টিচৌসকি

18

espeak একটি সুন্দর ছোট সরঞ্জাম।

আমি ঠিক এটির সাথে একটি কমান্ড লাইনে খেলা পছন্দ করি। আপনি এটি পুলসৌদিওর সাথে সাংঘর্ষিক মনে করতে পারেন তাই আমি একটি দীর্ঘ-বায়ুযুক্ত সংস্করণ ব্যবহার করছি যা এটি সঠিকভাবে সেট আপ করতে অস্বীকার করে।

sudo apt-get install espeak
espeak --stdout "this is a test" | paplay

espeak --help পড়ার গতি, পিচ, ভয়েস ইত্যাদি ক্যালিব্রেট করার বিকল্পগুলি আপনাকে প্রদর্শন করবে

আপনি যখন আপনার নোটগুলি করছেন, তাদের পাঠ্য ফাইল হিসাবে সংরক্ষণ করুন এবং তারপরে:

echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"

এরপরে আপনি পিসিএম থেকে এমপি 3 বা ওজিজি এর মতো আরও কিছু ব্যবস্থাপনার থেকে কমপ্রেস করতে ffmeg et al এর সাথে চারপাশে খেলতে পারেন। তবে এটি আলাদা গল্প।


1
খুব সুন্দর, কেউ গ্রাফিক ইউজার ইন্টারফেসটি এসপ্যাক, এস্পিক-গুইতেও দেখতে পারেন।
সবাকন

14

থেকে man spd-say:

NAME এর
       spd-say - পাঠ্য-থেকে-স্পিচ আউটপুট অনুরোধটি স্পিচ-প্রেরককে প্রেরণ করুন

সংক্ষিপ্তসার
       spd-say [অপশন] "কিছু পাঠ্য"

বর্ণনা
       এসপিডি-বলুন বক্তৃতা-প্রেরণকারী প্রক্রিয়াতে পাঠ্য থেকে স্পিচ আউটপুট অনুরোধ প্রেরণ করে যা এটি পরিচালনা করে এবং ফলাফলটি ফলাফলকে আউটপুট দেয়
       অডিও সিস্টেমে।

পছন্দসমূহ
       -আর, --রেট
              কথার হার নির্ধারণ করুন (-100 এবং +100 এর মধ্যে, ডিফল্ট: 0)

       -পি, - পিচ
              স্পিচটির পিচ সেট করুন (-100 এবং +100 এর মধ্যে, ডিফল্ট: 0)

       -আই, - ভলিউম
              কথার ভলিউম (তীব্রতা) সেট করুন (-100 এবং +100 এর মধ্যে, ডিফল্ট: 0)

অতএব আপনি নিম্নলিখিত কমান্ডের মাধ্যমে পাঠ্য থেকে স্পিচ পেতে পারেন:

spd-say "<type text>"

উদা:

spd-say "Welcome to Ubuntu Linux"

আপনি স্পিচ রেট, পিচ, ভলিউম ইত্যাদি সেট করতে পারেন ম্যান পৃষ্ঠাটি দেখুন।


3
spd-say -t female2 "text"এটি সহনীয় করে তোলে
সর্পডিয়োডগ

6

১১.১০ সাল থেকে এমব্রোলা কাজ করে না।

এসভিওএক্স (পিকো) সরঞ্জামগুলি ইনস্টল করা সহজ, ব্যবহার করা সহজ এবং উবুন্টুতে ভাল মানের ভয়েস নিয়ে আসে। এটি ইনস্টল করুন:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

আরও সহজ, আপনি "পঠন পাঠ্য" এক্সটেনশনটি ইনস্টল করে এসভিওএক্স (পিকো) সরঞ্জামগুলির সাথে লিবারে অফিস ব্যবহার করতে পারেন এবং এই দুর্দান্ত টিটিএস সফ্টওয়্যারটির জন্য আপনি একটি "জিইউআই" পান:

সরঞ্জামগুলি সহ অ্যাড-অনস - পঠন পাঠ্য এক্সটেনশনের বিকল্পগুলি সেট আপ করুন .... বহিরাগত প্রোগ্রাম হিসাবে / usr / বিন / পাইথন ব্যবহার করুন। একটি কমান্ড লাইন বিকল্প নির্বাচন করুন যাতে টোকেন (PICO_READ_TEXT_PY) অন্তর্ভুক্ত রয়েছে।


4

পাইথন গুগল স্পীচ:

pip install google_speech

google_speech "Test the hello world"

অ্যান্ড্রয়েড থেকে স্বভক্স:

apt-get install svox-pico

pico2wave --wave=test.wav "Test the hello world"
play test.wav

স্বভক্স ন্যানোটস:

git clone https://github.com/gmn/nanotts.git
cd nanotts
make

./nanotts -v en-US "Test the hello world"

লিঙ্কস - উইকি:

স্পিচ সিনথেসাইজারগুলির তুলনা


1
ইনস্টল এবং ব্যবহার করা google_speechউবুন্টু 18.04 আমি ইনস্টল করার ছিল উপর python3-pipএবং libsox-fmt-mp3এবং ব্যবহার pip3 install google_speech
আর্টেম

3

আর এখনও অন্য eSpeak GUI: gespeaker। এটি উভয় espeakএবং mbrolaইঞ্জিন ব্যবহার করে । এছাড়াও, এটির তুলনায় আরও বিকল্প রয়েছে espeak-gui


3

নিম্নলিখিতটি কোনও FLOSS সমাধান নয়, তবে আপনি এটি সার্থক হতে পারেন। (এটি একটি ওয়াইন সমাধান),

আমি ব্যক্তিগতভাবে টিটিএসের প্রতি খুব আগ্রহী, আমি এটি প্রায়শই ব্যবহার করি ... যেমন। একটি দুরন্ত বক্তৃতা শুনছি যা আমি কখনই অন্যরকমের সাথে লেগে থাকতে বিরক্ত করব না (কারণ আমার আরও একটি কাপ কফি পান করা দরকার ... :)

কয়েকটি জিনিস আমি পথ ধরে আবিষ্কার করেছি .. বা আমি কী বলতে পারি, যে জিনিসগুলি আমি পথে আবিষ্কার করি নি ... কথায় কথায় বলতে হবে: FOSS TTS ভয়েস সফ্টওয়্যারটির প্রতিটি অংশ আমি চেষ্টা করেছি এবং তাই যে কোনও আধা-দীর্ঘায়িত শোনার জন্য অনুপযুক্ত ...

আমি বর্তমানে এটিএনটির ন্যাচারালভয়েস ব্যবহার করি। এটি কেবল উইন্ডোজের জন্য (সম্ভবত ম্যাক) উপলভ্য, তবে এটি wineউবুন্টুতে চলতে পারে .. (এটির মাইনাল গ্লিচ রয়েছে, যেখানে আমি পাঠক থেকে দূরে সরে যাওয়ার সময় প্যানেলটিতে ক্লিক করতে হয় ... এটি একটি ছোটখাটো নেটওয়ালওয়য়েসের কাছ থেকে বক্তৃতার মানের দ্বারা লাভিত সুবিধার সাথে তুলনা করলে ইস্যু করুন।

অর্ধ-বোধগম্য শ্রবণ অভিজ্ঞতার জন্য আমি অন্য কিছু জিনিস কার্যত অপরিহার্য বলে মনে করেছি, সেগুলি ... ...

  1. এই টিটিএস প্রগামাগুলি বুদ্ধিমান নয় (তাত্ক্ষণিকভাবে তরুণ বুনুনের মতো বুদ্ধিমান) .. তাই তাদের পেতে পারে এমন প্রতিটি বিট সহায়তা প্রয়োজন। এবং একটি আছে (এবং কেবলমাত্র একটি রিডার প্রোগ্রাম আমি পেয়েছি যা এটি এতে ব্যাপক সহায়তা করে .. অ্যাপটিকে বলা হয় ReadPlease (2003 Pro)... এটি আপনাকে শব্দগুলির শব্দের এবং গোষ্ঠীগুলিকে বিশেষভাবে সংশোধন করার অনুমতি দেয় যাতে আপনি এটি চান হিসাবে উচ্চারণ করা যায় ... এটি এটি কোনওভাবেই নিখুঁত নয়, তবে আমার জন্য এটি পুরো প্রক্রিয়াটি ব্যবহারযোগ্য এবং ব্যবহারযোগ্য না হওয়ার মধ্যে পার্থক্য তৈরি করেছে ...

  2. প্রাকৃতিক ভয়েসেসের ভাষণটি "ঠিক আছে" তবে এটি কিছুটা বিরক্তিকর। অন্যান্য ভাল পণ্যগুলিও রয়েছে, তবে সেগুলি উইন্ডোজের জন্য, দুর্ভাগ্যক্রমে) ..
    এটি কখনও কখনও অবাক করে দেয় খুব ভাল .. তবে ওএমজি, প্রথমদিকে এটি ব্যথা! .. সুতরাং # 2 হ'ল * ধৈর্য ... এবং আপনার "বিশেষ শব্দ" তালিকার প্রচুর আপডেট করা হচ্ছে ... ধৈর্য ধরে আমি বলতে চাইছি আপনি (আমি) আসলে আমার বিশেষ বাবুনের বক্তৃতার ধরণগুলিতে অভ্যস্ত হয়েছি:) ... এবং উপায়, আমার কাছে প্রায় 3000 শব্দ রয়েছে যা এখন "মানব" হিসাবে যথেষ্ট শোনায় যে আমি যখন সেগুলি শুনি তখন আর আর সঙ্কুচিত হই না।

    3 .. "বাউন্সিং বল অনুসরণ করুন" ... আবার কারণ প্রকৃত স্পিকারের মতো কণ্ঠস্বরটি কখনও ভাল হয় না, তাই বিষয়গুলিকে মাঝে মাঝে পরিষ্কার করা প্রয়োজন। আমি যে রিডার প্রোগ্রামটি ব্যবহার করি তার একটি বৈশিষ্ট্য রয়েছে যার জন্য আমি এমনকি এর চতুর চেহারার ইন্টারফেসও রেখেছি .... এটি একটি "বর্তমানে পঠনযোগ্য নির্বাচন করা হচ্ছে" শব্দের বিকল্পটি রয়েছে .. অনেক পাঠকই এগুলি রাখেন, তবে রিডপ্লেইস বর্তমান লাইনে ব্যঙ্গ রাখে পর্দার কেন্দ্র .. আপনি যা মিস করেছেন তা দ্রুত পুনরায় পড়তে সামনে এবং পিছনে দেখতে সক্ষম হওয়া এটি অমূল্য (তাই নিরাময়কারী রেখাটি স্বয়ংক্রিয়ভাবে কেন্দ্র করে নেওয়া ভাল) ...

ওয়েল এটি আমার অভিজ্ঞতা .. আমি এখন একটি কফি তৈরি করতে যাচ্ছি, এবং এটি করার সময় আমি এটি শুনব, এটি কীভাবে "পড়ছে" তা দেখার জন্য .... টিটিএস অবাক করার জন্য দুর্দান্ত টাইপো (আমি প্রচুর টাইপো তৈরি করি) ...

এটিএনটি ন্যাচারালভয়েসের মতো ভাল কিছু যদি উবুন্টু সংগ্রহস্থলের উপরে উঠে যায় তবে আমি এদিকে ঝাঁপিয়ে পড়ব।

প্রাকৃতিক ভয়েসেসের কয়েকটি নমুনার লিঙ্কটি এখানে : আমি "মাইক" ব্যবহার করি


3

এসভিওক্স পিকো 2 ওয়েভ

এটাই আমি ব্যবহার করি। এবং এটি স্বাভাবিক বলে মনে হচ্ছে, এটি বোঝা সহজ, এটি ইউনিটগুলি (মি, ডিগ্রি সেন্টিগ্রেড, কেজি, ...) সনাক্ত করে

পিকোওয়েভে আমার প্রথম পোস্ট এখানে

স্পিচ থেকে প্রাকৃতিক সাউন্ডিং পাঠ্য?

আপনার যা করতে হবে তা হ'ল:

উবুন্টু সফটওয়্যার সেন্টারে যান এবং "পিকো" অনুসন্ধান করুন। আপনি "ছোট পদাঙ্ক লিংগ ..." এর সাথে 4 বা 5 টি এন্ট্রি পাবেন। সেগুলি ইনস্টল করুন।

পিকোওয়েভের সম্ভাব্য ব্যবহারটি আমার প্রথম পোস্টে বর্ণিত হয়েছে (উপরের লিঙ্কটি অনুসরণ করুন)।

বিদায়


আমি আপনার উপায়টি ব্যবহার করেছি আপনি কীভাবে আপনার
উপায়টি

3

জন্য festival(ভয়েস আমাকে আরও স্বাভাবিক বলে মনে হয়):

sudo apt-get install festival

echo "hello" | festival --tts

পিচ এবং গতির কনফিগারেশন:

তৈরি করুন ~/.festivalrc:

(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100") (Parameter.set 'Audio_Method 'Audio_Command)

Http://www.solomonson.com/content/ubuntu-linux-text-speech দেখুন

আপডেট: অন্য উবুন্টু কম্পিউটারে চেষ্টা করা হয়েছে। উত্সবটি সঠিকভাবে কাজ করার জন্য ইংরাজী স্পিচ ইঞ্জিন প্যাকেজটি ইনস্টল করতে হয়েছিল:

sudo apt-get install festvox-kallpc16k

এছাড়াও playএকটি ক্লাইম কমান্ড যা soxপ্যাকেজ সহ আসে :

sudo apt-get install sox


2

যদিও আপনি ইতিমধ্যে একটি উত্তর গ্রহণ করেছেন, আমি উল্লেখ করতে চেয়েছিলাম festival, যা আমি খুব পছন্দ করি। উবুন্টু ফোরামের এই পোস্টে এর জন্য খুব সুন্দর ভয়েস সেট আপ করার বিষয়ে প্রচুর তথ্য রয়েছে।


2

মিলিত হন espeak-ng- একটি বহুভাষিক সফ্টওয়্যার স্পিচ সিনথেসাইজার:

espeak-ng "text to read"
espeak-ng -f "~/file to read"

এটি একটি ডিফল্ট ইংলিশ ভয়েস ব্যবহার করে তবে অন্যান্য ভাষা এবং এমনকি উপভাষাগুলির জন্য অসংখ্য অন্যান্য ভয়েস রয়েছে এবং espeak-ng --voices(সকলের জন্য) বা উদাহরণস্বরূপ espeak-ng --voices=en(ইংরাজির জন্য ) তালিকাভুক্ত করা যেতে পারে । -vভাষা সংক্ষেপণ বা ফাইলের নামের সাথে এগুলি একসাথে সেট করা যেতে পারে , যেমন স্কটিশ বা সোয়াহিলি:

espeak-ng -v en-gb-scotland "text to read" # language name
espeak-ng -v bnt/sw "text to read" # file name: “bnt” for Bantu, “sw” for Swahili

আরও অনেক অপশন উপলব্ধ রয়েছে, উদাহরণস্বরূপ -sগতির জন্য এবং -wএকটি ওয়েভ ফাইলে আউটপুট লিখতে নীচে লিঙ্কিত ম্যানপেজটি দেখুন।

আরও পড়া

espeak-ng("পরবর্তী প্রজন্মের জন্য" "এনজি") মূল espeakস্পিচ সিনথেসাইজার সফ্টওয়্যারটির সক্রিয়ভাবে বিকশিত কাঁটাচামচ , উইকিপিডিয়ায় ইতিহাস অধ্যায়টি দেখুন । উভয়ই প্যাকেজের মাধ্যমে espeakবা espeak-ngযথাক্রমে সরকারী উত্স থেকে উপলব্ধ ।


0

ওয়াইনের অধীনে বালাবোলকা এসএপিআই 4 ভয়েসেসের সাথে (আমার জন্য) ভাল কাজ করে (এসপিআই 5 ভয়েসগুলি আমার লিনাক্স সিস্টেমে সনাক্ত করা যায় না)। এটি ফাইলগুলি খুলতে এবং পড়া শুরু করতে পারে।

বালাবোলকায় ওয়াইনের অ্যাপডিবি প্রবেশের লিঙ্কটি এখানে: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859


0

পাঠ্য থেকে অডিও ফাইলগুলি তৈরি করতে জিটিটিএস সরঞ্জামটি দুর্দান্ত। এটি গুগল ট্রান্সলেট এর টেক্সট টু স্পিচ এপিআই ব্যবহার করে এবং এমপি 3 ফাইল তৈরি করে।
এটি pipইনস্টলেশনের জন্য ব্যবহার করে তা দেওয়া , আমি আপনাকে দৃ Min়ভাবে মিনিকোন্ডা ইনস্টল করার পরামর্শ দিচ্ছি এবং তারপরে condaআপনি এমন একটি পরিবেশ তৈরি করতে ব্যবহার করুন যেখানে আপনি জিটিটিএস ইনস্টল করতে পারেন। আপনি এখান থেকে মিনিকোন্ডা ডাউনলোড করতে পারেন:

https://docs.conda.io/en/latest/miniconda.html

জিটিটিএসের জন্য গিটহাবের সংগ্রহস্থলটি হ'ল:

https://github.com/pndurette/gTTS

এবং আপনি এখানে জিটিটিএসের ডকুমেন্টেশনগুলি খুঁজে পেতে পারেন:

https://gtts.readthedocs.io/en/latest/

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.