লিনাক্সের জন্য কি কোনও ভাল বক্তৃতা স্বীকৃতি সফটওয়্যার আছে?


49

প্রশ্নের সংক্ষিপ্ত সংস্করণ: আমি একটি বক্তৃতা স্বীকৃতি সফটওয়্যারটি খুঁজছি যা লিনাক্সে চলে এবং এর যথাযথ নির্ভুলতা এবং ব্যবহারযোগ্যতা রয়েছে। যে কোনও লাইসেন্স এবং দাম ঠিক আছে। এটি ভয়েস কমান্ডের মধ্যে সীমাবদ্ধ করা উচিত নয়, কারণ আমি পাঠ্যটি ডিক্ট করতে সক্ষম হতে চাই।


আরো বিস্তারিত:

আমি অসন্তুষ্ট হয়ে নিম্নলিখিত চেষ্টা করেছি:

উপরে উল্লিখিত সমস্ত নেটিভ লিনাক্স সমাধানগুলির যথার্থতা এবং ব্যবহারযোগ্যতা উভয়ই দুর্বল (বা কিছু ফ্রি-টেক্সট স্বীকৃতি দেয় না তবে কেবল ভয়েস কমান্ড দেয়)। নির্ভুলতা দ্বারা, আমি অন্য প্ল্যাটফর্মগুলির জন্য নীচে উল্লিখিত বক্তৃতা স্বীকৃতি সফ্টওয়্যারটির নীচে একটি নির্ভুলতার উল্লেখযোগ্যভাবে বলতে চাই। ওয়াইন + ড্রাগন ন্যাচারালিস্পাইকেটিংয়ের ক্ষেত্রে, আমার অভিজ্ঞতায় এটি ক্রাশ চালিয়ে যায় এবং দুর্ভাগ্যক্রমে আমি এ জাতীয় সমস্যাগুলির মধ্যে একমাত্র বলে মনে করি না।

মাইক্রোসফ্ট উইন্ডোজে আমি ড্রাগন ন্যাচারালিস্পেকিং ব্যবহার করি, অ্যাপল ম্যাক ওএস একাদশে অ্যাপল ডিক্টেশন এবং ড্রাগনডিক্টেট ব্যবহার করি, অ্যান্ড্রয়েডে আমি গুগলের স্পিচ সনাক্তকরণ এবং আইওএস-এ বিল্ট-ইন অ্যাপল স্পিচ স্বীকৃতি ব্যবহার করি।

বাইডু গবেষণা মুক্তি গতকাল কোড ব্যবহার তার কথন শনাক্তকরণ লাইব্রেরির জন্য Connectionist টেম্পোরাল ক্লাসিফিকেশন টর্চ সঙ্গে বাস্তবায়িত। গিগাওমের বেঞ্চমার্কগুলি নীচের স্ক্রিনশটে দেখানো হিসাবে উত্সাহিত করছে, তবে বেশ কয়েকটি কোডিং (এবং একটি বৃহত প্রশিক্ষণের ডেটা সেট) ছাড়াই এটিকে ব্যবহারযোগ্য করে তোলার জন্য আমি কোনও ভাল মোড়ক সম্পর্কে জানি না:

এখানে চিত্র বর্ণনা লিখুন

কিছু খুব আলফা ওপেন সোর্স প্রকল্প রয়েছে:

বক্তৃতা স্বীকৃতি সম্পর্কিত চারুকলার রাজ্যগুলি এবং সাম্প্রতিক ফলাফলগুলি (গ্রন্থপঞ্জি) এর ট্র্যাকিংয়ের এই প্রচেষ্টা সম্পর্কে আমি অবগত aware পাশাপাশি বিদ্যমান স্পিচ সনাক্তকরণ APIs এর এই মানদণ্ড


আমি আনিয়া সম্পর্কে সচেতন , যা একটি কম্পিউটারে ড্রাগনফ্লাইয়ের মাধ্যমে বক্তৃতা স্বীকৃতিটিকে অন্য কম্পিউটারে ইভেন্টগুলি প্রেরণে অনুমতি দেয়, তবে এতে কিছুটা বিলম্বিত মূল্য রয়েছে:

এখানে চিত্র বর্ণনা লিখুন

আমি বক্তৃতা স্বীকৃতির জন্য লিনাক্স বিকল্পটি অন্বেষণ করে এই দুটি আলোচনা সম্পর্কেও সচেতন:


2
আপনি "অসন্তুষ্ট" কী পেয়েছেন সে সম্পর্কে কিছু বিশদ আপনার অন্যথায় আকর্ষণীয় তবে সাধারণ পোস্টিংয়ের বিষয়টিকে এগিয়ে নিয়ে যেতে পারে। উদাহরণস্বরূপ: "ওয়াইন + ড্রাগন ন্যাচারালিস্পাইকিং" সংমিশ্রণটি সম্পর্কে বিশেষত কী আপনি অসন্তুষ্ট হয়েছেন? (কীভাবে এটি আপনার উইন্ডোজ অভিজ্ঞতার প্রতিলিপি দিতে ব্যর্থ হয়েছিল?)
থিওফ্রাস্টাস

1
@ থিফ্রাস্টাস মূলত সমস্ত নেটিভ লিনাক্স সমাধানের যথাযথতা এবং ব্যবহারযোগ্যতা উভয়ই কম। নির্ভুলতার দ্বারা, আমি অন্য প্ল্যাটফর্মগুলির জন্য আমি যে বক্তৃতা স্বীকৃতি সফটওয়্যারটি উল্লেখ করেছি তার নীচে একটি নির্ভুলতা উল্লেখযোগ্যভাবে বোঝাচ্ছি। ওয়াইন + ড্রাগন ন্যাচারালিস্পাইকেটিংয়ের ক্ষেত্রে, আমার অভিজ্ঞতায় এটি ক্রাশ অব্যাহত রেখেছে, এবং দুর্ভাগ্যক্রমে আমি এ জাতীয় সমস্যাগুলি একমাত্র বলে মনে করি না ( appdb.winehq.org/… )
ফ্রাঙ্ক ডারননকোর্ট

1
: আমি এই চেষ্টা করেছি, কিন্তু আবার যদি কেউ এটা দরকারী খুঁজে বের করে github.com/Uberi/speech_recognition এবং jasperproject.github.io এবং github.com/benoitfragit/google2ubuntu
হ্যাটসেপসাট

এই সফ্টওয়্যারগুলির মধ্যে একটিতে কি কমান্ড-লাইন সরঞ্জাম রয়েছে? Xdotool ( github.com/jordansissel/xdotool ) বা xsendkey ( github.com/kyoto/sendkeys ) এর মতো কী-চাপ এবং মাউসমেভ সরঞ্জামটির সাথে বক্তৃতা স্বীকৃতিটি একত্রিত করা খুব আকর্ষণীয় হবে ।
ব্যাপটেক্স

উত্তর:


13

এই মুহুর্তে আমি আমার অ্যান্ড্রয়েড স্মার্টফোনে গুগল স্পিচ স্বীকৃতির সাথে কেডিএ কানেক্ট ব্যবহার করে পরীক্ষা করছি।

কেডিএ কানেক্ট আপনাকে অ্যান্ড্রয়েড ডিভাইসটিকে আপনার লিনাক্স কম্পিউটারের জন্য একটি ইনপুট ডিভাইস হিসাবে ব্যবহার করতে দেয় (কিছু অন্যান্য বৈশিষ্ট্যও রয়েছে)। আপনাকে আপনার স্মার্টফোন / ট্যাবলেটে গুগল প্লে স্টোর থেকে কেডি কানেক্ট অ্যাপটি ইনস্টল করতে হবে এবং আপনার লিনাক্স কম্পিউটারে কেডেকনেক্ট এবং সূচক-কেডেকনেক্ট উভয়ই ইনস্টল করতে হবে। উবুন্টু সিস্টেমগুলির জন্য ইনস্টলটি নিম্নরূপ:

sudo add-apt-repository ppa:vikoadi/ppa
sudo apt update
sudo apt install kdeconnect indicator-kdeconnect

এই ইনস্টলেশনটির খারাপ দিকটি হ'ল এটি যদি কেডিপি ডেস্কটপ পরিবেশ ব্যবহার না করে তবে আপনার প্রয়োজন নেই এমন একটি পিডিএ প্যাকেজ ইনস্টল করে।

একবার আপনি আপনার অ্যান্ড্রয়েড ডিভাইসটিকে আপনার কম্পিউটারের সাথে জুড়ে ফেললে (তাদের একই নেটওয়ার্কে থাকতে হবে) আপনি অ্যান্ড্রয়েড কীবোর্ড ব্যবহার করতে পারেন এবং তারপরে গুগল স্পিচ সনাক্তকরণ ব্যবহার করতে মাইকে ক্লিক / চাপতে পারেন। আপনি কথা বলার সাথে সাথে পাঠ্য উপস্থিত হতে শুরু করবে যেখানে আপনার লিনাক্স কম্পিউটারে আপনার কার্সারটি সক্রিয় থাকে।

ফলাফল হিসাবে, তারা আমার জন্য কিছুটা মিশ্রিত কারণ আমি বর্তমানে কিছু প্রযুক্তিগত অ্যাস্ট্রো ফিজিক্স ডকুমেন্ট লিখছি এবং গুগল স্পিচ স্বীকৃতি আপনি সাধারণত পড়েন না এমন জার্গনের সাথে লড়াই করছে। এটিকে বিরামচিহ্ন বা সঠিক মূলধনটি নির্ধারণ সম্পর্কে ভুলেও যান।

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন



3

আরও একটি লিনাক্সার হিসাবে দরকারী স্পিচ-টু-টেক্সট (ডিক্টেশন) প্রোগ্রাম সন্ধান করার জন্য, আমি স্পিচপ্যাড.পিডাব্লুতে একবার দেখেছি:

  • এটি আমার মাতৃভাষাকে খুব ভাল করে চিনে
  • এটি দ্রুত এবং খুব নির্ভরযোগ্য কাজ করে

downsides:

  • অবশ্যই এটি গুগলের মালিকানাধীন এবং বন্ধ সফ্টওয়্যার
  • একটি গুগল পরিষেবা আপনার কথা বলার প্রতিটি শব্দ শোনার, প্রক্রিয়াকরণ করার জন্য এবং কল্পনা করে
  • অডিও এবং পাঠ্য প্রক্রিয়া করা হবে এবং স্পষ্টতই গুগল দ্বারা সংরক্ষণ করা হবে
  • Speechpad.pw এর জন্য একটি মাসিক / কোয়াটারলি / বার্ষিক সাবস্ক্রিপশন ফি প্রয়োজন
  • Speechpad.pw কেবল গুগল ক্রোম ব্রাউজারে অ্যাডন হিসাবে চালিত - অন্য কোনও ব্রাউজার নেই

সুতরাং, স্পিচপ্যাড.পিডাব্লু অত্যন্ত স্বত্বাধিকারী এবং বন্ধ উত্স এবং গুগলের সাথেও আবদ্ধ, যা আমরা সকলেই নিদ্রাহীন মেটা ডেটা, ব্যক্তিগত তথ্য এবং ব্যক্তিগত সামগ্রী সংগ্রহকারী হিসাবে জানি।

এই ডাউনসাইডগুলি এটিকে আমার জন্য নো-অ্যাপ্লিকেশন হিসাবে তৈরি করে যদিও বক্তৃতা স্বীকৃতিটি নিজেই খুব ভালভাবে কাজ করে - আমি এখন পর্যন্ত যা কিছু দেখলাম তার চেয়ে অনেক ভাল।


ধন্যবাদ, হ্যাঁ উল্লেখযোগ্য ডাউনসাইডস, বিশেষত এটি কেবল ক্রোম ব্রাউজারে কাজ করে।
ফ্রাঙ্ক ডারননকোর্ট

1
আপনি Chrome এ গুগল ডক্স ব্যবহার করতে পারেন এবং তাদের "সরঞ্জাম" »" ভয়েস টাইপিং ... "বিকল্পটি ব্যবহার করতে পারেন। সম্ভবত একই স্পিচ সনাক্তকরণ সফ্টওয়্যার, তবে এটি নিখরচায়। তারপরে আপনার পাঠ্যের প্রয়োজন যেখানেই ডক্ট থেকে ফলাফলগুলি অনুলিপি করুন।
অ্যালেক্সিস উইলক

2

ক্রোম অ্যাপ্লিকেশন "ভয়েসনোট II" ( http://voicenote.in/ ) আমার জুবুন্টু 16.04 মেশিনে দুর্দান্ত কাজ করছে। কোনও ভয়েস-প্রশিক্ষণের প্রয়োজন নেই, এবং সেটআপ করা সহজ ছিল। এটি সন্ধানের জন্য একটি অনুসন্ধান, ইনস্টল করতে একটি ক্লিক, একটি শর্টকাট তৈরি করতে একটি ক্লিক এবং ডেস্কটপটিকে এটি আবদ্ধ করুন।


ধন্যবাদ, যদিও কেবল গুগল ক্রোমে কাজ করে
ফ্রাঙ্ক ডারননকোর্ট

0

আমি আপনার ফোন বা ট্যাবলেটে ড্রাগন ব্যবহার করার পরামর্শ দেব, তারপরে নিজের কাছে পাঠ্যটি ইমেল করুন। এটি একটি টানা কিন্তু এটি কাজ করে এবং খুব নির্ভুল। আপনি যদি এর জন্য লিনাক্স ব্যবহারের জন্য জেদ করেন, তবে দ্বিতীয় প্রদর্শনটি জীবনকে অনুলিপি করা ও অতীতকে আরও সহজ করে তুলবে।

আমি এটি চেষ্টা করে দেখিনি তবে আপনি আপনার ট্যাবলেট / ফোনে ড্রাগনের সাথে পাইথন ব্লুটুথ চ্যাট প্রোগ্রামটি ব্যবহার বা মানিয়ে নিতে সক্ষম হতে পারেন। মোবাইল ডিভাইসগুলির জন্য দূরবর্তী-কীবোর্ড অ্যাপসও থাকতে পারে যা ডিকশন ইনপুটটিকে সমর্থন করতে পারে।

আমি পরীক্ষা করব এবং আরও নির্দিষ্ট কিছু নিয়ে আপনার কাছে ফিরে আসার চেষ্টা করব।


0

আমি কেডি কানেক্ট অ্যাপটি ব্যবহার করছি। এটি বেশ কার্যকরভাবে কাজ করছে! ডেস্কে ফোনের সাথে কথা বলার সময় আমি মনিটরে নজর রাখতে সক্ষম হয়েছি। একমাত্র ক্ষতি হ'ল গুগল কীবোর্ডের মাধ্যমে এটি করা হচ্ছে। এটি নিখরচায়, দেশীয় বা মুক্ত উত্স নয় th এই মন্তব্যটি কোনও ধরণের এবং সংশোধন না করে পোস্ট করা হয়েছে


-2

আপনি লিনাক্স অ্যাপ্লিকেশনটিতে পাঠ্যটিতে বক্তৃতা ব্যবহার করতে পারেন এই অ্যাপ্লিকেশনটি 32 বা 64 বিট লিনাক্সের জন্য গুগল স্পিচ এপি এবং বাইনারি সংহতকরণ মডিউল ব্যবহার করে। আপনি উবুন্টুতে স্পিচপ্যাড.পিডব্লু সরঞ্জামগুলি ব্যবহারের একটি সংক্ষিপ্ত উপস্থাপনা দেখতে পারেন


1
ওপি স্পিচ-টু-টেক্সট ইঞ্জিনের সন্ধান করছে। এটি কেবলমাত্র একটি এসটিটি ইঞ্জিনের চারপাশে একটি ওয়েব-ইউআই র‍্যাপার (এবং এটির মধ্যে একটি খারাপ) ।
সেরিন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.