ডেস্কটপ পরিবেশের উপর ভয়েস নিয়ন্ত্রণ


16

আমি এমন একটি সিস্টেম সক্ষম করতে চাই যা ব্যবহারকারী ভয়েস কমান্ডগুলিতে প্রতিক্রিয়া জানাতে পারে এবং মৌখিক কমান্ড GIVEN অনুযায়ী স্ক্রিপ্টগুলি চালাতে পারে।

আদর্শভাবে, আমি কম্পিউটারটি নিরবচ্ছিন্নভাবে শোনা উচিত।

এটি একবার "কম্পিউটার" বাজ শব্দটি শোনার পরে এটি সক্রিয় হবে এবং 10 সেকেন্ড (বা তাই) এর জন্য কমান্ড শুনবে।

একবার সক্রিয় হয়ে গেলে এবং এটি শোনার সময়, আমি অন্য একটি শব্দ সুরের স্ক্রিপ্টগুলি চালাতে সক্ষম হতে চাই words

এই ক্ষেত্রে....

(কম্পিউটার অলস) "কম্পিউটার" (কম্পিউটার তাত্ক্ষণিকভাবে শোনে) "নতুন বার্তাগুলি অ্যাক্সেস করুন" (ম্যাসেজগুলি বাজে শব্দ হতে চলেছে * আইগনোরস "এক্সেস নিউ" - কম্পিউটার একটি স্ক্রিপ্ট চালায় এবং বিবর্তন বা সহানুভূতি খুলবে)। ব্রাউজারের জন্য একটি, উইন্ডো বন্ধ করতে এবং ডেস্কটপ প্রদর্শনের জন্য একটি, বা সত্যই জিনিসগুলির একটি গুচ্ছ থাকতে পারে।

এটা কি সম্ভব?

উত্তর:


7

Gnome-ভয়েস-নিয়ন্ত্রণ

গুগল সামার অফ কোড 2007 এর অংশ হিসাবে বিকাশযুক্ত, এটি এমন কিছু বৈশিষ্ট্য বিকাশ করার একটি ধারণা যা জিনোম ডেস্কটপের ব্যবহারযোগ্যতা উন্নত করবে।

লক্ষ্যটি একটি ডেস্কটপ ভয়েস কন্ট্রোল সিস্টেম বাস্তবায়ন করা। সিস্টেমটি এমন একটি অ্যাপ্লিকেশন নিয়ে গঠিত যা অডিও ইনপুট (মাইক্রোফোন) পর্যবেক্ষণ করবে এবং যখন একটি গুরুত্বপূর্ণ অডিও সিগন্যাল সনাক্ত করা হবে, সফ্টওয়্যারটি সিগন্যালটি ধরে, প্রক্রিয়াটি সনাক্ত করে এবং জিনোম ডেস্কটপের উপর দিয়ে কাঙ্ক্ষিত ক্রিয়াটি সম্পাদন করে। ক্রিয়াকলাপের একটি গোষ্ঠীতে সক্রিয় উইন্ডোটি সর্বাধিকতম, ছোট করা, বন্ধ করতে পারে; একটি নির্দিষ্ট প্রোগ্রাম খুলুন; এক ডেস্কটপ থেকে অন্য ডেস্কটপে স্যুইচিং; অন্যদের মধ্যে. GnomeVoiceControl সিএমইউ স্পিঙ্ক্সের সাথে একত্রে সি প্রয়োগ করা হয়েছিল, যা একটি ওপেন সোর্স সরঞ্জাম, যা স্পিচকে টেক্সটে রূপান্তর করতে তৈরি হয়েছিল।

লেখকদের স্লাইড-শো

দুর্ভাগ্যক্রমে দেখে মনে হচ্ছে এটি মৌলিক "লক্ষ্য" এর বাইরে খুব বেশি বিকাশ লাভ করে নি - তবে এই বছর বুলগেরিয়ান এবং তুর্কি ভাষার মতো নতুন ভাষার জন্য সমর্থন যোগ করার জন্য কিছু ক্রিয়াকলাপ দেখা যাচ্ছে।

স্থাপন করা:

sudo apt-get install gnome-voice-control

প্লাটিপাস

একটি আকর্ষণীয় সন্ধানকারী প্রকল্প কল প্লাটিপাস রয়েছে - মূলত ড্রাগনের স্বাভাবিকভাবে স্পিকিংয়ের একটি লিনাক্স ফ্রন্ট-এন্ড যা ওয়াইনে চলে।

এই অ্যাপ্লিকেশনটির জন্য দাবী-খ্যাতি হ'ল "এটি উইন্ডোজ বা লিনাক্স প্রোগ্রাম এবং স্ক্রিপ্টগুলিও চালু করতে পারে, যেমন" শুরুর টার্মিনাল "।

VEDICS

এটি একটি নতুন প্রকল্প যা বলে যে এটি ইউনিটি ইন্টারফেসের সাথে কাজ করে।

প্রকল্প পৃষ্ঠাটি বলে যে এটি "রান [প্রোগ্রামের নাম]" স্বীকৃতি দেয় - সুতরাং তত্ত্ব অনুসারে আপনি [প্রোগ্রামের নাম] যে কোনও স্ক্রিপ্ট চালাতে চান be


ব্যতিক্রমী দ্রুত প্রতিক্রিয়ার জন্য আপনাকে ধন্যবাদ। আমি সেই প্রোগ্রামটির কথা শুনেছি এবং এটি ইনস্টল করেছি, তবে এটি অতীতের কনফিগারেশনটি পেয়েছে বলে মনে হচ্ছে না - এটি কেবল "কনফিগারেশন" বলে। আমি অবাক হয়েছি যে এই ফ্রন্টে খুব বেশি কাজ করা হয়নি। আমি কি উইন্ডো সমতুল্য যে ওয়াইন দিয়ে চালাতে পারি?
বোর্গডমিনিশন

1
সিনপ্যাটিকের জিনোম ভয়েসের পুরানো সংস্করণটি আমাকে একই ফলাফল দিয়েছে। আমি ওয়েবসাইটটি থেকে সর্বশেষ চেষ্টা করেছি এবং দেখে মনে হচ্ছে এটি আরও পেতে পারে তবে আমি এটি কখনই সঠিকভাবে কাজ করতে পাইনি। ম্যানুয়াল dependancys একটি ব্যথা ছিল।
কেন্ড্রিক

3

সাইমন লিসটেনস

এটি একটি ওপেন সোর্স প্রকল্প যা মূলত শারীরিকভাবে অক্ষম ব্যক্তিদের জন্য প্রাথমিকভাবে বিকশিত স্বীকৃতি অনুসারে মাউস এবং / অথবা কীবোর্ড প্রতিস্থাপন করা।

এমন একটি পিপিএ রয়েছে যেখানে থেকে আমরা অ্যাপ্লিকেশনটি ইনস্টল করতে পারি: পিপিএ: গ্র্যাশ-সিমোন-লিজড / সাইমন


সাইমন কি কেবল কেডিই নিয়ে কাজ করে? এটি দেখতে দুর্দান্ত লাগছে এবং আমি এটি ইনস্টল করেছি তবে এটি জিনোম-শেল দিয়ে কাজ করছে বলে মনে হচ্ছে না। বিশেষভাবে উইন্ডো পরিচালনা। উদাহরণস্বরূপ, আমি যদি সমস্ত উইন্ডোটি প্রদর্শন করতে চাই, তবে এটি কেডি এনভি এবং গনোম এনভিতে সঠিকভাবে কাজ করবে?
জোশুয়া রবিসন

1
পিপিএ থেকে উবুন্টু <= 12.04 এ ইনস্টল করার সময় নির্ভরতাগুলি সমাধান করা উচিত তবে আমি সম্প্রতি চেষ্টা করি নি, এবং এটি জিনোম শেলটিতে কীভাবে হস্তক্ষেপ করতে পারে তা আমার কোনও ধারণা নেই। 12.10 এর জন্য কোনও সংস্করণ নেই (এখনও)।
তাক্কাট

3

Google2Ubuntu

গুগল 2 উবুন্টু এমন একটি সরঞ্জাম যা আপনাকে গুগল স্পিচ সনাক্তকরণ API এর মাধ্যমে ভয়েস কমান্ড ব্যবহার করে আপনার কম্পিউটারকে নিয়ন্ত্রণ করতে দেয়।

টার্মিনালে ইনস্টল করতে নীচের কমান্ডগুলি চালান google2Ubuntu,

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

সূত্র


1

লিনাক্স স্পিচ রিকগনিশন

এটি লিনাক্স ডিস্ট্রিবিউশনের অধীনে চালিত হওয়ার জন্য বিকাশ করা হচ্ছে, এটি কাস্টম কনফিগার এবং প্রসারিত করা সহজ, কাস্টম অভিধানগুলি সমর্থন করে, প্রসঙ্গ ভিত্তিক স্বীকৃতি, ডিকশন মোড এবং কনফিগারযোগ্য ম্যাক্রোগুলিকে সমর্থন করে।

লিনাক্স স্পিচ রিকগনিশন ইনস্টল করার জন্য প্রকল্পের গিটহাব পৃষ্ঠায় যান। জিপ ফাইলটি ডাউনলোড করুন এবং এটি বের করুন।

তারপরে কিছু নির্ভরতা ইনস্টল করুন:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

টার্মিনালে নিষ্ক্রিয় ফোল্ডার (পালভার-মাস্টার) খুলুন এবং সেটআপটি কার্যকর করুন:

cd /~Path-to-folder~/Palaver-master/
./setup

রেকর্ডিং সক্ষম করার জন্য এখন কেবল হটকি সরবরাহ করা, এটি করতে সিস্টেম সেটিংস ...> কীবোর্ড> শর্টকাটস> কাস্টম শর্টকাটগুলি একটি শর্টকাট যুক্ত করতে প্লাস বোতামটি ক্লিক করুন, নাম ভয়েস রিকগনিশন দিন এবং এতে আদেশটি সেট করুন:

/~Path-to-folder~/Palaver-master/hotkey

প্রয়োগ ক্লিক করুন, শর্টকাট ক্লিক করুন এবং তারপরে ভয়েস সনাক্তকরণ সক্রিয় করতে একটি হটকি বরাদ্দ করুন।

লক্ষ্য করুন যে কোনও স্থিতিশীল বিল্ড এখনও মুক্তি পায় নি, সুতরাং কমান্ডগুলি এই পর্যায়ে পুরোপুরি কার্যকর হবে বলে আশা করবেন না, অনেক বাক্যাংশ স্বীকৃত হবে, তবে কোনও বাস্তব পদক্ষেপ নেওয়া হবে না।



0

Snips.ai

এটি কেবল পাই -3 এ চেষ্টা করেছেন - মনে হচ্ছে ডকারে সম্ভাব্য
রান রয়েছে

https://snips.ai/


1
উবুন্টুকে জিজ্ঞাসা করুন স্বাগতম দয়া করে নোট করুন যে আপনি যদি এই সরঞ্জামটির সাথে যুক্ত হন তবে আপনার পোস্টে আপনাকে স্পষ্টভাবে এটি বলা দরকার; কীভাবে স্প্যামার হবেন না দেখুন ।
গ্লোরফাইন্ডেল

1
অফিসিয়াল ওয়েবসাইট বলেছেন: ওপেন সোর্স: আমরা সময়ের সাথে সাথে স্নিপগুলি খোলার জন্য প্রতিশ্রুতিবদ্ধ , তাই স্নিপস চেষ্টা করার মতো হতে পারে।
কারেল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.