অ্যামাজনের অ্যালেক্সা , ন্যুয়েন্সের মিক্স এবং ফেসবুকের উইট.ইই সমস্ত পাঠ্য কমান্ডকে কীভাবে অভিপ্রায় রূপান্তর করতে পারে তা নির্দিষ্ট করার জন্য একই ধরণের সিস্টেম ব্যবহার করে - যেমন কোনও কম্পিউটার বুঝতে পারে। আমি নিশ্চিত নই যে এর "অফিসিয়াল" নামটি কী তবে আমি এটিকে "উদ্দেশ্য স্বীকৃতি" বলি। মূলত "দয়া করে আমার লাইটগুলি 50% উজ্জ্বলতায় সেট করুন" থেকে যাওয়ার উপায় lights.setBrightness(0.50)
।
তারা যেভাবে নির্দিষ্ট করা হয়েছে তা হ'ল বিকাশকারী একটি "নমুনা উচ্চারণ" এর একটি তালিকা সরবরাহ করে যা একটি অভিপ্রায়টির সাথে সম্পর্কিত এবং বিকল্পভাবে "সত্তা" (মূলত পরামিতি) এর অবস্থানগুলির সাথে ট্যাগযুক্ত। এখানে উইট.ইয়ের একটি উদাহরণ রয়েছে:
আমার প্রশ্ন: এই সিস্টেমগুলি কীভাবে কাজ করে? যেহেতু এগুলি সবগুলি একই রকম হয় তাই আমি অনুমান করি যে এখানে কিছু চূড়ান্ত কাজ রয়েছে যা তারা সবাই ব্যবহার করে। কেউ কি জানেন এটা কি?
মজার ব্যাপার Houndify একটি ভিন্ন পদ্ধতি regexes মত আরো যে ব্যবহার করে: ["please"] . ("activate" | "enable" | "switch on" | "turn on") . [("the" | "my")] . ("lights" | "lighting") . ["please"]
। আমি ধরে নিলাম যে তাদের ভয়েস সনাক্তকরণ সিস্টেমের মরীচি অনুসন্ধানে একীভূত হয়েছে, যেখানে অ্যালেক্সা, উইট.ই এবং মিক্সের পৃথক স্পিচ-> পাঠ্য এবং পাঠ্য-> উদ্দীপনা সিস্টেম রয়েছে বলে মনে হচ্ছে।
সম্পাদনা: আমি একটি সূচনা পয়েন্ট পেয়েছি - মানুষের জন্য একটি প্রক্রিয়া - রোবট ইন্টারঅ্যাকশন ইনফরমাল ভয়েস কমান্ডগুলির মাধ্যমে । এটি উচ্চারণগুলির তুলনা করতে ল্যাটেন্ট সিমেটিক অ্যানালাইসিস নামে কিছু ব্যবহার করে। আমি এটি পড়তে যাচ্ছি। কমপক্ষে এটি আমাকে প্রশংসাপত্র নেটওয়ার্কে একটি সূচনা পয়েন্ট দিয়েছে।
সম্পাদনা 2: এলএসএ মূলত পাঠ্যের প্রতিটি অনুচ্ছেদে ব্যবহৃত শব্দের (ব্যাগ অফ ওয়ার্ড) তুলনা করছে। আমি দেখতে পাচ্ছি না যে এটি কীভাবে এটি খুব কার্যকরভাবে কাজ করতে পারে কারণ এটি শব্দের ক্রমটি পুরোপুরি হারায়। যদিও শব্দ শৃঙ্খলা এই ধরনের কমান্ডের জন্য খুব বেশি গুরুত্বপূর্ণ নয়।
সম্পাদনা 3: লুকানো বিষয় মারকভ মডেলগুলি দেখতে আকর্ষণীয় হতে পারে বলে মনে হচ্ছে।