"অভিপ্রায় সনাক্তকারী" কীভাবে কাজ করে?


11

অ্যামাজনের অ্যালেক্সা , ন্যুয়েন্সের মিক্স এবং ফেসবুকের উইট.ইই সমস্ত পাঠ্য কমান্ডকে কীভাবে অভিপ্রায় রূপান্তর করতে পারে তা নির্দিষ্ট করার জন্য একই ধরণের সিস্টেম ব্যবহার করে - যেমন কোনও কম্পিউটার বুঝতে পারে। আমি নিশ্চিত নই যে এর "অফিসিয়াল" নামটি কী তবে আমি এটিকে "উদ্দেশ্য স্বীকৃতি" বলি। মূলত "দয়া করে আমার লাইটগুলি 50% উজ্জ্বলতায় সেট করুন" থেকে যাওয়ার উপায় lights.setBrightness(0.50)

তারা যেভাবে নির্দিষ্ট করা হয়েছে তা হ'ল বিকাশকারী একটি "নমুনা উচ্চারণ" এর একটি তালিকা সরবরাহ করে যা একটি অভিপ্রায়টির সাথে সম্পর্কিত এবং বিকল্পভাবে "সত্তা" (মূলত পরামিতি) এর অবস্থানগুলির সাথে ট্যাগযুক্ত। এখানে উইট.ইয়ের একটি উদাহরণ রয়েছে:

wit.ai উদাহরণ

আমার প্রশ্ন: এই সিস্টেমগুলি কীভাবে কাজ করে? যেহেতু এগুলি সবগুলি একই রকম হয় তাই আমি অনুমান করি যে এখানে কিছু চূড়ান্ত কাজ রয়েছে যা তারা সবাই ব্যবহার করে। কেউ কি জানেন এটা কি?

মজার ব্যাপার Houndify একটি ভিন্ন পদ্ধতি regexes মত আরো যে ব্যবহার করে: ["please"] . ("activate" | "enable" | "switch on" | "turn on") . [("the" | "my")] . ("lights" | "lighting") . ["please"]। আমি ধরে নিলাম যে তাদের ভয়েস সনাক্তকরণ সিস্টেমের মরীচি অনুসন্ধানে একীভূত হয়েছে, যেখানে অ্যালেক্সা, উইট.ই এবং মিক্সের পৃথক স্পিচ-> পাঠ্য এবং পাঠ্য-> উদ্দীপনা সিস্টেম রয়েছে বলে মনে হচ্ছে।

সম্পাদনা: আমি একটি সূচনা পয়েন্ট পেয়েছি - মানুষের জন্য একটি প্রক্রিয়া - রোবট ইন্টারঅ্যাকশন ইনফরমাল ভয়েস কমান্ডগুলির মাধ্যমে । এটি উচ্চারণগুলির তুলনা করতে ল্যাটেন্ট সিমেটিক অ্যানালাইসিস নামে কিছু ব্যবহার করে। আমি এটি পড়তে যাচ্ছি। কমপক্ষে এটি আমাকে প্রশংসাপত্র নেটওয়ার্কে একটি সূচনা পয়েন্ট দিয়েছে।

সম্পাদনা 2: এলএসএ মূলত পাঠ্যের প্রতিটি অনুচ্ছেদে ব্যবহৃত শব্দের (ব্যাগ অফ ওয়ার্ড) তুলনা করছে। আমি দেখতে পাচ্ছি না যে এটি কীভাবে এটি খুব কার্যকরভাবে কাজ করতে পারে কারণ এটি শব্দের ক্রমটি পুরোপুরি হারায়। যদিও শব্দ শৃঙ্খলা এই ধরনের কমান্ডের জন্য খুব বেশি গুরুত্বপূর্ণ নয়।

সম্পাদনা 3: লুকানো বিষয় মারকভ মডেলগুলি দেখতে আকর্ষণীয় হতে পারে বলে মনে হচ্ছে।


এই পোস্টটি বিস্তারিতভাবে অভিপ্রায় শ্রেণিবিন্যাসের ব্যাখ্যা করেছে: mrbot.ai/blog/n Natural
language-

এটি আমার প্রশ্নের মধ্যে উল্লেখ করা "শব্দের ব্যাগ" পদ্ধতিটি ব্যবহার করে বলে মনে হচ্ছে। মূলত বাক্যে ভেক্টর শব্দটি যুক্ত করুন। যদিও এটি কাজ করে তা হতে পারে না। উইট এবং নুয়েন্সের ইন্টারফেসগুলি দেখায় যে তারা এমন সত্তাকে স্বীকৃতি দেয় যা শব্দের ব্যাগ সহজেই করতে পারে না। এছাড়াও শব্দের ব্যাগ সমস্ত ক্রম হারাতে পারে তাই "অতীত 10 এর 5 এর জন্য একটি অ্যালার্ম সেট করুন" এর মতো "" অতীত 5 এর জন্য একটি অ্যালার্ম সেট করুন "থেকে আলাদা করা যায় না। আরও কিছু হতে হবে।
টিম্ম্ম্ম

সত্তা নিষ্কাশন আরেকটি সমস্যা যেখানে ক্রমটি গুরুত্বপূর্ণ। আপনার যদি প্রচুর ডেটা থাকে তবে কোনও Rnn কাজ করবে, ছোট ডেটাসেটে, যা চ্যাটবটে ঘন ঘন থাকে, শর্তাধীন র্যান্ডম ক্ষেত্রগুলি খুব ভালভাবে কাজ করে
znat

ঠিক আছে, তাই ... আমি "একটি আরএনএন কাজ করবে" এর চেয়ে আরও বিস্তারিত উত্তর খুঁজছি। বেশিরভাগ আধুনিক সিকোয়েন্স লার্নিং সিস্টেমগুলি আরএনএন ব্যবহার করে যাতে এটি প্রদত্ত বলে মনে হয়।
টিম্ম্ম্ম

উদ্দেশ্যগুলি বাক্যগুলির সাধারণ অর্থ সম্পর্কে (ভেক্টরের গড়) এবং সত্তাগুলি প্রাসঙ্গিক (আশেপাশের শব্দগুলি) শিখার বিষয়ে যা তারা উপস্থিত হয় learning আরএনএন বা সিআরএফ কেবল অ্যালগরিদম যা ব্যবহার করা যেতে পারে কারণ তারা ক্রমগুলি থেকে শিখেছে। আপনি যদি বিশদভাবে জানতে চান, রাসা উত্স কোডটি দেখুন
znat

উত্তর:


4

আপনার প্রশ্নের সরাসরি উত্তর না দিলেও আপনি স্বয়ংক্রিয় প্রশ্ন উত্তর দেওয়ার ক্ষেত্রে আগ্রহী হতে পারেন । প্রাকৃতিক ভাষার পাঠ্য প্রশ্নের উত্তর দেওয়ার জন্য তাদের অবশ্যই প্রথমে বুঝতে হবে, যা আপনার সমস্যার সাথে ওভারল্যাপ হয়।

একটি ভাল রিসোর্স হ'ল জুরফস্কি এবং ম্যানিংয়ের কোর্স । বিশেষত শব্দার্থবিজ্ঞান এবং প্রশ্নের উত্তর দেওয়ার বিভাগগুলি আপনি যা খুঁজছেন তাতে সহায়তা করতে পারে। YouTube- এ উপলব্ধ সহগামী বক্তৃতা ভিডিও নেই এখানে


আমি আপনার উত্তরের প্রথম অংশটি খুব মজার হলেও তথ্যপূর্ণ বলে মনে করি।
দিয়েগো

সম্ভবত এটি মন্তব্য হিসাবে ভাল হতে পারে, আপনি যেমন স্বীকার করেন, এটি প্রশ্নের উত্তর দেয় না।
kbrose

2

এই পোস্টে একটি পদ্ধতির আছে। মূলত তারা শব্দের ব্যাগ ব্যবহার করে - তারা শব্দগুলিকে স্পার্স ভেক্টরগুলিতে রূপান্তর করে এবং তারপরে এগুলি যুক্ত করে।

এটি মোটামুটি ভালভাবে কাজ করছে বলে মনে হচ্ছে তবে একটি বড় ত্রুটি উত্তরটি শব্দের ক্রম থেকে স্বতন্ত্র, সুতরাং আপনি যদি বিশেষ কেস না করেন তবে আপনি "এক পাউন্ডে কত কিলো" এর মতো প্রশ্নগুলি করতে পারবেন না।

তবে আমি অ্যালেক্সার সাথে পাঠ্য করেছি এবং শব্দ শৃঙ্খলা পরিবর্তনের ক্ষেত্রে এটি মোটামুটি সংবেদনশীল is তাই সম্ভবত তারা এ জাতীয় কিছু ব্যবহার করে।


কৌতূহলী - স্পর্শ-ভেক্টরদের নায়েভ বেয়েশিয়ানদের থেকে কী কী সুবিধা রয়েছে? আমার দু'জনেই নিখুঁত ব্যাগ-অফ-শব্দের অনুমানের সাথে রৈখিক-বিচ্ছিন্ন সমস্যাগুলি সমাধান করুন
Angad
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.