চ্যাট বট প্রশিক্ষণের সর্বশেষতম পদ্ধতিগুলি কী কী?


11

আমি এমন একটি বটকে প্রশিক্ষণ দিতে চাই যা পাঠ্য ইনপুট ব্যবহার করে, কয়েকটি বিভাগ মুখস্ত করে এবং সেই অনুসারে প্রশ্নের উত্তর দেয়। সংস্করণ ২.০ ছাড়াও, আমি ভয়েস ইনপুটগুলিতেও উত্তর দিতে বট করতে চাই। এর জন্য উপলব্ধ সর্বশেষতম মেশিন লার্নিং / এআই অ্যালগরিদম কোনটি? আমাকে বুঝতে দাও.


গতিশীল-মেমরি-নিউরাল নেটওয়ার্কগুলি পরীক্ষা করুন
riemann77

সিনমেটিক-ম্যাথ ম্যাপিং ব্যবহার বিবেচনা করুন ।
সের্গেই

উত্তর:


1

আপনার প্রশ্নটি অবিশ্বাস্যভাবে বিস্তৃত - সুতরাং প্রতিক্রিয়া হিসাবে, দুটি ব্রড ফ্রেমওয়ার্ক আমি আপনাকে দেখতে উত্সাহিত করব:

  1. প্রান্তের চ্যাটবোট কথোপকথনের বিকাশের জন্য http://rasa.ai একটি ওপেন সোর্স ফ্রেমওয়ার্ক যা আরও প্রচলিত নিয়ম-ভিত্তিক সিস্টেমগুলির চেয়ে আরও অভিযোজিত
  2. বক্তৃতা স্বীকৃতির জন্য https://discourse.mozilla.org/c/ दीप-speech দেখুন যা ওপেন সোর্স।

0

যদি আপনার বটটি কয়েকটি বিভাগ "মনে রাখছে" এবং তারপরে প্রশ্নগুলির উত্তর দেয়, তবে এটি বর্তমান দৃশ্যে বেশ বেহুদা। কারণ সেক্ষেত্রে এটি একটি ভিন্ন ডেটাসেটে (টেস্ট-সেট) খুব খারাপভাবে সম্পাদন করে। পরিসংখ্যান পরিভাষায় একে "ওভারফিটিং" বলা হয়। এবং প্রশ্নের উত্তরে আসছি, "স্টেট-অফ-আর্ট" অ্যালগরিদম সংজ্ঞায়িত করার জন্য থাম্বের কোনও নিয়ম নেই। যদিও আপনি কয়েকটি মডেল যা বাবি বা অনুরূপ ডেটাসেটগুলিতে গতিশীল মেমরি নেটওয়ার্কগুলি বা seQ2seQ মডেল পছন্দ করে তার উপর দুর্দান্ত পারফরম্যান্স করেছেন তা পরীক্ষা করতে পারেন। এই ক্ষেত্রের প্রাথমিক ধারণা পাওয়ার জন্য, আমি আপনাকে বেসিক মেশিন লার্নিং লিংগো শিখতে এবং তারপরে কিছু উন্নত-প্রাকৃতিক ভাষা প্রসেসিং কোর্সে এগিয়ে যাওয়ার পরামর্শ দিচ্ছি (স্ট্যানফোর্ড সিএস 224n দেয়)।


0

আবু শাওয়ার ও আটওয়েল রাজ্য:

একটি চ্যাটবোট একটি কথোপকথন এজেন্ট যা ব্যবহারকারীরা ঘুরে ঘুরে প্রাকৃতিক ভাষা ব্যবহার করে ইন্টারঅ্যাক্ট করে। বিভিন্ন কথোপকথন বা হিউম্যান-কম্পিউটার সংলাপ সিস্টেম স্পোকেন বা পাঠ্য যোগাযোগ ব্যবহার করে তৈরি করা হয়েছে এবং বিভিন্ন ডোমেইনে যেমন প্রয়োগ করা হয়েছে: ভাষাগত গবেষণা, ভাষা শিক্ষা, গ্রাহক পরিষেবা, ওয়েব সাইট সহায়তা এবং মজাদার জন্য।

তাদের এবং অন্যান্য কাগজপত্রগুলি এই লেখার মতো চ্যাটবট প্রশিক্ষণের জন্য সমসাময়িক অনেক পদ্ধতির কয়েকটি বোঝায়।

প্রাকৃতিক ডায়ালগ কর্পোরো, বায়ান আবু শাওয়ার, এরিক অটওয়েল, ২০১ 2016 থেকে চ্যাটবট প্রশিক্ষণের ডেটা স্বয়ংক্রিয়ভাবে উত্তোলন

যাইহোক, বেশিরভাগ চ্যাটবটগুলি তাদের ফাইলগুলিতে ম্যানুয়ালি জ্ঞান এবং এমন কোনও নির্দিষ্ট প্রাকৃতিক ভাষায় সীমাবদ্ধ যা লিখিত বা কথিত। এই কাগজটি একটি মেশিন রিডেবল টেক্সট (কর্পাস) কে একটি নির্দিষ্ট চ্যাটবোট ফর্ম্যাটে রূপান্তরিত করার জন্য আমাদের তৈরি করা প্রোগ্রামটি উপস্থাপন করে, যা একটি চ্যাটবোট পুনরায় প্রশিক্ষণ এবং মানব ভাষার কাছাকাছি থাকা একটি চ্যাট তৈরি করতে ব্যবহৃত হয়। বিভিন্ন কর্পোরার ব্যবহার করা হয়েছিল: ব্রিটিশ ন্যাশনাল কর্পাস অফ ইংলিশ (বিএনসি) এর মতো সংলাপ কর্পোরো; ইসলাম কুরআনের পবিত্র গ্রন্থ যা একাকী করপাস যেখানে আয়াত এবং নিম্নলিখিত আয়াতগুলি পরিণত হয়েছে; এবং প্রায়শই জিজ্ঞাসিত প্রশ্ন যেখানে প্রশ্ন এবং উত্তরগুলি পালা জোড়া। এই অটোমেশন প্রক্রিয়াটির মূল লক্ষ্য হ'ল কর্পাসের ভিত্তিতে বিভিন্ন ভাষায় কথা বলে এমন বিভিন্ন চ্যাটবোট প্রোটোটাইপগুলি তৈরি করার ক্ষমতা।

অনুষঙ্গ-অনিশ্চয়তা-সচেতন চ্যাটবট অ্যাকশন নির্বাচন প্যারামিটারাইজড অক্সিলিয়ারি রিইনফোর্সমেন্ট লার্নিং , চুয়ানডং ইয়িন, রুই ঝাং, জিয়ানজং কিউ, ইউ সান, এবং টেংলুন টান, 2018 এর মাধ্যমে

আমরা চ্যাটবোটকে প্রশিক্ষণের জন্য একটি প্রসঙ্গ-অনিশ্চয়তা-সচেতন চ্যাটবোট এবং একটি রিইনফোর্সমেন্ট লার্নিং (আরএল) মডেল প্রস্তাব করি। প্রস্তাবিত মডেলটির নামকরণ করা হয়েছে প্যারামিটারাইজড অক্জিলারি অ্যাসিনক্রোনাস অ্যাডভান্টেজ অ্যাক্টর সমালোচক (পিএ 4 সি)। কথোপকথনের প্রসঙ্গে ব্যবহারকারীদের উচ্চারণের আত্মবিশ্বাসের অনিশ্চয়তা অনুকরণ করতে আমরা একটি ব্যবহারকারী সিমুলেটর ব্যবহার করি। নিষ্কলুষ নিয়ম-ভিত্তিক পদ্ধতির সাথে তুলনা করে, আমাদের চ্যাটবট PA4C মডেলের মাধ্যমে প্রশিক্ষিত হস্ত-নকশাকৃত ক্রিয়া নির্বাচন এড়ায় এবং ব্যবহারকারীর উচ্চারণের বৈকল্পিকতার পক্ষে আরও দৃust়। পিএ 4 সি মডেল চ্যাটবোট প্রশিক্ষণের জন্য অ্যাকশন প্যারামিটারাইজেশন এবং সহায়ক কাজের সাথে প্রচলিত আরএল মডেলগুলিকে অনুকূল করে তোলে, যা একটি বিশাল ক্রিয়া স্থান এবং শূন্য-পুরষ্কারের রাজ্যের সমস্যাগুলির সমাধান করে। আমরা ক্যালেন্ডার ইভেন্ট তৈরির কাজের জন্য একটি চ্যাটবোট প্রশিক্ষণের মাধ্যমে PA4C মডেলটিকে মূল্যায়ন করি।

চ্যাটবট ইন্টারেক্টেশন ব্যবহার করে তত্ত্বাবধানে পড়াশুনা প্রশিক্ষণ সিস্টেম , মার্কিন যুক্তরাষ্ট্রের পেটেন্ট অ্যাপ্লিকেশন পাবলিকেশন 0034828 এ 1, আন্তর্জাতিক ব্যবসা মেশিন কর্পোরেশন, আর্মোনক, এনওয়াই, মার্কিন, 2019

একটি কম্পিউটার প্রয়োগ করা পদ্ধতি যা ডাটা পয়েন্টের পরামিতি নির্ধারণের জন্য একটি তথ্য পয়েন্ট গ্রহণ এবং বিশ্লেষণ করে গঠিত হয়, ডাটা পয়েন্ট বিশ্লেষণের ভিত্তিতে একটি সতর্কতা টিকিট তৈরি করে, একটি চ্যাটবটের মাধ্যমে যোগাযোগ করে, সতর্কতার টিকিটে অন্তত কিছু তথ্য অন্তর্ভুক্ত করে বা আরও বেশি ব্যবহারকারী এবং চ্যাটবটের মাধ্যমে শ্রেণিবদ্ধকরণের মাধ্যমে ডেটা পয়েন্টের ফলে সতর্কতার টিকিটের ফলস্বরূপ এমন একটি ডিভাইসের আচরণের উপর ভিত্তি করে যা ডেটা পয়েন্ট তৈরি করে। জোনাথন এ। ক্যাগাডাস, আলেকজান্ডার ডি লেউইট, সাইমন ডি মিকুলিক, করণ শুক্লা, লেই এ। উইলিয়ামসন

একটি ছোট সংলাপ কর্পাস , জিনতা কিম, হিওন-গু লি, হার্কসু কিম, ইয়োনসো লি, ইয়ং-গিল কিম, ২০১ 2016 সহ একটি জেনারেটরি চ্যাটবোট বাস্তবায়নের জন্য দ্বি-পদক্ষেপ প্রশিক্ষণ এবং মিশ্র এনকোডিং- ডকোডিং

সিক্যুয়েন্স-টু-সিকোয়েন্স নেটওয়ার্কগুলির ভিত্তিতে জেনারেটর চ্যাটবট মডেলগুলি যদি একটি বিশাল সংলাপ কর্পাস প্রশিক্ষণ ডেটা হিসাবে ব্যবহার করা হয় তবে প্রাকৃতিক কথোপকথন ইন্টারঅ্যাকশন তৈরি করতে পারে। তবে ইংরাজী এবং চাইনিজের মতো কয়েকটি ভাষা বাদে একটি বৃহত সংলাপ কর্পস সংগ্রহ করা শক্ত থেকে যায়। এই সমস্যাটির সমাধানের জন্য, আমরা শব্দগুলি এবং সিলেবলের মিশ্রণটিকে এনকোডিং-ডিকোডিং ইউনিট হিসাবে ব্যবহার করে একটি চ্যাটবট মডেল প্রস্তাব করি। তদতিরিক্ত, আমরা একটি বৃহত নন-ডায়লগ কর্পাস ব্যবহার করে প্রাক প্রশিক্ষণ এবং একটি ছোট সংলাপ কর্পাস ব্যবহার করে পুনরায় প্রশিক্ষণ জড়িত একটি দ্বি-পদক্ষেপের প্রশিক্ষণ পদ্ধতির প্রস্তাব করি। আমাদের পরীক্ষায়, মিশ্রণ ইউনিটগুলিকে শব্দভাণ্ডারের (OOV) সমস্যাগুলি হ্রাস করতে সহায়তা করার জন্য দেখানো হয়েছিল। তদুপরি, চ্যাটবোটটি একটি ছোট সংলাপ কর্পস ব্যবহার করে প্রশিক্ষণ দেওয়া হয়েছিল (৫৩৩,

স্বেচ্ছাসেবী এম্বেডিংয়ের ভিত্তিতে গোল-ওরিয়েন্টেড চ্যাটবট প্রশিক্ষণের জন্য সাবমডুলারালিটি-অনুপ্রাণিত ডেটা নির্বাচন , ম্লাদেন ডিমোভস্কি, ক্লাডিউ মুসাত, ভ্লাদিমির ইলিভস্কি, আন্ড্রিয়া হোসমান, মাইকেল বেরেসওয়িল, 2018

লক্ষ্য-ভিত্তিক চ্যাটবট বা ব্যক্তিগত সহায়ক হিসাবে স্পোকেন ল্যাংগুয়েজ বোঝাপড়া (এসএলইউ) সিস্টেমগুলি অভিপ্রায় নির্ধারণ করতে এবং তারা ইনপুট হিসাবে গ্রহণ করে এমন ব্যবহারকারী সম্পর্কিত প্রশ্ন থেকে প্রাসঙ্গিক তথ্য আহরণের জন্য প্রাথমিক প্রাকৃতিক ভাষা বোঝার (এনএলইউ) মডিউলের উপর নির্ভর করে। এসএলইউ সিস্টেমগুলি সাধারণত ব্যবহারকারীদের তুলনামূলকভাবে সংকীর্ণ ডোমেনগুলিতে সমস্যাগুলি সমাধান করতে সহায়তা করে এবং বিপুল পরিমাণ ইন-ডোমেন প্রশিক্ষণের ডেটা প্রয়োজন। এটি উল্লেখযোগ্য ডেটা প্রাপ্যতা সংক্রান্ত সমস্যার দিকে নিয়ে যায় যা সফল সিস্টেমগুলির বিকাশকে বাধা দেয়। এই সমস্যাটি দূর করার জন্য, আমরা নিম্ন-ডাটা সিস্টেমগুলিতে ডেটা বাছাইয়ের একটি কৌশল প্রস্তাব করি যা আমাদের কম লেবেলযুক্ত বাক্যগুলি প্রশিক্ষণ দিতে সক্ষম করে, ফলে আরও ছোট লেবেল ব্যয় হয়। আমরা একটি submodularity- অনুপ্রাণিত ডেটা র‌্যাঙ্কিং ফাংশন, অনুপাত-পেনাল্টি প্রান্তিক লাভ, কেবল পাঠ্য এম্বেডিং স্থান থেকে প্রাপ্ত তথ্যের উপর ভিত্তি করে লেবেলে ডেটা পয়েন্টগুলি নির্বাচন করার জন্য। আমরা দেখাব যে এম্বেডিং স্পেসের দূরত্বগুলি তথ্যের একটি কার্যকর উত্স যা ডেটা নির্বাচনের জন্য ব্যবহার করা যেতে পারে। আমাদের পদ্ধতিটি দুটি পরিচিত সক্রিয় শেখার কৌশলকে ছাড়িয়ে যায় এবং এনএলইউ ইউনিটের ব্যয়-দক্ষ প্রশিক্ষণ সক্ষম করে। তদুপরি, আমাদের প্রস্তাবিত নির্বাচন কৌশলটি নির্বাচনের পদক্ষেপগুলির মধ্যে মডেলটিকে পুনরায় প্রশিক্ষণ দেওয়ার প্রয়োজন হয় না, এটি সময়কে দক্ষ করে তোলাও করে তোলে।


-1

আপনি মেমরি কোষ এবং ওয়ার্ড 2vec এর মতো শব্দ এমবেডিং হিসাবে এলএসটিএম বা জিআরইউর সাথে পুনরাবৃত্ত নিউরাল নেটগুলির সাথে কাজ করতে পারেন। আরও দৃust়তা এবং কম পক্ষপাতের জন্য বিএন অনুসন্ধান এবং মনোযোগের মডেলগুলি আরএনএন দিয়েও ব্যবহার করা যেতে পারে। তবে এই ক্ষেত্রগুলির গবেষণা এখনও গরম এবং অনেকটা অবমুক্ত করা যায় বলে এগুলির ফলাফলগুলি কিছুটা পরিমাণে প্রশংসনীয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.