আমি নিউরাল নেটওয়ার্ক নিয়ে পরীক্ষা-নিরীক্ষা শুরু করতে চেয়েছিলাম এবং খেলনার সমস্যা হিসাবে আমি একজনকে চ্যাট করার প্রশিক্ষণ দিতে চাইছিলাম, অর্থাৎ চতুরতার মতো চ্যাটিং বট প্রয়োগ করতে পারি। যাইহোক যে চালাক না।
আমি কিছু ডকুমেন্টেশনের জন্য আশেপাশে সন্ধান করলাম এবং আমি সাধারণ কাজের উপর অনেক টিউটোরিয়াল পেয়েছি তবে এই নির্দিষ্ট বিষয়ে কয়েকটি ছিল few আমি যেটি সবেমাত্র পেয়েছি তা বাস্তবায়নের বিষয়ে অন্তর্দৃষ্টি না দিয়েই ফলাফলগুলি উন্মোচিত করেছি। যেগুলি করেছে, এটি কি খুব অগভীর হয়ে আছে (সেক 2 সেকের টেনসরফ্লো ডকুমেন্টেশন পৃষ্ঠায় ইমোর অভাব রয়েছে)।
এখন, আমি অনুভব করছি আমি নীতিটি কমবেশি বুঝতে পেরেছি তবে আমি নিশ্চিত নই এবং কীভাবে শুরু করব তা সম্পর্কে আমি নিশ্চিত নই। এইভাবে আমি ব্যাখ্যা করব যে আমি কীভাবে সমস্যাটি মোকাবিলা করব এবং আমি এই সমাধান সম্পর্কে একটি প্রতিক্রিয়া চাইব, আমাকে বলছি কোথায় আমি ভুল করছি এবং সম্ভবত প্রক্রিয়াটির বিস্তারিত ব্যাখ্যা এবং ব্যবহারিক জ্ঞানের কোনও লিঙ্ক আছে।
আমি কাজের জন্য যে ডেটাসেটটি ব্যবহার করব তা হ'ল আমার সমস্ত ফেসবুক এবং হোয়াটসঅ্যাপ চ্যাটের ইতিহাসের ডাম্প। আমি জানি না এটি কতটা বড় হবে তবে সম্ভবত এখনও যথেষ্ট পরিমাণে বড় নয়। টার্গেট ল্যাঙ্গুয়েজ ইংরাজী নয়, সুতরাং অর্থপূর্ণ কথোপকথনের নমুনাগুলি কোথায় দ্রুত সংগ্রহ করতে হয় তা আমি জানি না।
আমি প্রতিটি বাক্য থেকে একটি চিন্তার ভেক্টর তৈরি করতে যাচ্ছি। এখনও জানি না আসলে কীভাবে; আমি গভীরতার জন্য 4j ওয়েবসাইটে ওয়ার্ড 2vec এর জন্য একটি দুর্দান্ত উদাহরণ পেয়েছি, তবে বাক্যগুলির জন্য কিছুই নেই। আমি বুঝতে পারি কীভাবে শব্দের ভেক্টরগুলি তৈরি করা হয় এবং কেন, তবে বাক্য ভেক্টরগুলির জন্য আমি কোনও বিস্তৃত ব্যাখ্যা খুঁজে পাইনি।
ইনপুট এবং আউটপুট হিসাবে চিন্তার ভেক্টরগুলি ব্যবহার করে আমি নিউরাল নেটওয়ার্কটি প্রশিক্ষণ দিতে যাচ্ছি। আমি জানি না এর কত স্তর থাকা উচিত এবং কোনটি এলএসটিএম স্তর হতে হবে।
তারপরে আর একটি নিউরাল নেটওয়ার্ক থাকা উচিত যা একটি চিন্তার ভেক্টরকে একটি বাক্য রচনার চরিত্রের অনুক্রমে রূপান্তর করতে সক্ষম। আমি পড়েছি যে বিভিন্ন বাক্য দৈর্ঘ্যের জন্য আমার প্যাডিং ব্যবহার করা উচিত তবে আমি কীভাবে অক্ষরগুলিকে এনকোড করতে পারি তা মিস করি (কোডড পয়েন্টগুলি যথেষ্ট?)।