আমি হিট মার্কোভ মডেলস এবং গাউসিয়ান মিশ্রণ মডেলগুলির মতো বেশ কয়েকটি পরিসংখ্যানের মডেলিংয়ে কাজ করি। আমি দেখতে পাচ্ছি যে প্রতিটি ক্ষেত্রে ভাল মডেলদের প্রশিক্ষণ দেওয়ার জন্য চূড়ান্ত ব্যবহারের মতো একই পরিবেশ থেকে নেওয়া একটি বৃহত (> 20000 বাক্য এইচএমএমদের জন্য বাক্য) প্রয়োজন। আমার প্রশ্নটি হ'ল:
- সাহিত্যে "পর্যাপ্ত" প্রশিক্ষণের ডেটা ধারণা আছে? "যথেষ্ট ভাল" প্রশিক্ষণের ডেটা কত?
- "ভাল" (যা একটি ভাল স্বীকৃতি নির্ভুলতা দেয় (> 80%)) প্রশিক্ষিত হতে মডেলগুলির জন্য কতগুলি বাক্য প্রয়োজন তা আমি কীভাবে গণনা করতে পারি?
- কোনও মডেলকে সঠিকভাবে প্রশিক্ষণ দেওয়া হয়েছে কিনা আমি কীভাবে জানতে পারি? মডেলের সহগগুলি কি এলোমেলো ওঠানামা প্রদর্শন শুরু করবে? যদি তা হয় তবে মডেল আপডেটের কারণে আমি এলোমেলো ওঠানামা এবং আসল পরিবর্তনগুলিকে কীভাবে আলাদা করব?
আরও বেশি ট্যাগ লাগলে দয়া করে এই প্রশ্নটি পুনরায় চালু করতে দ্বিধা বোধ করবেন।