আমি যা দেখেছি তা থেকে, (দ্বিতীয়-ক্রম) কানসার-নে স্মুথিং সূত্রটি কোনও উপায়ে বা অন্য হিসাবে দেওয়া হয়েছে
নর্মালাইজিং ফ্যাক্টর সহ হিসাবে দেওয়া হয়েছে
এবং ধারাবাহিকতা সম্ভাবনা একটি শব্দের
যেখানে প্রেক্ষিতে সংখ্যা বা, simplier দেখা গেল, স্বতন্ত্র শব্দের সংখ্যা প্রদত্ত শব্দ আগে বসে । আমি যা বুঝেছি সে থেকে সূত্রটি পুনরাবৃত্তভাবে প্রয়োগ করা যেতে পারে।
এখন এটি বিভিন্ন অ-গ্রাম দৈর্ঘ্যের জন্য অজানা প্রেক্ষাপটে পরিচিত শব্দগুলিকে পরিচালনা করে, তবে এটি কী ব্যাখ্যা করে না যে যখন অভিধানের বাইরে শব্দ থাকে তখন কী করা উচিত। আমি নিম্নলিখিত চেষ্টা এই উদাহরণে যা যে unigrams জন্য recursion পদক্ষেপে, । ডকুমেন্ট তারপর এই ব্যবহার করে - চেন ও গুডম্যান উদ্ধৃত - উপরের হিসাবে সূত্র ন্যায্যতা । পি 1 কে এন (ডাব্লু)=পিসিওএনটি(ডাব্লু)
যদিও এটি অজানা শব্দের উপস্থিতিতে । এর বাইরে কাজ করে তা দেখতে আমি ব্যর্থ । এই ক্ষেত্রে যেহেতু, স্পষ্টতই, অজানা শব্দটি প্রশিক্ষণের সেট সম্পর্কিত কিছু চালিয়ে যায় না। তেমনি এন-গ্রাম গণনা হতে ।পি সি ও এন টি ( অজানা ) = 0 সি(ডাব্লুএন-1,অজানা)=0
তদুপরি, পুরো শব্দটি শূন্য হতে পারে যদি অজানা শব্দের ক্রম - বলে, OOD শব্দের একটি ট্রিগার দেখা দেয়।
আমি কী মিস করছি?