আমি নিশ্চিত নই যে এই প্রশ্নটি এখানে আছে কিনা এবং আমি ক্ষমা চাইব না তবে। আমি যা করতে চাই তা হ'ল একটি প্রোগ্রাম্যাটিক পদ্ধতিটি বিকাশ করা যাতে আমি সম্ভাব্যতার সাথে নির্ধারণ করতে পারি যে প্রদত্ত স্ট্রিংটি একটি স্ট্রিংয়ের "ব্যাবসায়" আছে কিনা "কিনা"। উদাহরণস্বরূপ, যদি আমার 10,000 টি মার্কিন শহরের নাম ব্যাগ থাকে এবং তারপরে আমার কাছে "ফিলাডেলফিয়া" স্ট্রিং থাকে, তবে আমি ইতিমধ্যে জানি যে মার্কিন শহরের নামগুলির ভিত্তিতে 'ফিলাডেলফিয়া' কোনও মার্কিন শহরের নাম হতে পারে তার কিছু পরিমাণগত পরিমাপ চাই। যদিও আমি জানি আমি এই প্রসঙ্গে জাল শহরের নামগুলি থেকে প্রকৃত শহরের নামগুলি পৃথক করতে পারব না, তবে আমি অন্তত "123.75" এবং "দ্রুত লাল শিয়ালটি অলস বাদামী কুকুরের উপরে ঝাঁপিয়ে পড়ে" এর মতো স্ট্রিং থাকার কথা আশা করব না কিছু প্রান্তিক।
শুরু করার জন্য, আমি লেভেনস্টাইন দূরত্বের দিকে তাকিয়েছি এবং সমস্যাগুলি কীভাবে সমাধান করতে চাইছি এর সাথে কিছুটা অনুরূপ কীভাবে এটি প্রয়োগ করা হয়েছে সে সম্পর্কে কিছুটা তাকিয়েছি। একটি আকর্ষণীয় অ্যাপ্লিকেশন আমি খুঁজে পেয়েছি হ'ল চৌর্যবৃত্তি সনাক্তকরণ, যেখানে একটি লেভেনস্টেনের দূরত্ব কীভাবে পরিবর্তিত স্মিথ-ওয়াটারম্যান অ্যালগরিদমের সাথে কাগজপত্র স্কোর করতে ব্যবহৃত হয়েছিল তা কীভাবে সম্ভবত প্রদত্ত বেস পেপারের প্লাগরাইজড সংস্করণ ছিল তার ভিত্তিতে কাগজপত্র স্কোর করতে ব্যবহৃত হয়েছিল। আমার প্রশ্ন হ'ল যদি কেউ আমাকে প্রতিষ্ঠিত অন্যান্য অ্যালগরিদম বা পদ্ধতিগুলি যা আমাকে সহায়তা করতে পারে তার সাথে সঠিক দিক নির্দেশ করতে পারে। আমি এই অনুভূতিটি পেয়েছি যে এটি অতীতে কেউ সমস্যা সমাধানের চেষ্টা করেছে তবে এখন পর্যন্ত আমার গুগল-ফু আমাকে ব্যর্থ করেছে।