ব্যবহারকারী পাঠ্য ইনপুট উপর ভিত্তি করে তালিকা থেকে সবচেয়ে সম্ভাব্য বিকল্পটি কীভাবে নির্বাচন করবেন


11

আমি একটি ওসিআর অ্যাপ্লিকেশন নিয়ে কাজ করছি যেখানে আমাকে ব্যবহারকারী পাঠ্য ইনপুটের উপর ভিত্তি করে একটি বিকল্প নির্বাচন করতে হবে।

Ex:
Available Options:
["python", "ruby", "java", "clojure", "haskell"]

Input: kava
Output: java

Input: ruby
Output: ruby

Input: clujuro
Output: clojure

etc.. 

আমার অ্যাপ্লিকেশনটি পাইথন ভিত্তিক, এই সমস্যাটি সমাধান করার জন্য ইতিমধ্যে কি একটি অ্যালগরিদম রয়েছে?


1
এখনই এটি সংশোধন করা উপযুক্ত নয় তবে আইএমও আরও উপযুক্ত শিরোনাম হবে "স্ট্রিংগুলির মধ্যে দূরত্ব (পার্থক্য) কীভাবে নির্ধারণ করতে হবে"
জেফ ওয়েলিং

3
@ জেফ: এবং তারপরে আমি কখনই এই প্রশ্নটি খুঁজে পাব না, কারণ আমার যে ধারণাটি প্রয়োজন তা "দূরত্বের পার্থক্য" নামে ডাকা হতে পারে বলে আমার কোনও ধারণা নেই ... এবং সমাধানটি আপনার প্রয়োজনীয় সমাধান না করার একমাত্র কারণ নয় প্রশ্ন। এটি আপনার প্রকৃত সমস্যাটির বিকল্প সমাধানগুলির পরামর্শ দেওয়া থেকে বিরত থাকতে পারে। কেস পয়েন্ট: লাউডসাইটের উত্তর।
মার্জন ভেনেমা

1
আমার পয়েন্ট ছিল যে আপনি এখন কি করতে জানেন, একটি আরো সঠিক শিরোনাম ব্যবহার করে মানুষের নিকট থেকে উত্তর কে কী মানে হলো "কিভাবে সবথেকে সম্ভাব্য ... নির্বাচন করতে" কিন্তু যারা চিনতে হবে "স্ট্রিং মধ্যে দূরত্ব" জানি না আকৃষ্ট করতে সহায়তা করতে পারে, কিন্তু প্রতিটি তার নিজস্ব. এটি শুধু একটি প্রস্তাব ছিল। আপনি কী বোঝাতে চেয়েছিলেন তা আমি জানি না এবং এগুলি হওয়ায় আপনার প্রশ্নটিতে প্রায় ক্লিক করেননি।
জেফ ওয়েলিং

উত্তর:


10

এটি " আনুমানিক স্ট্রিং ম্যাচিং " বিভাগের অ্যালগরিদম দ্বারা সম্পন্ন হয় । দুটি স্ট্রিংয়ের তুলনা করার একটি সাধারণ পরিমাপকে লেভেনস্টাইন দূরত্ব বলে । একটা পাইথন বাস্তবায়ন উপলব্ধ এখানে

আপনি মূলত ইনপুটটিকে সম্ভাব্য আউটপুটগুলির সাথে তুলনা করুন এবং পছন্দসই আউটপুটটির সবচেয়ে ছোট দূরত্বের সাথে একটি চয়ন করুন।

উইকিপিডিয়া নিবন্ধে অন্যান্য বিভিন্ন অ্যালগরিদমের উল্লেখ রয়েছে যা আপনার আরও নির্দিষ্ট কিছু প্রয়োজন হলে আপনি চেষ্টা করতে পারেন।


রুবিতেও আমার একইরকম সমস্যা ছিল এবং আমি ঠিক এটি সমাধান করেছি।
জেফ ওয়েলিং

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.