"এ" "বি" এবং "সি" এর সাথে সম্পর্কিত। আমি কীভাবে দেখাব যে "বি" এবং "সি", এই প্রসঙ্গে, এর সাথেও সম্পর্কিত হতে পারে?
উদাহরণ:
সাম্প্রতিক ব্রডওয়ে নাটকটি সম্পর্কে কয়েকটি শিরোনাম এখানে দেওয়া হয়েছে:
- আল প্যাকিনো অভিনীত ডেভিড ম্যামেটের গ্লেঞ্জারি গ্লেন রস ব্রডওয়েতে খোলে
- 'গ্লেঞ্জারি গ্লেন রস'-তে আল পাচিনো: সমালোচকরা কী ভাবেন?
- আল প্যাকিনো ব্রডওয়ে টার্নের জন্য অভাবনীয় পর্যালোচনা অর্জন করেছেন
- থিয়েটারের পর্যালোচনা: গ্লেনজারি গ্লেন রস এর তারকাদের শক্ত বিক্রি করছে
- গ্লেঞ্জারি গ্লেন রস; আরে, কে ক্লিগ লাইটকে মেরেছিল?
সমস্যা:
এই রেকর্ডগুলির সাথে একটি अस्पष्ट স্ট্রিং ম্যাচ চালানো কিছু সম্পর্ক স্থাপন করবে, তবে অন্যদের নয়, যদিও একজন মানব পাঠক অনেক বড় ডেটাসেটে প্রসঙ্গ থেকে এটিকে বেছে নিতে পারে।
# 3 এর সাথে # 3 সম্পর্কিত সম্পর্কযুক্ত প্রস্তাবটি আমি কীভাবে খুঁজে পাব? উভয়ই সহজেই # 1 এর সাথে সংযুক্ত হতে পারে তবে একে অপরের সাথে নয়।
এই জাতীয় ডেটা বা কাঠামোর জন্য কি কোনও (গুগলেবল) নাম রয়েছে? আমি কোন ধরণের অ্যালগরিদম খুঁজছি?
গোল:
1000 টি শিরোনাম দেওয়া হয়েছে, এমন একটি সিস্টেম যা স্বয়ংক্রিয়ভাবে পরামর্শ দেয় যে এই 5 টি আইটেমগুলি সম্ভবত একই জিনিস।
সত্যি কথা বলতে কী, আমি এতক্ষণ ধরে প্রোগ্রাম করেছি যে আমি কীভাবে এই সমস্যাটি সঠিকভাবে প্রকাশ করতে পারি তার ক্ষতি করছি। (আমি কী জানি না তা আমি জানি না, যদি এটি বোঝা যায়)।
এটি একটি ব্যক্তিগত প্রকল্প এবং আমি পাইথনে এটি লিখছি। কোনও সহায়তা, পরামর্শ এবং পয়েন্টারগুলির জন্য আগাম ধন্যবাদ!