আমার কাছে গাছের একটি বড় ডেটাসেট রয়েছে এবং আমি একটি ট্রলেলেট (সংযুক্ত সাবগ্রাফ্ট) নির্দিষ্ট করে এটি অনুসন্ধান করতে চাই । ক্যোরিয়ায় ডেটাসেটে ট্রিলেটের সমস্ত উপস্থিতি ফিরে পাওয়া উচিত।
এটি করার জন্য দক্ষ অ্যালগরিদম আছে কি?
আমি প্রত্যয় অ্যারেগুলির মতো কিছু ভাবছিলাম, তবে, নির্লজ্জভাবে গাছগুলিকে স্ট্রিং হিসাবে এনকোডিং করা (তাদের নোডগুলির একটি নির্দিষ্ট ট্র্যাভারসাল ক্রম দ্বারা) কাজ করবে না, যেহেতু অনুসন্ধানের উইলেটলেটটি যথেচ্ছ আকারের হতে পারে।
হালনাগাদ:
আমি যে সাধারণ উদাহরণগুলি আশা করি সে সম্পর্কে কিছু বিশদ:
ডেটাসেটটি কমপক্ষে দশ হাজার গাছের সমন্বয়ে গঠিত হবে, যার প্রত্যেকটিতে প্রায় বিশ থেকে ত্রিশটি নোড থাকে। গাছগুলি বাইনারি হবে না, তবে নোডে সাধারণত শিশুদের সংখ্যা ছোট হবে (সাধারণত চার বা পাঁচটির চেয়ে বড় নয়, যদিও কিছু অবক্ষয়ের ক্ষেত্রে এটি প্রায় ত্রিশের উপরে পৌঁছতে পারে)। লেবেলের সংখ্যা হাজার হাজারে থাকবে।
আমার প্রয়োজন এনএলপি অ্যাপ্লিকেশনগুলির জন্য: প্রতিটি গাছ একটি বাক্যটির নির্ভরতা বিশ্লেষণ, প্রতিটি নোড শব্দের উপস্থিতি এবং প্রতিটি লেবেল অভিধানের শব্দ (কিছু সজ্জা সহ) উপস্থাপন করে।