আমি একটি প্যাটার্ন মেলানো অ্যালগরিদম নিয়ে কাজ করছি যা একটি অ্যাসাইক্লিক সসীম রাষ্ট্র অটোমেটনের উত্পন্ন করে যা প্রদত্ত পাঠ্য স্ট্রিং এবং তার সমস্ত সাবস্ট্রিং গ্রহণ করে। এফএসএ অ্যালগরিদম কোনও সঙ্গীত প্রবাহের প্রতীকী উপস্থাপন (যেমন, এমআইডিআই ডেটা) চালিত হচ্ছে run প্রতিটি গানকে লেবেলযুক্ত 'বিভাগগুলিতে' ভাগ করার জন্য সংগীত স্ট্রিম প্রিপ্রোসেস করা হয়েছে। প্রতিটি গানের প্রতিটি বিভাগের জন্য একটি এফএসএ তৈরি করা হয়েছে: যদি আমার কাছে গান থাকে, প্রত্যেককে বিভাগে বিভক্ত করা হয় তবে আমার কাছে পৃথক এফএসএ থাকবে।
আমি প্রতিটি বিভাগের এফএসএকে আমার কর্পাসের অন্যান্য এফএসএর সাথে তুলনা করতে চাই। চূড়ান্ত লক্ষ্যটি হ'ল কোনও মিলের জায়গার মধ্যে ক্লাস্টারিং করা এবং তাদের নির্মাণ মেট্রিকগুলির সাথে সামঞ্জস্য অনুসারে বিভাগগুলির 'ক্লাস' নিয়ে আসা। সুতরাং, বিশেষ আগ্রহের বিষয় হ'ল প্রতিটি এফএসএ সংজ্ঞায়িত ব্যাকরণ (সেগমেন্টের সংগীত বিষয়বস্তুর মোটামুটি নির্দিষ্ট উপাদানগুলির সাথে সম্পর্কিত)। এমন কিছু কৌশল রয়েছে যা এই জাতীয় কিছুটির তুলনায় ভাল হতে পারে? কেএল-ডাইভারজেন্সটি মনে আসে (যেমন এটি কোনও প্রদত্ত এফএসএর সাথে যুক্ত স্ট্রিংগুলির সাথে বিতরণের তুলনা করে), যদিও আরও ভাল / আরও দক্ষ কৌশল থাকতে পারে?
এছাড়াও, দুঃখিত যদি এই প্রশ্নটি হয় (1) তুচ্ছ সহজ বা (2) কিছু গভীর ভুল বোঝাবুঝির ইঙ্গিত বা (3) অন্য কোথাও উত্তর দিয়েছে। আমি একটি বাস্তব নূব, ভাবেন!