এই প্রশ্নের দ্বারা অনুপ্রাণিত হয়ে আমি ভাবছি যে খুব ছোট সংক্ষিপ্ত পাঠগুলির বৃহত সংগ্রহের জন্য টপিক মডেলগুলিতে কোনও কাজ করা হয়েছে কিনা। আমার স্বজ্ঞাততা হ'ল এই জাতীয় মডেলগুলির জন্য টুইটারের একটি প্রাকৃতিক অনুপ্রেরণা হওয়া উচিত। তবে কিছু সীমিত পরীক্ষা-নিরীক্ষার থেকে দেখে মনে হচ্ছে স্ট্যান্ডার্ড টপিক মডেলগুলি (এলডিএ ইত্যাদি) এই জাতীয় ডেটাতে বেশ খারাপভাবে পারফর্ম করে।
এই অঞ্চলে যে কাজ করা হয়েছে সেখানকার কেউ কি জানেন? এই কাগজটি টুইটারে এলডিএ প্রয়োগের বিষয়ে কথা বলেছে, তবে সংক্ষিপ্ত-দস্তাবেজের প্রসঙ্গে আরও ভাল সম্পাদন করা এমন অন্যান্য অ্যালগরিদম রয়েছে কিনা তা সম্পর্কে আমি সত্যিই আগ্রহী।