আমি আমাদের পণ্যগুলির একটিতে বেশ কয়েকটি লগ ফাইলে একটি ডেটা সেট তৈরি করার চেষ্টা করছি।
বিভিন্ন লগ ফাইলগুলির নিজস্ব বিন্যাস এবং নিজস্ব সামগ্রী রয়েছে; আমি তাদের সফলভাবে একসাথে গ্রুপ করেছি, কেবলমাত্র এক ধাপ বাকি ...
আসলে, লগ "বার্তা" সেরা তথ্য। আমার কাছে এই সমস্ত বার্তাগুলির বিস্তৃত তালিকা নেই এবং সেগুলির উপর ভিত্তি করে হার্ড কোড করা খারাপ ধারণা because কারণ সেই তালিকাটি প্রতিদিন পরিবর্তন হতে পারে।
আমি যা করতে চাই তা হ'ল মূল্য পাঠ্য থেকে পৃথক পৃথক করা (উদাহরণস্বরূপ: "লোড করা ফাইল XXX" হয়ে যায় (পরিচয়: "লোড করা ফাইল", মান: "XXX"))। দুর্ভাগ্যক্রমে, এই উদাহরণটি সহজ, এবং বাস্তব বিশ্বে বিভিন্ন লেআউট এবং কখনও কখনও একাধিক মান থাকে।
আমি স্ট্রিং কার্নেলগুলি ব্যবহার করার কথা ভাবছিলাম, তবে এটি ক্লাস্টারিংয়ের উদ্দেশ্যে করা হয়েছে ... এবং এখানে ক্লাসটিং প্রযোজ্য নয় (আমি বিভিন্ন ধরণের বার্তা এবং ইভেন্টের সংখ্যা জানি না, এটি খুব বেশি হবে))।
যদি আপনার কোন ধারণা আছে?
আপনার সাহায্যের জন্য ধন্যবাদ.
PS: যারা প্রোগ্রাম করেন তাদের পক্ষে এটি বোঝা আরও সহজ হতে পারে। ধরা যাক কোডটিতে লগগুলি প্রিন্টফ ("ব্লেবলা% s", "এক্সএক্সএক্সএক্সএক্স") রয়েছে -> আমি "ব্লেবলা" এবং "এক্সএক্সএক্সএক্স" আলাদা করতে চাই