আমার এই অ্যাপ্লিকেশনটির সার্ভার লগ বিশ্লেষণ করার জন্য আমাকে এই কাজটি অর্পণ করা হয়েছিল যাতে ব্যতিক্রম লগ, ডাটাবেস লগ ইভেন্ট লগ ইত্যাদি রয়েছে। আমি মেশিন লার্নিংয়ে নতুন, আমরা ইলাস্টিক অনুসন্ধান এবং স্পার্কস এমএলিব (বা প্রেডিকশন) এর সাথে স্পার্ক ব্যবহার করি A কোন ব্যবহারকারী পরবর্তী ব্যতিক্রম ঘটতে পারে এবং কোন বৈশিষ্ট্যটিতে (এবং অ্যাপ্লিকেশনটির অপ্টিমাইজেশান উন্নত করতে অন্যান্য স্টাফের গোছা) আরও বেশি সম্ভাবনা রয়েছে তা ভবিষ্যদ্বাণী করতে সক্ষম হয়ে সংগ্রহিত ব্যতিক্রম লগগুলির ভিত্তিতে ফলাফলটি পূর্বাভাস দিতে সক্ষম হবে।
আমি ইলাস্টিক অনুসন্ধান থেকে স্পার্কে ডেটা নিখরচায় এবং ডেটা ফ্রেমগুলি তৈরি করতে এবং প্রয়োজনীয় ডেটা ম্যাপ করতে সক্ষম হয়েছি। আমি যেটি জানতে চাই তা হ'ল আমি কীভাবে আমার বাস্তবায়নের মেশিন লার্নিংয়ের দিকটির কাছে যাই। আমি নিবন্ধ এবং কাগজগুলির মধ্যে দিয়েছি যা ডেটা প্রিপ্রোসেসিং, ডেটা মডেলগুলি প্রশিক্ষণ এবং লেবেল তৈরি এবং তারপরে পূর্বাভাস উত্পন্ন করার বিষয়ে কথা বলে।
আমার কাছে প্রশ্নগুলি
আমি কীভাবে বহির্গমন লগ ডেটাগুলিকে সংখ্যামূলক ভেক্টরগুলিতে রূপান্তর করতে পারি যা প্রশিক্ষণ নিতে ডেটাসেটগুলিতে ব্যবহার করা যেতে পারে।
আমার ডেটাসেটকে প্রশিক্ষণের জন্য আমি কোন অ্যালগরিদম ব্যবহার করি (আমি সীমিত জ্ঞানের সাথে গত কয়েকদিন জড়ো করেছি, লিনিয়ার রিগ্রেশন বাস্তবায়নের জন্য আমি ভাবছিলাম, অনুগ্রহ করে প্রস্তাবটি প্রয়োগ করা ভাল)
কীভাবে এই সমস্যাটির কাছে যেতে হবে সে সম্পর্কে পরামর্শগুলি সন্ধান করছি।
ধন্যবাদ.