পটভূমি
আমি নেটওয়ার্ক অপারেশনস সেন্টারে কাজ করছি, আমরা কম্পিউটার সিস্টেম এবং তাদের কার্যকারিতা পর্যবেক্ষণ করি। নিরীক্ষণের জন্য মূল মেট্রিকগুলির মধ্যে একটি হ'ল প্রচুর দর্শনার্থী \ গ্রাহকরা বর্তমানে আমাদের সার্ভারগুলিতে সংযুক্ত। এটি দৃশ্যমান করার জন্য আমরা (অপ্স টিম) সময়-সিরিজের ডেটা এবং গ্রাফ আঁকার মতো মেট্রিকগুলি সংগ্রহ করি। গ্রাফাইট আমাদের এটি করার অনুমতি দেয়, এটির একটি দুর্দান্ত সমৃদ্ধ এপিআই রয়েছে যা আমি হঠাৎ ড্রপস (বেশিরভাগ) এবং অন্যান্য পরিবর্তন দেখা দিলে সতর্কতা ব্যবস্থা তৈরির জন্য আমাদের টিমকে অবহিত করি। আপাতত আমি গড় মানের উপর ভিত্তি করে একটি স্থিতিশীল প্রান্তিক স্থাপন করেছি কিন্তু দিন এবং সপ্তাহের সময় বিভিন্ন loadত্মের কারণে এটি খুব ভালভাবে কাজ করে না (প্রচুর ভুয়া-পজিটিভ রয়েছে) (alityতুপরিষে ফ্যাক্টর)।
এটি দেখতে এমন কিছু দেখাচ্ছে:
আসল ডেটা (একটি মেট্রিকের জন্য উদাহরণ, 15 মিনিটের সময়সীমা; প্রথম সংখ্যাটি বেশ কয়েকটি ব্যবহারকারী, দ্বিতীয় বারের স্ট্যাম্প):
[{"target": "metric_name", "datapoints": [[175562.0, 1431803460], [176125.0, 1431803520], [176125.0, 1431803580], [175710.0, 1431803640], [175710.0, 1431803700], [175733.0, 1431803760], [175733.0, 1431803820], [175839.0, 1431803880], [175839.0, 1431803940], [175245.0, 1431804000], [175217.0, 1431804060], [175629.0, 1431804120], [175104.0, 1431804180], [175104.0, 1431804240], [175505.0, 1431804300]]}]
আমি যা অর্জন করার চেষ্টা করছি
আমি একটি পাইথন স্ক্রিপ্ট তৈরি করেছি যা সাম্প্রতিক ডেটাপয়েন্টগুলি গ্রহণ করে, historicalতিহাসিক গড় এবং সতর্কতাগুলির সাথে তুলনা করে যদি হঠাৎ পরিবর্তন হয় বা ড্রপ হয়। মৌসুমীতার কারণে "স্থিতিশীল" প্রান্তিকতা ভাল কাজ করে না এবং স্ক্রিপ্টটি মিথ্যা-ধনাত্মক সতর্কতা তৈরি করে। আমি আরও সুনির্দিষ্ট হওয়ার জন্য একটি সতর্কতা অ্যালগরিদমকে উন্নত করতে চাই এবং সতর্কতার প্রান্তটি অবিচ্ছিন্নভাবে সুর না করে এটিকে কাজ করতে চাই।
আমার কী পরামর্শ এবং জিনিসগুলি আমি আবিষ্কার করেছি
গুগল করে আমি বুঝতে পেরেছি যে আমি বেমানান সনাক্তকরণের জন্য মেশিন লার্নিং অ্যালগরিদমগুলি খুঁজছি (নিরীক্ষণযোগ্যগুলি)। আরও তদন্তে দেখা গেছে যে এগুলির মধ্যে প্রচুর পরিমাণ রয়েছে এবং এটি আমার ক্ষেত্রে কোনটি প্রযোজ্য তা বোঝা খুব কঠিন। আমার সীমিত গণিত জ্ঞানের কারণে আমি পরিশীলিত পণ্ডিতের কাগজপত্র পড়তে পারি না এবং আমি ক্ষেত্রের কোনও শিক্ষানবিশকে সহজ কিছু সন্ধান করছি।
আমি পাইথন পছন্দ করি এবং আর এর সাথে কিছুটা পরিচিত, এইভাবে আমি এই ভাষার উদাহরণগুলি দেখে খুশি হব। দয়া করে একটি ভাল বই বা নিবন্ধের প্রস্তাব দিন যা আমাকে আমার সমস্যা সমাধানে সহায়তা করবে। আপনার সময় জন্য আপনাকে ধন্যবাদ এবং এত দীর্ঘ বিবরণ জন্য ক্ষমা
দরকারী লিংক
অনুরূপ প্রশ্ন:
- সময় সিরিজ এবং অসাধারণ সনাক্তকরণ
- পাইথনের সাথে টাইম সিরিজ অ্যানোমালি সনাক্তকরণ
- সময়ের ধারাবাহিকতা
- টাইম সিরিজের অ্যানোমালি সনাক্তকরণের জন্য অ্যালগরিদম
- সময়-সিরিজ-ভিত্তিক অ্যানোমালি সনাক্তকরণের অ্যালগোরিদমে ওয়েবেলেটগুলির প্রয়োগ
- আমার কোন অ্যালগরিদম ব্যবহার করা উচিত?
বাহ্যিক সংস্থানসমূহ:
auto.arima
আর এর দুর্দান্ত forecast
প্যাকেজ ( jstatsoft.org/v27/i03/paper দেখুন ) থেকে ফাংশনটি ব্যবহার করে নিয়মিত পর্যায়ক্রমিক পূর্বাভাস তৈরি করে সতর্কতা সেটআপ করা । আপনি level
প্যারামিটারটি সামঞ্জস্য করে আত্মবিশ্বাসের স্তরগুলিকে টিউন করতে পারেন , যেমন data.model <- auto.arima(data.zoo, ic = c("bic")); data.prediction.warningLimits <- forecast(data.model, h=1, level=0.99)
।