সময় সিরিজে অসাধারণ সনাক্তকরণের জন্য ভাল প্যাকেজ খুঁজছেন


17

এমন কি একটি বিস্তৃত ওপেন সোর্স প্যাকেজ (પ્રાધાનায় পাইথন বা আর-তে) টাইম সিরিজে অসাধারণ সনাক্তকরণের জন্য ব্যবহার করা যেতে পারে?

সাইকিট-লার্নে একটি এক শ্রেণির এসভিএম প্যাকেজ রয়েছে তবে এটি সময় সিরিজের ডেটার জন্য নয়। আমি আরও পরিশীলিত প্যাকেজগুলির সন্ধান করছি যা উদাহরণস্বরূপ, বেইসিয়ান নেটওয়ার্কগুলি অসাধারণ সনাক্তকরণের জন্য ব্যবহার করে।


আমাদের একটি লিখতে হবে, ভাই !! : পি
অর্পিত সিসোদিয়া

উত্তর:


19

আমি জানি যে আমি এখানে কিছুটা দেরি করেছি, তবে হ্যাঁ আউটলেটারের সংমিশ্রণ-ফ্রেমওয়ার্কগুলির সাথে অসাধারণ সনাক্তকরণের জন্য একটি প্যাকেজ রয়েছে।

এটি এখনও গিথুবে উন্নয়নের প্রাথমিক পর্যায়ে রয়েছে এবং শীঘ্রই জেএমএলআর প্রকাশিত হবে।

প্যাকেজটি অজগর ভাষায় এবং প্যাকেজের নাম পাইড ( https://github.com/yzhao062/Pyod )।

নিম্নলিখিত স্বতন্ত্র পদ্ধতির জন্য এটিতে একাধিক অ্যালগরিদম রয়েছে:

  1. আউটিলার সনাক্তকরণের জন্য লিনিয়ার মডেলগুলি ( পিসিএ, ভিএমসিডি, ভন-ক্লাস এবং এসভিএম )
  2. প্রক্সিমিটি-ভিত্তিক আউটিলার সনাক্তকরণ মডেলগুলি ( এলএফ, সিবিএলএফ, এইচবিওএস, কেএনএন, অ্যাভারেজ কেএনএন এবং মেডিয়ান কেএনএন )
  3. আউটিলার সনাক্তকরণের জন্য সম্ভাব্য মডেলগুলি ( ABOD এবং ফাস্টাবোড )
  4. আউটলেট এনসেমবলস এবং কম্বিনেশন ফ্রেমওয়ার্ক ( আইসোলেশনফোরস্ট এবং ফিচারব্যাগিং )
  5. নিউরাল নেটওয়ার্ক এবং ডিপ লার্নিং মডেল ( সম্পূর্ণ সংযুক্ত নিউরাল নেটওয়ার্ক সহ অটো-এনকোডার )

অবশেষে, আপনি যদি প্রতি সেমে সময়-সিরিজের জন্য সন্ধান করে থাকেন তবে এই গিথব লিঙ্কটি কার্যকর হবে।

টাইমসারি আউটলেট সনাক্তকরণের জন্য এটিতে নিম্নলিখিত তালিকা প্যাকেজ রয়েছে:

datastream.io

দিগন্ত

banpei

AnomalyDetection


প্রসঙ্গ ভিত্তিক অস্বাভাবিকতা নিয়ে কাজ করার কোনও উপায়?
অর্পিত সিসোদিয়া

আপনি অসাধারণ সনাক্তকরণ বা আউটলেট সনাক্তকরণ সম্পর্কে কথা বলছেন? পার্থক্য আছে.
অর্পিত সিসোদিয়া

6

সময় সিরিজের অস্বাভাবিকতাগুলি হ্যান্ডেল করার একাধিক উপায় রয়েছে-

1) যদি অস্বাভাবিকতাগুলি জানা থাকে তবে একটি শ্রেণিবদ্ধকরণের মডেল তৈরি করুন। সময় সিরিজের ডেটার জন্য একই ধরণের অস্বাভাবিকতা সনাক্ত করতে এই মডেলটি ব্যবহার করুন।

২) যদি অস্বাভাবিকতা অজানা থাকে তবে আমরা আমাদের সংস্থায় যা করেছি তা হ'ল ক্লাস্টারিং এবং শ্রেণিবিন্যাসের সংমিশ্রণ-

প্রথমে এলএফ / কে-মানে / কুকের দূরত্ব ব্যবহারকারীদের শনাক্ত করতে। আমরা এখন ২ টি ক্লাস পেয়েছি বলে পুরো ডেটাটিকে শ্রেণিবদ্ধকরণ সমস্যায় রূপান্তর করুন- আউটলিয়ার এবং নরমাল। রান টাইমে (সময় সিরিজের ডেটা) অস্বাভাবিকতা সনাক্ত করতে এখন একটি শ্রেণিবদ্ধকরণ মডেল তৈরি করুন এবং নিয়ম (শ্রেণিবদ্ধকরণ মডেল) পান।

৩) যদি অস্বাভাবিকতা অজানা থাকে তবে আমার গবেষণার সময়, অস্বাভাবিকতা সনাক্তকরণের সর্বাধিক সাধারণ উপায় হল একটি সাধারণ মডেল তৈরি করা এবং সাধারণ মডেল (ত্রুটি) থেকে কোনও বিচ্যুতি অস্বাভাবিক, সুতরাং আপনার ক্ষেত্রে আপনি পরবর্তী সময়ের জন্য আপনার সময় সিরিজটি পূর্বাভাস করেছিলেন এবং তারপরে তুলনা করুন প্রকৃত মান সহ। যদি ত্রুটিটি প্রত্যাশার চেয়ে বেশি হয় তবে অস্বাভাবিক কিছু ঘটছে।

আমি পাইথন বা আর তে কোনও সরাসরি প্যাকেজ খুঁজে পাইনি, কারণ সত্যই অস্বাভাবিক কী তা কেউই জানে না: পি, সমস্ত ক্ষেত্রেই এটি বহিরাগত সনাক্তকরণের সাথে সম্পর্কিত।

কিছু দরকারী লিঙ্ক-

https://machinelearningstories.blogspot.com/2018/12/easiest-way-of-detection-abnormality.html

https://machinelearningstories.blogspot.com/2018/07/anomaly-detection-anomaly-detection-by.html


2

নবী লাইব্রেরি চেষ্টা করুন

নবী এমন একটি অ্যাডিটিভ মডেলের উপর ভিত্তি করে টাইম সিরিজের ডেটা পূর্বাভাসের জন্য একটি পদ্ধতি যেখানে নন-লিনিয়ার প্রবণতাগুলি বার্ষিক, সাপ্তাহিক এবং প্রতিদিনের seasonতুপরিষয়, এবং ছুটির প্রভাবগুলির সাথে খাপ খায়। এটি টাইম সিরিজের সাথে সবচেয়ে ভাল কাজ করে যার শক্তিশালী মৌসুমী প্রভাব এবং historicalতিহাসিক ডেটাগুলির বেশ কয়েকটি asonsতু রয়েছে। প্রবীণ হ'ল ডেটা মিস করার প্রবণতা এবং ট্রেন্ডে শিফট, এবং সাধারণত আউটলিয়ারদের ভালভাবে পরিচালনা করেন।

আরও এখানে: নবী লাইব্রেরির সাথে সময় সিরিজে অসাধারণ সনাক্তকরণ

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.