সময়-সিরিজ-ভিত্তিক অ্যানোমালি সনাক্তকরণের অ্যালগোরিদমে ওয়েবেলেটগুলির প্রয়োগ


25

আমি অ্যান্ড্রু মুরের স্ট্যাটিস্টিকাল ডেটা মাইনিং টিউটোরিয়ালগুলির মাধ্যমে আমার পথে কাজ শুরু করেছি (এই ক্ষেত্রে প্রথমে যে কারও পক্ষে উদ্যোগী হওয়ার জন্য অত্যন্ত প্রস্তাবিত)। আমি "টাইম-সিরিজ ভিত্তিক অ্যানোমালি ডিটেকশন অ্যালগরিদমগুলির পরিচিতি ওভারভিউ" শিরোনামে এই অত্যন্ত আকর্ষণীয় পিডিএফটি পড়তে শুরু করেছিলাম যেখানে মুর রোগের প্রাদুর্ভাবগুলি সনাক্ত করতে একটি অ্যালগরিদম তৈরিতে ব্যবহৃত বিভিন্ন কৌশলগুলির মাধ্যমে সনাক্ত করেছিলেন। স্লাইডগুলির অর্ধেকের মধ্যে, পৃষ্ঠা 27 এ, তিনি প্রাদুর্ভাবগুলি সনাক্ত করতে ব্যবহৃত অন্যান্য "শিল্প পদ্ধতির রাজ্য" তালিকাভুক্ত করেছেন। তালিকাভুক্ত প্রথমটি হ'ল ওয়েভলেট । উইকিপিডিয়া একটি তরঙ্গচিত্র হিসাবে বর্ণনা করে

প্রশস্ততার সাথে একটি তরঙ্গের মতো দোলন যা শূন্য থেকে শুরু হয়, বৃদ্ধি পায় এবং তারপরে শূন্যে ফিরে আসে। এটি সাধারণত "সংক্ষিপ্ত দোলন" হিসাবে ভিজ্যুয়ালাইজ করা যায়

তবে পরিসংখ্যানগুলিতে তাদের প্রয়োগের বর্ণনা দেয় না এবং আমার গুগল অনুসন্ধানগুলিতে উচ্চতর একাডেমিক গবেষণাপত্র পাওয়া যায় যা ওয়েবেলেটস কীভাবে এই সংক্রান্ত পরিসংখ্যান বা পূর্ণাঙ্গ বইয়ের সাথে সম্পর্কিত of

সময়-সিরিজের অসাধারণ সনাক্তকরণে তরঙ্গকরণগুলি কীভাবে প্রয়োগ করা হয় তার একটি প্রাথমিক বোধ আমি চাই, মুর তার টিউটোরিয়ালে অন্যান্য কৌশলগুলি যেভাবে চিত্রিত করেছেন in কেউ কীভাবে ওয়েভলেটগুলি ব্যবহার করে সনাক্তকরণ পদ্ধতিগুলি বা বিষয়টি সম্পর্কিত একটি বোধগম্য নিবন্ধের লিঙ্কের কীভাবে একটি ব্যাখ্যা সরবরাহ করতে পারেন?

উত্তর:


19

ওয়েভলেটগুলি সিগন্যালে এককতা খুঁজে পাওয়ার জন্য দরকারী (উদাহরণস্বরূপ কাগজটি এখানে দেখুন (উদাহরণের জন্য চিত্র 3 দেখুন) এবং এই গবেষণাপত্রে উল্লিখিত রেফারেন্সগুলি I আমি অনুমান করি যে সিঙ্গুলিটি কখনও কখনও অস্বচ্ছলতা হতে পারে?

এখানে ধারণাটি হ'ল কন্টিনিউস ওয়েভলেট ট্রান্সফর্ম (সিডাব্লুটি) এর ম্যাক্সিমা লাইন থাকে যা ফ্রিকোয়েন্সি বরাবর প্রচার করে, অর্থাৎ লাইনটি যত দীর্ঘ হয় তত বেশি উচ্চতর এককতা হয়। আমি কী বলতে চাইছি তা দেখতে কাগজে চিত্র 3 দেখুন! মনে রাখবেন যে সেই কাগজের সাথে সম্পর্কিত মাতলাব কোড রয়েছে, এটি এখানে থাকা উচিত ।


অতিরিক্ত হিসাবে, আমি আপনাকে বিশ্লেষণের কিছু হরিস্টিকস দিতে পারি কেন ডিসক্রিটিই (পূর্ববর্তী উদাহরণটি ধারাবাহিক একের সম্পর্কে) ওয়েভলেট ট্রান্সফর্ম ( ডিডাব্লুটি ) কোনও পরিসংখ্যানবিদদের জন্য আকর্ষণীয় (অজুহাত ছাড়াই):

  • (বাস্তববাদী (বেসভ স্পেস)) সংকেতগুলির একটি বিস্তৃত শ্রেণি রয়েছে যা তরঙ্গলেখার রূপান্তর দ্বারা একটি স্পার সিকোয়েন্সে রূপান্তরিত হয়। ( সংক্ষেপণ সম্পত্তি )
  • প্রায় বিচ্ছিন্ন বৈশিষ্ট্য ( সজ্জা সম্পত্তি ) এর ক্রমিকায় রুপান্তরিত (আধা-স্টেশনারি) প্রক্রিয়াগুলির একটি বিস্তৃত শ্রেণি
  • ওয়েভলেট সহগের মধ্যে এমন তথ্য রয়েছে যা সময় এবং ফ্রিকোয়েন্সিতে (বিভিন্ন স্কেলে) স্থানীয়করণ হয় । (বহু-স্কেল সম্পত্তি)
  • সিগন্যালের ওয়েভলেট সহগগুলি এর একাগুলিতে মনোনিবেশ করে

19

উপস্থাপনের যে তালিকাটি আপনি উল্লেখ করেছেন তা আমার কাছে মোটামুটি স্বেচ্ছাচারী বলে মনে হচ্ছে এবং যে কৌশলটি ব্যবহার করা হবে তা সত্যই নির্দিষ্ট সমস্যার উপর নির্ভর করবে। তবে আপনি খেয়াল করবেন যে এতে কলম্যান ফিল্টারও রয়েছে , তাই আমি সন্দেহ করি যে উদ্দিষ্ট ব্যবহার ফিল্টারিং কৌশল হিসাবে রয়েছে। ওয়েভলেট রূপান্তরগুলি সাধারণত সিগন্যাল প্রক্রিয়াজাতকরণের অধীনে আসে এবং প্রায়শই খুব কোলাহলযুক্ত ডেটার সাথে প্রাক-প্রসেসিং পদক্ষেপ হিসাবে ব্যবহৃত হবে। একটি উদাহরণ হ'ল চেন এবং ঝানের " মাল্টি-স্কেল অসাধারণ সনাক্তকরণ " কাগজ (নীচে দেখুন)। পদ্ধতির মূল শোরগোল সিরিজের পরিবর্তে বিভিন্ন বর্ণালী নিয়ে বিশ্লেষণ চালানো হবে।

ওয়েভলেটগুলি প্রায়শই একটি অবিচ্ছিন্ন সময় ফুরিয়ার রূপান্তর সাথে তুলনা করা হয়, যদিও তাদের সময় এবং ফ্রিকোয়েন্সি উভয় ক্ষেত্রেই স্থানীয়করণের সুবিধা রয়েছে। ওয়েভলেটগুলি উভয়ই সিগন্যাল সংক্ষেপণের জন্য এবং স্মুথিংয়ের জন্য (ওয়েভলেট সংকোচন) ব্যবহার করা যেতে পারে। শেষ পর্যন্ত ওয়েভলেট ট্রান্সফর্মটি প্রয়োগের পরে আরও পরিসংখ্যান প্রয়োগ করার অর্থটি বোধগম্য হতে পারে (উদাহরণস্বরূপ স্বতঃ-সম্পর্ক সম্পর্কিত ফাংশনটি দেখে)। তরঙ্গপত্রের আরও একটি দিক যা অসাধারণ সনাক্তকরণের জন্য কার্যকর হতে পারে তা হল স্থানীয়করণের প্রভাব: যথা, একটি বিচ্ছিন্নতা কেবল তার কাছাকাছি থাকা তরঙ্গলেটের উপর প্রভাব ফেলবে (ফুরিয়ার রূপান্তরের বিপরীতে)। এর একটি অ্যাপ্লিকেশন হ'ল স্থানীয়ভাবে স্টেশনারি সময় সিরিজ (একটি এলএসডাব্লু ব্যবহার করে) সন্ধান করা।

গাই ন্যাসনের একটি দুর্দান্ত বই রয়েছে যা আমি আপনাকে সুপারিশ করব যদি আপনি ব্যবহারিক পরিসংখ্যান প্রয়োগে আরও গবেষণা করতে চান: " স্টাটিক্স ইন ওয়েভলেট পদ্ধতি উইথ আর "। এটি পরিসংখ্যানগত বিশ্লেষণে ওয়েভলেটগুলির প্রয়োগটিকে বিশেষভাবে লক্ষ্যবস্তু করে তুলছে এবং তিনি সমস্ত কোডের সাথে ( তরঙ্গপথের প্যাকেজ ব্যবহার করে ) অনেকগুলি বাস্তব বিশ্বের উদাহরণ সরবরাহ করেন । নাসনের বইটি "অসাধারণ সনাক্তকরণ" কে বিশেষভাবে সম্বোধন করে না, যদিও এটি একটি সাধারণ ওভারভিউ সরবরাহ করার জন্য অ্যাডমিরাল কাজ করে।

শেষ অবধি, উইকিপিডিয়া নিবন্ধটি অনেক ভাল সূচক উল্লেখ সরবরাহ করে, তাই এটি বিশদভাবে এটি মূল্যবান।

[পার্শ্ব নোট হিসাবে: আপনি যদি পরিবর্তন পয়েন্ট সনাক্তকরণের জন্য কোনও ভাল আধুনিক কৌশল সন্ধান করছেন তবে আমি আপনার নির্দিষ্ট ক্ষেত্রে তরঙ্গপত্র ব্যবহার করার উপযুক্ত কারণ না থাকলে ওয়েভলেট পদ্ধতিগুলির সাথে খুব বেশি সময় ব্যয় করার আগে এইচএমএম চেষ্টা করার পরামর্শ দেব)। এটি আমার ব্যক্তিগত অভিজ্ঞতার ভিত্তিতে। অবশ্যই অন্যান্য অনেক ননলাইনার মডেল রয়েছে যা বিবেচনা করা যেতে পারে, সুতরাং এটি আপনার নির্দিষ্ট সমস্যার উপর নির্ভর করে]]


1
এটি কীভাবে গোপনীয় মার্কভ মডেলগুলি অসাধারণ সনাক্তকরণের জন্য ব্যবহৃত হয় তা আমার কাছে পরিষ্কার নয় তবে আমি খুব জানতে চাই। আমার কাছে যে অংশটি বিশেষভাবে অস্পষ্ট তা হ'ল অর্থবহ সংক্রমণ সম্ভাবনার সাথে সঠিক অন্তর্নিহিত রাষ্ট্রীয় যন্ত্রটি কীভাবে তৈরি করা যায় (যদি না এটি "দু'দেশের মধ্যে একটি ভঙ্গুর পরিবর্তনের সম্ভাবনা সম্বলিত" ব্যঙ্গ "এবং" বিহীন নয় "এর মতো মাত্র দুটি রাজ্য না হয়)।
জন রবার্টসন

6

সর্বাধিক ব্যবহৃত এবং প্রয়োগিত বিচ্ছিন্ন তরঙ্গকরণ ভিত্তিক ফাংশন (রবিনের উত্তরে বর্ণিত সিডাব্লুটি থেকে পৃথক) দুটি দুর্দান্ত বৈশিষ্ট্য রয়েছে যা এগুলিকে অনাদায়ী সনাক্তকরণের জন্য দরকারী করে:

  1. তারা নিখুঁতভাবে সমর্থিত।
  2. তাদের সমর্থন দ্বারা নির্ধারিত পাস-ব্যান্ডের সাহায্যে তারা ব্যান্ড-পাস ফিল্টার হিসাবে কাজ করে।

ব্যবহারিক শর্তাদির অর্থ এর অর্থ হ'ল আপনার বিচ্ছিন্ন তরঙ্গলেখার পচনটি বিভিন্ন স্কেল এবং ফ্রিকোয়েন্সি ব্যান্ডের বিভিন্ন স্থানে সিগন্যালের স্থানীয় পরিবর্তনের দিকে নজর দেয়। যদি আপনার কাছে (উদাহরণস্বরূপ) বৃহত্তর মাত্রা, উচ্চ-ফ্রিকোয়েন্সি শব্দটি কোনও ফাংশন জুড়ে সুপারম্পোজড যা একটি দীর্ঘ সময়ের জন্য নিম্ন-মাত্রার শিফটটি প্রদর্শন করে, তরঙ্গকরণ রূপান্তরটি দক্ষতার সাথে এই দুটি স্কেলকে আলাদা করবে এবং আপনাকে বেসলাইন শিফটটি দেখতে দেবে যে আরও অনেকগুলি কৌশল মিস করবে; এই বেসলাইনের একটি পরিবর্তনটি কোনও রোগের প্রাদুর্ভাব বা অন্য কোনও আগ্রহের পরিবর্তনের পরামর্শ দিতে পারে। অনেক উপায়ে, আপনি পচাটি নিজেকে মসৃণ হিসাবে বিবেচনা করতে পারেন (এবং ননপ্যারমেট্রিক অনুমানের মধ্যে তরঙ্গীকরণ সহগের জন্য দক্ষ সংকোচনের জন্য বেশ কিছুটা কাজ করা হয়েছে, যেমন দোনোহো দ্বারা তরঙ্গলেটের উপর বেশ কিছু) দেখুন। খাঁটি ফ্রিকোয়েন্সি ভিত্তিক পদ্ধতিগুলির থেকে পৃথক, কমপ্যাক্ট সমর্থনটির অর্থ হ'ল তারা অ-স্টেশনারি ডেটা পরিচালনা করতে সক্ষম। নিখুঁতভাবে সময় ভিত্তিক পদ্ধতির থেকে পৃথক, তারা কিছু ফ্রিকোয়েন্সি ভিত্তিক ফিল্টারিংয়ের জন্য অনুমতি দেয়।

ব্যবহারিক পদগুলিতে, অসঙ্গতিগুলি সনাক্ত করতে বা পয়েন্টগুলি পরিবর্তনের জন্য, আপনি একটি পৃথক তরঙ্গলেখা রূপান্তর প্রয়োগ করতে পারেন (সম্ভবত যে রূপটি "সর্বাধিক ওভারল্যাপ ডিডাব্লুটি" বা "শিফট ইনভেরিয়েন্ট ডিডাব্লুটি" নামে পরিচিত, আপনি কে পড়েন তার উপর নির্ভর করে) এবং দেখুন বেসলাইনে আপনার উল্লেখযোগ্য শিফট রয়েছে কিনা তা দেখার জন্য সহগের নিম্ন-ফ্রিকোয়েন্সি সেটগুলিতে। দিনের যে কোনও শব্দের নীচে দীর্ঘমেয়াদী পরিবর্তন ঘটতে থাকে তা এটি আপনাকে দেখায়। পার্সিভাল এবং ওয়ালডেন (নীচে রেফারেন্সগুলি দেখুন) পরিসংখ্যানগতভাবে উল্লেখযোগ্য সহগের জন্য কয়েকটি পরীক্ষা নেওয়া যা আপনি দেখতে এটি ব্যবহার করতে পারেন যে এর মতো শিফটটি উল্লেখযোগ্য কিনা তা।

পৃথক তরঙ্গসমাজের জন্য একটি দুর্দান্ত রেফারেন্স কাজ হ'ল পার্সিভাল এবং ওয়াল্ডেন, "টাইম সিরিজ বিশ্লেষণের জন্য ওয়েভলেট পদ্ধতি"। একটি ভাল সূচনামূলক কাজ হ'ল বুরাস, গোপীনাথ এবং গুওর "তরঙ্গকরণ এবং তরঙ্গকরণ রূপান্তরগুলির একটি প্রাইমার" এর পরিচিতি। যদি আপনি কোনও ইঞ্জিনিয়ারিং ব্যাকগ্রাউন্ড থেকে আসেন, তবে "ইঞ্জিনিয়ার এবং বিজ্ঞানীদের জন্য তরঙ্গকরণের উপাদানগুলি" সিগন্যাল-প্রসেসিং দৃষ্টিকোণ থেকে একটি ভাল ভূমিকা।

(রবিনের মন্তব্য অন্তর্ভুক্ত করতে সম্পাদিত)


আপনি যে প্রথম বক্তব্যটি উল্লেখ করেছেন তা সাধারণভাবে মিথ্যা আমি আপনাকে পরামর্শ দিচ্ছি যে আপনি দাউবাচির বইতে বই অ্যান্ড্রয়েড.সো.আর / অধ্যায়টির প্রথম বাক্যটি পড়ুন । এছাড়াও, আপনি যদি আমার উত্তরটি পড়ে থাকেন তবে আমি ইতিমধ্যে আমার উত্তরের ২ য় অংশে ডিডাব্লুটিটির দুর্দান্ত সম্পত্তিটি উল্লেখ করেছি ...
রবিন গিরিড

প্রথম দিক পর্যন্ত, আপনি ঠিক বলেছেন। আমার বলা উচিত ছিল "সর্বাধিক ব্যবহৃত / প্রয়োগিত বিচ্ছিন্ন তরঙ্গলেটের ভিত্তি কার্যাদি"; আমি এটি প্রতিফলিত করতে সম্পাদনা করব। দ্বিতীয় বিন্দুতে, আপনি কীভাবে কিছু সিডব্লিউটি (প্রায়শই একটি ডিওজি তরঙ্গলিটি বা সম্পর্কিত রিকার তরঙ্গি; উদাহরণস্বরূপ গ্যাবার তরঙ্গলেটি আপনার বর্ণিত আচরণটি সরবরাহ করে না) কীভাবে এককতার ধরণের অসঙ্গতিগুলি সনাক্ত করতে পারে তার জন্য আপনি একটি ভাল উত্তর দিয়েছেন। আমি অন্যান্য ধরণের অসঙ্গতি সনাক্তকরণের জন্য কীভাবে ডিডব্লিউটি ব্যবহার করতে পারি তার একটি উপমা বর্ণনা দেওয়ার চেষ্টা করছিলাম।
ধনী

আপনি যে দ্বিতীয় পয়েন্টটি উল্লেখ করেছেন এটিও ভুয়া হতে পারে: তরঙ্গপত্র সমর্থন (যদি এটি কমপ্যাক্ট থাকে) ফ্রিকোয়েন্সি লোকালাইজেশন নয় তরঙ্গলেটের অস্থায়ী স্থানীয়করণ সম্পর্কে তথ্য দিচ্ছে।
রবিন গিরার্ড

বিচ্ছিন্ন তরঙ্গপত্রগুলি - বা কমপক্ষে কমপক্ষে বিপুল সংখ্যাগরিষ্ঠ যা প্রয়োগ করা হয় এবং সাধারণত ব্যবহৃত হয় - সাধারণত কমপ্যাক্ট সমর্থন সীমাবদ্ধতার অধীনে দরকারী ফ্রিকোয়েন্সি ভিত্তিক বৈশিষ্ট্যগুলির জন্য ডিজাইন করা হয়। উদাহরণস্বরূপ, ডাউবিচিজের অদৃশ্য মুহুর্তের অবস্থাটি পাস-ব্যান্ডের ফ্ল্যাটনেসের সমান। ওয়েভলেটগুলির ফ্রিকোয়েন্সি স্থানীয়করণের বৈশিষ্ট্যগুলি সাধারণত যা গুণাগুণগুলিকে বিচ্ছিন্ন উপস্থাপনা হতে পরিচালিত করে এবং "সংকেত + অ্যাডিটিভ শূন্য-গড় শব্দ" অনুমানের অধীনে গোলমালের পরিবর্তনের অনুমানের অনুমতি দেয়।
ধনী
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.