সময় সিরিজের শ্রেণিবিন্যাসের জন্য বৈশিষ্ট্যগুলি


43

আমি ভেরিয়েবল দৈর্ঘ্যের এর টাইম সিরিজের উপর ভিত্তি করে (মাল্টিক্লাস) শ্রেণিবদ্ধার সমস্যাটি বিবেচনা করি , অর্থাৎ, , স্বতন্ত্র স্থির আকার এর নির্বাচিত বৈশিষ্ট্যগুলির একটি সেট দ্বারা টাইম বিশ্ব উপস্থাপনার মাধ্যমে , এবং তারপরে এই বৈশিষ্ট্য সেটটিতে মানক শ্রেণিবদ্ধকরণ পদ্ধতি ব্যবহার করুন। আমি না , পূর্বাভাস আগ্রহী অর্থাত অনুমান( এক্স টি ) = y [ 1 .. কে ]Tবনাম আমি ডি টি φ ( এক্স টি ) = V 1 , ... , বনাম ডিআর , x টি + + 1

f(XT)=y[1..K]for XT=(x1,,xT)with xtRd ,
viDT
ϕ(XT)=v1,,vDR ,
xT+1। উদাহরণস্বরূপ, কোনও ব্যক্তির লিঙ্গ সম্পর্কে পূর্বাভাস দেওয়ার জন্য আমরা কোনও ব্যক্তি যেভাবে হাঁটেন সেটি বিশ্লেষণ করতে পারি।

আমি যে স্ট্যান্ডার্ড বৈশিষ্ট্যগুলি বিবেচনা করতে পারি সেগুলি কী কী? উদাহরণস্বরূপ, আমরা স্পষ্টতই সিরি (এবং উচ্চতর অর্ডার মুহুর্তের) এর গড় এবং তারতম্যটি ব্যবহার করতে পারি এবং সেরি (বা ডিস্ক্রিট ওয়েভলেট ট্রান্সফর্ম ) এর ডিস্ক্রিট ফুরিয়ার ট্রান্সফর্মের কিছু বিরতিতে থাকা শক্তির মতো ফ্রিকোয়েন্সি ডোমেনটিও দেখতে পারি

উত্তর:


45

সহজ পরিসংখ্যান বৈশিষ্ট্য

  • পদ্ধতি প্রতিটি মাত্রাd
  • স্ট্যান্ডার্ড ডেভিয়েশন এর মাত্রাd
  • স্কিউনেস , ক্রুটোসিস ও উচ্চশিক্ষা ক্রম মুহূর্ত মাত্রাd
  • সর্বাধিক এবং সর্বনিম্ন মান

সময় সিরিয় বিশ্লেষণ সম্পর্কিত বৈশিষ্ট্য

ফ্রিকোয়েন্সি ডোমেন সম্পর্কিত বৈশিষ্ট্য

ডিএফটি এবং ডিডাব্লুটি- তে শক্তি সংরক্ষণ বৈশিষ্ট্যগুলির অধ্যয়নের জন্য মরিচেন ০৩ দেখুন

  • ফ্রিকোয়েন্সি পীক মধ্যে প্রশস্ততা মধ্যে DFTs জন্য detrended মাত্রাdk d
  • kএই ডিএফটিগুলির কোয়ান্টাইলগুলি

1
এমিল, এই প্রশ্নটি আমি ঠিক জিজ্ঞাসা করা একটির মতো ( stats.stackexchange.com/questions/51475/… )। আপনি কি ডিএফটি বৈশিষ্ট্যগুলির জন্য কোনও আর কোড পোস্ট করতে সক্ষম হবেন?
বি_মিনার

পরিবর্তনশীল দৈর্ঘ্যের সময় সিরিজের জন্য শেপলেটগুলির ভিত্তিতে কি কোনও পদ্ধতি আছে?
সাইমন

8

এমিল, আমি মনে করি আপনার উত্তরের তালিকাভুক্ত বৈশিষ্ট্যগুলি বেশ ভাল শুরু করার পয়েন্ট, যদিও বরাবরের মতো, আমি মনে করি আপনার সমস্যা সম্পর্কে কিছু ডোমেন দক্ষতা (বা কমপক্ষে একটি দীর্ঘ দীর্ঘ চিন্তাভাবনা) সমান গুরুত্বপূর্ণ।

আপনি আপনার সিগন্যালের ডেরিভেটিভস (বা ইন্টিগ্রাল) থেকে গণনা করা বৈশিষ্ট্যগুলি সহ বিবেচনা করতে চাইতে পারেন। উদাহরণস্বরূপ, আমি বাজি দেব যে দ্রুত ত্বরণ / হ্রাস দুর্ঘটনাজনিত ড্রাইভিংয়ের যথাযথ ভাল ভবিষ্যদ্বাণী is তথ্যটি এখনও অবস্থানের সংকেতে স্পষ্টত উপস্থিত রয়েছে তবে এটি প্রায় ততটা স্পষ্ট নয়।

আপনি ফুওরিয়ার সহগগুলি একটি ওয়েভলেট বা তরঙ্গলেটের প্যাকেটের উপস্থাপনার সাথে প্রতিস্থাপনের বিষয়টিও বিবেচনা করতে পারেন। ওয়েভলেটগুলির প্রধান সুবিধা হ'ল তারা আপনাকে ফ্রিকোয়েন্সি এবং সময় উভয় ক্ষেত্রেই কোনও বৈশিষ্ট্য স্থানীয়করণের অনুমতি দেয়, যখন theতিহ্যবাহী ফুরিয়ার সহগ কেবলমাত্র সময়ের মধ্যে সীমাবদ্ধ থাকে। এটি বিশেষত কার্যকর হতে পারে যদি আপনার ডেটাতে এমন উপাদান থাকে যা অনিয়মিতভাবে চালু / বন্ধ হয় বা স্কোয়ার ওয়েভ-জাতীয় ডাল রয়েছে যা ফুরিয়ার পদ্ধতিগুলির জন্য সমস্যাযুক্ত হতে পারে।


6

অন্যান্য উত্তরগুলির পরামর্শ অনুসারে, প্রচুর সময় সিরিজের বৈশিষ্ট্য রয়েছে যা সম্ভাব্য বৈশিষ্ট্য হিসাবে ব্যবহার করা যেতে পারে। এআর মডেলের সহগ বা উচ্চতর পরিশীলিত বৈশিষ্ট্য যেমন বর্ধিত ডিকি ফুলার হাইপোথিসিস পরীক্ষার পরীক্ষার পরিসংখ্যানের মতো গড়, সময় ধারাবাহিক বৈশিষ্ট্যগুলির মতো সাধারণ বৈশিষ্ট্য রয়েছে।

সম্ভাব্য সময় সিরিজের বৈশিষ্ট্যগুলি সম্পর্কে বিস্তৃত ওভারভিউ

পাইথন প্যাকেজ tsfresh এই বৈশিষ্ট্যগুলির নিষ্কাশন স্বয়ংক্রিয় করে। এর ডকুমেন্টেশন বিভিন্ন গণনা বৈশিষ্ট্য বর্ণনা করে। আপনি এখানে গণনা করা বৈশিষ্ট্য সহ পৃষ্ঠাটি সন্ধান করতে পারেন ।

দাবি অস্বীকার: আমি tsfresh এর অন্যতম লেখক।


5

আমি আপনাকে পরামর্শ দিই, হ্যান্ড ইঞ্জিনিয়ারড বৈশিষ্ট্যগুলি আহরণের জন্য ক্লাসিক পদ্ধতির পরিবর্তে অটোইনকোডারগুলি ব্যবহার করুন । অটেনকোডারগুলি গভীর শিক্ষার আর্কিটেকচারের বৈশিষ্ট্য নিষ্কাশনে গুরুত্বপূর্ণ ভূমিকা পালন করে।

স্বয়ংক্রিয়কোডার একটি ফাংশন শিখতে চেষ্টা করে । অন্য কথায়, এটি সনাক্তকরণ ফাংশনের একটি আনুমানিক শিখার চেষ্টা করছে, যাতে মতোই আউটপুট ।এক্স টি এক্স টিf(XT)XTX^TXT

সনাক্তকরণ ফাংশনটি বিশেষত তুচ্ছ ফাংশনটি শেখার চেষ্টা করছে বলে মনে হয়; তবে নেটওয়ার্কে সীমাবদ্ধতা রেখে যেমন লুকানো ইউনিটের সংখ্যা সীমিত রেখে আমরা ডেটা সম্পর্কে আকর্ষণীয় কাঠামোটি আবিষ্কার করতে পারি।

বৈশিষ্ট্য এক্সট্রাক্টর

এই ভাবে, আপনার পছন্দসই আপনাকে মধ্যবর্তী লুকানো ইউনিট সংখ্যা সীমিত যদি একটি গভীর autoencoder মধ্যে মধ্যবর্তী স্তর আউটপুট মান সমতুল্য হবে, ।ϕ(XT)=v1,,vDRD

তদতিরিক্ত, আপনার সমস্যার সর্বোত্তম সমাধানের জন্য আপনি অটোরকোডারগুলির অনেক স্বাদ ব্যবহার করতে পারেন ।



1

আপনার সময় সিরিজের দৈর্ঘ্যের উপর নির্ভর করে স্বাভাবিক পদ্ধতির মধ্যে ডেটাগুলিকে বিভাগগুলিতে সূচনা করা হয়, যেমন 10 সেকেন্ড।

যাইহোক, প্রায়শই সময়গুলিকে বিভাগগুলিতে বিভক্ত করার আগে ফিল্টারিং এবং আর্টিফ্যাক্ট প্রত্যাখ্যানের মতো কিছু প্রাক-প্রসেসিং সম্পাদন করা প্রয়োজন। তারপরে আপনি বিভিন্ন বৈশিষ্ট্য যেমন কম্পাঙ্কের উপর ভিত্তি করে (যেমন প্রতিটি যুগের জন্য একটি এফএফটি গ্রহণ করুন), সময় (উদাহরণস্বরূপ, সেই যুগের সময়-সিরিজের বিভিন্নতা ইত্যাদি) বা রূপবিজ্ঞান, (অর্থাত্ সংকেতের আকার) গণনা করতে পারেন / প্রতিটি যুগের সময় সিরিজ)।

সাধারণত টাইম-সিরিজ / সিগন্যালের বিভাগগুলিকে (epochs) শ্রেণীবদ্ধ করার জন্য ব্যবহৃত বৈশিষ্ট্যগুলি ডোমেন-নির্দিষ্ট তবে ওয়েভলেট / ফুরিয়ার বিশ্লেষণ কেবলমাত্র সেই সরঞ্জাম যা আপনাকে নিজের বৈশিষ্ট্যগুলি না বলে ফ্রিকোয়েন্সি / সময়-ফ্রিকোয়েন্সি ডোমেনে আপনার সিগন্যাল পরীক্ষা করতে দেয়।

শ্রেণিবিন্যাসের সমস্যায় প্রতিটি যুগের ক্লাস লেবেল যেমন 'সুখী' বা 'দু: খিত' থাকবে, আপনি প্রতিটি শ্রেণির জন্য গণনা করা 6 টি বৈশিষ্ট্য ব্যবহার করে 'সুখী' এবং 'দুঃখী' যুগের মধ্যে পার্থক্য করার জন্য একটি শ্রেণিবদ্ধকে প্রশিক্ষণ দেবেন।

প্রতিটি টাইম সিরিজ শ্রেণিবিন্যাসের জন্য একটি একক কেস উপস্থাপন করে এমন ইভেন্টে, আপনাকে সময় সিরিজের সমস্ত নমুনা জুড়ে প্রতিটি বৈশিষ্ট্য গণনা করতে হবে। এফএফটি কেবলমাত্র এখানে প্রাসঙ্গিক যদি সিগন্যালটি লিনিয়ার সময় আক্রমণকারী (এলটিআই) হয়, অর্থাত্ যদি সিগন্যালটি পুরো সময়ের সিরিজের স্থির হিসাবে বিবেচিত হতে পারে, যদি আগ্রহের সময়কালে সংকেত স্থির না হয়, তবে একটি তরঙ্গপত্র বিশ্লেষণ হতে পারে আরো উপযুক্ত. এই পদ্ধতির অর্থ হ'ল প্রতিটি সময় সিরিজ একটি বৈশিষ্ট্য ভেক্টর তৈরি করবে এবং শ্রেণিবিন্যাসের জন্য একটি কেস গঠন করবে।


আমি সর্বদা অনুভব করেছি যে ব্রেকিং টাইম সিরিজ, স্বাভাবিকভাবেই ধারাবাহিক প্রক্রিয়া, পৃথক সময়সীমার (বা মহাকাশ )গুলিতে পরিণত হয়, ফলে তথ্য হারাতে পারে। সিরিজটিতে প্রাকৃতিক যুগ না থাকলে, কেউ কীভাবে পর্বগুলি চয়ন করবেন? সম্ভবত পর্বগুলি পাওয়া যাবে যা কোনও পছন্দসই ফলাফলের সাথে খাপ খায়।
ক্যাম.ড্যাভিডসন.পিলন

1
নিশ্চিত হন না যে প্রতিটি যুগের ফলাফল অনুসারে একটি যুগের সন্ধান করা যেতে পারে তবে যেকোন ব্যবহারিক সমস্যার জন্য স্থায়ী অবিচ্ছিন্ন সিগন্যালের সাহায্যে সাময়িক তাত্পর্য বিবেচনার জন্য আপনাকে কোনও উপায় খুঁজে বের করতে হবে (যদি একটি সংকেত / সময়-ধারাবাহিকভাবে বিশ্লেষণাত্মকভাবে বর্ণিত হয় বা লিনিয়ার টাইম ইনগ্রানেন্ট হয়) এটি প্রয়োজনীয় নয়)। যুগের দৈর্ঘ্য আবার ডোমেন নির্দিষ্ট তবে সাধারণত সংক্ষিপ্ত হওয়ার জন্য বেছে নেওয়া হয় যে সুদের সময়কাল (মহাকাশ) এর অধীনে সংকেত স্থির থাকে।
বিগ্রিন

বিগ্রিন, আপনি কি ব্যাখ্যা করতে পারেন যে শ্রেণিবিন্যাসে ব্যবহৃত বৈশিষ্ট্যগুলি নির্বাচনের জন্য সিরিকে মহাকাশে ভাগ করে কী লাভ? আমি এই বিভাজনটি পরবর্তী গণনাগুলির (যেমন এফএফটি) সহায়ক হিসাবে দেখছি, তবে তাদের বৈশিষ্ট্যগুলি নির্বাচনের সাথে সম্পর্কিত কিছু হিসাবে নয়। হতে পারে এটি আপনার বর্ণিত "রূপচর্চা" এর সাথে সম্পর্কিত।
এমিল

ইওচগুলিতে বিভাজনটির বৈশিষ্ট্য নির্বাচনের সাথে কোনও সম্পর্ক নেই। আপনার যদি দীর্ঘ সিগন্যাল থাকে (উদাহরণস্বরূপ @ 100Hz রেকর্ডিংয়ের 10 ঘন্টা রেকর্ডিং) তবে পর্যায়ক্রমে আপনাকে কীভাবে সিগন্যালটি পরিবর্তিত হতে হবে তা পরীক্ষা করার জন্য আপনাকে এটিকে যুগের মধ্যে বিভক্ত করতে হবে। শ্রেণিবিন্যাসের সমস্যায় প্রতিটি যুগের ক্লাস লেবেল যেমন 'সুখী' বা 'দু: খিত' থাকবে, আপনি প্রতিটি শ্রেণির জন্য গণনা করা 6 টি বৈশিষ্ট্য ব্যবহার করে 'সুখী' এবং 'দুঃখী' যুগের মধ্যে পার্থক্য করার জন্য একটি শ্রেণিবদ্ধকে প্রশিক্ষণ দেবেন।
বিগ্রিন

ঠিক আছে :) এটি অবশ্যই আমার মূল প্রশ্নের সাথে সম্পর্কিত নয়। ক্লাসটি পুরো সিরিটিকে লেবেল করে এমন ক্ষেত্রে আমি বিবেচনা করি। আমি আমার প্রশ্নটি একটি স্পষ্ট উদাহরণ দিয়ে যুক্ত করতে যাচ্ছি।
এমিল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.