মাল্টিভারিয়েট সময় সিরিজ শ্রেণিবদ্ধ করুন


9

আমার কাছে প্রায় 40 টি মাত্রা সহ টাইম সিরিজ (8 পয়েন্ট) নিয়ে গঠিত ডেটার একটি সেট রয়েছে (সুতরাং প্রতিটি সময় সিরিজটি 8 বাই 40 হয়)। সংশ্লিষ্ট আউটপুট (বিভাগগুলির জন্য সম্ভাব্য ফলাফল) 0 বা 1 এর আইথির।

একাধিক মাত্রা সহ টাইম সিরিজের জন্য শ্রেণিবদ্ধ ডিজাইন করার জন্য সর্বোত্তম পদ্ধতির কী হবে?

আমার প্রাথমিক কৌশলটি সেই সময় সিরিজ থেকে বৈশিষ্ট্যগুলি আহরণ করা ছিল: প্রতিটি মাত্রার জন্য গড়, স্ট্যান্ড, সর্বাধিক প্রকরণ। আমি একটি ডেটাসেট পেয়েছি যা আমি র‌্যান্ডম ট্রিফোরস্টকে প্রশিক্ষণ দিয়েছি। এর মোট নির্লিপ্ততা সম্পর্কে সচেতন হওয়া, এবং খারাপ ফলাফল পাওয়ার পরে, আমি এখন আরও উন্নত মডেলটির সন্ধান করছি।

আমার সীসাগুলি নিম্নরূপ: প্রতিটি মাত্রার জন্য সিরিজকে শ্রেণিবদ্ধ করুন (কেএনএন অ্যালগরিদম এবং ডিডাব্লুটি ব্যবহার করে), পিসিএর সাথে মাত্রিকতা হ্রাস করুন এবং বহু মাত্রিক বিভাগগুলির সাথে একটি চূড়ান্ত শ্রেণিবদ্ধ ব্যবহার করুন। এমএল-তে তুলনামূলকভাবে নতুন হওয়ায় আমি জানি না যে আমি সম্পূর্ণ ভুল don't


আপনি যা করছেন তা হ'ল একটি দুর্দান্ত উপায়। আপনার ডেটাসেটে আপনার কতটি নমুনা রয়েছে?
কসরা মনশায়ে

আমার প্রায় 500 000 সময় সিরিজ রয়েছে (প্রত্যাহার করে যে প্রতিটি সময় সিরিজটি 8 টাইমস্ট্যাম্প * 40 টি মাত্রা)

আপনি কি কেবল 320 টি বৈশিষ্ট্য কাঁচা ব্যবহারের চেষ্টা করেছেন?
3,000

@ জান ভ্যান ডের ভেজিট: আমি নিউরাল নেটওয়ার্ক ব্যবহার করে সেই পদ্ধতিটি চেষ্টা করেছি, তবে ফলাফলগুলি এতটা দৃ .়প্রত্যয়ী ছিল না - আমি কোনও প্রাক প্রক্রিয়াজাতকরণ ছাড়াই কাঁচা তথ্য ব্যবহার করেছি used ক্লাসিফায়ারকে খাওয়ানোর জন্য আমার 320-বৈশিষ্ট্যযুক্ত রগুলিতে আগে কী অপারেশনগুলি প্রয়োগ করতে হবে?
AugBar

1
আপনার ইনপুটটিকে সাধারণীকরণের ক্ষেত্রে কোনও নিউরাল নেটওয়ার্ক গুরুত্বপূর্ণ, আপনার বৈশিষ্ট্যগুলির যে পরিসরের জন্য তা গুরুত্বপূর্ণ depending তবে আমি কেবল একটি আরএফটিতে কাঁচা বৈশিষ্ট্যগুলি খাওয়াতে পারি এবং এটি কতটা ভাল কাজ করে তা দেখতে আপনি খুব সহজেই
এগুলি

উত্তর:


5

আপনি সঠিক পথে আছেন সময় এবং ফ্রিকোয়েন্সি ডোমেন উভয়ই আরও কয়েকটি বৈশিষ্ট্য গণনা করে দেখুন। যতক্ষণ নমুনাগুলির সংখ্যা >> বৈশিষ্ট্য সংখ্যা, আপনি বেশি পরিমাণে ফিট হওয়ার সম্ভাবনা নেই। একই সমস্যা আছে কোন সাহিত্য আছে? যদি তা হয় তবে তা সর্বদা একটি দুর্দান্ত সূচনা পয়েন্ট সরবরাহ করে।

এক্সগুস্ট বা লাইটজিবিএম এর মতো একটি বুস্টেড ট্রি ক্লাসিফায়ার ব্যবহার করে দেখুন। এগুলি হাইপারপ্যারামিটারগুলি টিউন করা সহজতর হয় এবং ডিফল্ট পরামিতিগুলির সাথে ভাল ফলাফল সরবরাহ করে। র্যান্ডম ফরেস্ট এবং উত্সাহিত গাছের শ্রেণিবদ্ধ উভয়ই বৈশিষ্ট্যটির গুরুত্ব ফিরিয়ে দিতে পারে, তাই আপনি দেখতে পাবেন কোন বৈশিষ্ট্য সমস্যার সাথে প্রাসঙ্গিক। যে কোনও প্রবক্তা যাচাই করার জন্য আপনি বৈশিষ্ট্যগুলি সরিয়ে দেওয়ার চেষ্টা করতে পারেন।

সর্বাধিক গুরুত্বপূর্ণ যদিও, যদি আপনার ফলাফলগুলি অপ্রত্যাশিতভাবে খারাপ হয় তবে আপনার সমস্যাটি সঠিকভাবে সংজ্ঞায়িত হয়েছে তা নিশ্চিত করুন। আপনার পাইপলাইনে কোনও ত্রুটি নেই তা নিশ্চিত করার জন্য ম্যানুয়ালি আপনার ফলাফলগুলি পরীক্ষা করে দেখুন।


6

আপনি যদি পাইথনে থাকেন তবে এমন বেশ কয়েকটি প্যাকেজ রয়েছে যা স্বয়ংক্রিয়ভাবে আপনার টাইমসারিগুলি থেকে কয়েকশো বা কয়েক হাজার বৈশিষ্ট্য বের করতে পারে, সেগুলি আপনার লেবেলের সাথে সম্পর্কিত করতে পারে, আপনার জন্য সর্বাধিক তাৎপর্যপূর্ণ এবং ট্রেন মডেল চয়ন করতে পারে।

https://github.com/blue-yonder/tsfresh

https://github.com/rtavenar/tslearn


2

আপনি নীচে হিসাবে আপনার ডেটাসেটে আরও বৈশিষ্ট্য যুক্ত করতে পারেন।

  1. আপনার ডেটা উচ্চতর লিনিয়ার প্রক্রিয়া থেকে থাকলে আপনি নল্ডস প্যাকেজটি চেষ্টা করতে পারেন।

  2. সর্বোচ্চ, মিনিট, গড়, স্কিউ, কুর্তোসিস এবং যদি সম্ভব হয় কিছু ঘূর্ণায়মান পরিসংখ্যান।

আমি অনুরূপ কিছু নিয়ে কাজ করছি, এবং আমি একটি সম্পর্কিত প্রশ্ন জিজ্ঞাসা করেছি ।


1

আমি জ্যান ভ্যান ডের ভেজিটের সাথে একমত নই, মানককরণ (উদাহরণস্বরূপ, [-1, 1]) বা নরমালাইজেশন এন (0, 1) সক্রিয়করণ ফাংশনের সাথে মিলিত নিউরাল নেটওয়ার্কগুলির সাথে খুব গুরুত্বপূর্ণ হতে পারে। আমি পিচাইদ বরুণচোটিকুলের প্রবন্ধটি পরীক্ষা করব: এএনএনগুলির ইনস এবং আউটসের জন্য "কৃত্রিম নিউরাল নেটওয়ার্ক ব্যবহার করে বন্যার পূর্বাভাস"। এটি খুব আকর্ষণীয় সতর্কতা আছে। যাইহোক, আমি প্রথমে ছাড়া চেষ্টা করার জন্য ব্যবহার করছি তবে ফলাফলগুলি যখন সন্তোষজনক নয় তখন আমি উভয়কেই নিয়ে ট্রায়াল করতে অভ্যস্ত। নিশ্চিত নয় যে এটি সাহায্য করবে তবে আমি আর প্যাকেজ টিএসক্রাস্ট এবং সম্পর্কিত ডক্স পরীক্ষা করব। লেখকরা অত্যন্ত বিনয়ী এবং তারা আপনাকে নির্দিষ্ট মডেলগুলি এটি করতে সহায়তা করবে। তারা সময় সিরিজের বিশ্লেষণ বিশেষজ্ঞ! শুভকামনা!

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.