টাইম সিকোয়েন্সড ডেটার জন্য কি কোনও অব্যবহৃত লার্নিং অ্যালগরিদম রয়েছে?


9

আমার ডেটাতে প্রতিটি পর্যবেক্ষণ 0.1 সেকেন্ডের ব্যবধান সহ সংগ্রহ করা হয়েছিল। আমি এটিকে টাইম সিরিজ বলি না কারণ এতে তারিখ এবং সময় স্ট্যাম্প নেই। ক্লাস্টারিং অ্যালগরিদমগুলির উদাহরণগুলিতে (আমি অনলাইনে খুঁজে পেয়েছি) এবং পিসিএ নমুনা তথ্যের প্রতি কেস প্রতি 1 টি পর্যবেক্ষণ আছে এবং সময়সই হয় না। তবে আমার ডেটাতে প্রতি যানবাহন প্রতি 0.1 সেকেন্ডে শত শত পর্যবেক্ষণ সংগ্রহ করা হয়েছে এবং সেখানে প্রচুর যানবাহন রয়েছে।

দ্রষ্টব্য: আমি কোরায়ায়ও এই প্রশ্নটি জিজ্ঞাসা করেছি।


1
দয়া করে ভাষাটি নোট করুন। আপনার প্রশ্নটি সম্পূর্ণ অস্পষ্ট। "নমুনা ডেটা প্রতি ক্ষেত্রে 1 টি পর্যবেক্ষণ করে এবং সময়সীমাবদ্ধ হয় না" এর অর্থ কী?
কসরা মনশায়ে

1
আমি অনলাইন টিউটোরিয়ালে যে উদাহরণগুলি পেয়েছি তার বিষয়ে বলছিলাম। তারা যে নমুনা ডেটা ব্যবহার করেন তাতে কেস / পৃথক প্রতি মাত্র 1 টি পর্যবেক্ষণ থাকে (যেমন গ্রাহক, দেশ ইত্যাদি)। এবং সেই তথ্যগুলি সময় সিরিজ নয়।
umair durrani

উত্তর:


7

আপনার যা আছে তা সময় অনুযায়ী ইভেন্টের ক্রম তাই এটি টাইম সিরিজ বলতে দ্বিধা করবেন না!

টাইম সিরিজে ক্লাস্টারিংয়ের 2 টি আলাদা অর্থ রয়েছে:

  1. সময় ধারাবাহিকের বিভাজন অর্থাত আপনি অভ্যন্তরীণ সাদৃশ্য অনুসারে পৃথক সময় সিরিজকে পৃথক সময়ের ব্যবধানে বিভাগ করতে চান।
  2. টাইম সিরিজ ক্লাস্টারিং অর্থাৎ আপনার বেশ কয়েকটি সময় সিরিজ রয়েছে এবং আপনি তাদের মধ্যে মিল অনুসারে বিভিন্ন ক্লাস্টার সন্ধান করতে চান।

আমি ধরে নিলাম আপনি দ্বিতীয়টি বোঝাতে চাইছেন এবং এখানে আমার পরামর্শটি রয়েছে:

আপনার যানবাহন প্রতি অনেক যানবাহন এবং অনেক পর্যবেক্ষণ রয়েছে অর্থাত আপনার অনেক গাড়ি রয়েছে। সুতরাং আপনার কয়েকটি ম্যাট্রিক রয়েছে (প্রতিটি বাহন একটি ম্যাট্রিক্স) এবং প্রতিটি ম্যাট্রিক্সে এন সারি (পর্যবেক্ষণের এনআর) এবং টি কলাম (সময় পয়েন্ট) থাকে। একটি পরামর্শ হ'ল প্রতিটি ম্যাট্রিক্সে পিসিএ প্রয়োগ করা হতে পারে পিসি স্পেসে ডাইমাসিওনালিটি হ্রাস করা এবং ডেটা পর্যবেক্ষণ করা এবং ম্যাট্রিক্সের (যানবাহনের) মধ্যে বিভিন্ন পর্যবেক্ষণের মধ্যে অর্থপূর্ণ সম্পর্ক রয়েছে কিনা তা দেখুন । তারপরে আপনি সমস্ত যানবাহনের জন্য প্রতিটি পর্যবেক্ষণ একে অপরের উপর রেখে ম্যাট্রিক্স তৈরি করতে পারেন এবং বিভিন্ন গাড়ির মধ্যে একক পর্যবেক্ষণের সম্পর্কগুলি দেখতে পিসিএ প্রয়োগ করতে পারেন।

আপনার যদি নেতিবাচক মান না থাকে ম্যাট্রিক্স ফ্যাক্টরাইজেশনকে ম্যাট্রিক্স ফর্ম ডেটার মাত্রা হ্রাস করার জন্য দৃ strongly ়ভাবে সুপারিশ করা হয়।

অন্য পরামর্শটি সমস্ত ম্যাট্রিককে একে অপরের উপরে রাখতে পারে এবং একটি এন এক্স এম এক্স টি টেনসর তৈরি করতে পারে যেখানে এন যানবাহনের সংখ্যা, এম পর্যবেক্ষণের সংখ্যা এবং টি হ'ল সময় ক্রম এবং বিশ্বব্যাপী সম্পর্কগুলি দেখার জন্য টেনসর ক্ষয় প্রয়োগ করুন ।

টাইম সিরিজ ক্লাস্টারিংয়ের একটি খুব সুন্দর দৃষ্টিভঙ্গি এই কাগজটিতে দেখানো হয়েছে যেখানে বাস্তবায়ন সোজা এগিয়ে রয়েছে।

আমি আশা করি এটি সাহায্য করেছে!

শুভকামনা :)


সম্পাদনা

যেমনটি আপনি উল্লেখ করেছেন টাইম সিরিজ বিভাজন বলতে আমি এটি উত্তরে যুক্ত করব।

টাইম সিরিজ বিভাজন একমাত্র ক্লাস্টারিং সমস্যা যা মূল্যায়নের জন্য গ্রাউন্ড সত্য রয়েছে। প্রকৃতপক্ষে আপনি সময় সিরিজ পিছনে উৎপাদিত বন্টন বিবেচনা তা বিশ্লেষণ আমি দৃঢ়ভাবে সুপারিশ এই , এই , এই , এই , এই এবং এই যেখানে আপনার সমস্যা অগ্রপশ্চাৎ চর্চিত হয়। বিশেষত শেষটি এবং পিএইচডি থিসিস।

শুভকামনা!


1
একটি দুর্দান্ত উত্তরের জন্য ধন্যবাদ। আমার লক্ষ্য, আমার ডেটা সেটের প্রতিটি গাড়ির জন্য "টাইম সিরিজের বিভাজন" করা।
umair durrani

1
সময় সিরিজের পচন নিয়ে টিউটোরিয়াল অধ্যয়ন করছি। আমি দেখতে পেয়েছি যে এগুলি প্রবণতা, মৌসুমী এবং চক্রীয় উপাদানগুলিতে বিভক্ত করার উপায় রয়েছে। আমার টাইম সিরিজটি তবে যানবাহনের ট্রাজিলোগুলির কয়েক সেকেন্ড। ত্বরণ, গতি, নেতৃত্বের গাড়ির গতি এবং তীক্ষ্ণ গতির মধ্যে ত্বরণের প্রবণতার উপর ভিত্তি করে এগুলি কীভাবে ড্রাইভিং আচরণের বিভিন্ন উপাদানগুলিতে দ্রবীভূত করা সম্ভব?
umair durrani

2
হতে পারে! এটির জন্য "পচন" এবং "বিভাজন" উভয় বিবেচনা করা আরও ভাল। উদাহরণস্বরূপ, যদি আপনার সময় সিরিজটি পিসি স্পেসে উল্লেখযোগ্য ক্লাস্টার দেখায় আপনি সেগুলি ড্রাইভিং আচরণের সাথে সম্পর্কিত করতে পারেন। বিভাজন একটি সময় সিরিজের মধ্যে বিভিন্ন ড্রাইভিং আচরণ সনাক্ত করা হয়। দীর্ঘ গল্পের সংক্ষিপ্তসারটি হ'ল আপনি কোনও যানবাহনের জন্য বিভিন্ন ড্রাইভিং আচরণ বিভাগের জন্য বিভাজন এবং সমস্ত যানবাহনে গ্লোবাল ড্রাইভিং আচরণ সনাক্তকরণের জন্য পচন কৌশলগুলি ব্যবহার করতে পারেন।
কসরা মনশায়ে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.