একাধিক সময় সিরিজের উপর একই মডেলটি অনুমান করা


26

টাইম সিরিজে আমার একটি নবজাতক পটভূমি রয়েছে (কিছু আরিমা অনুমান / পূর্বাভাস) এবং আমি এমন একটি সমস্যার মুখোমুখি হয়েছি যা আমি পুরোপুরি বুঝতে পারি না। কোন সাহায্যের ব্যাপকভাবে প্রশংসা হবে।

আমি এক সাথে একই সময়ের ব্যবধান এবং একই ফ্রিকোয়েন্সি সমস্ত একই সময়ে একাধিক টাইম সিরিজ বিশ্লেষণ করছি। প্রতিটি সিরিজ কেবলমাত্র একটি পরিবর্তনশীল, সেখানে অন্য কোনও সম্পর্কিত ভবিষ্যদ্বাণী নেই যা আমি দেখছি।

আমাকে এমন একক মডেলটি অনুমান করতে বলা হয়েছে যা সমস্ত সিরিজ বর্ণনা করে - উদাহরণস্বরূপ, কল্পনা করুন যে আমি একই ক্রম, একই গুণাবলী, ইত্যাদি সহ একটি আরিমা (পি, ডি, কিউ) পেয়েছি যা সমস্ত সিরিজের সাথে মানিয়ে যায়। আমার তত্ত্বাবধায়ক চায় না যে আমি প্রতিটি সিরিজ আলাদাভাবে অনুমান করবো, না তিনি চাইছেন যে আমি সিরিজের মধ্যে নির্ভরতা নিয়ে কিছুটা ভিএআর মডেল করব।

আমার প্রশ্ন: আমি এমনকি এমন মডেলটিকে কী বলব এবং কীভাবে আমি এটির অনুমান / পূর্বাভাস দিতে পারি? আপনার যদি কোড উদাহরণ ব্যবহার করা সহজ হয় তবে আমি এসএএস এবং আর উভয়ই বলি

উত্তর:


8

আপনি গ্রিড অনুসন্ধান করতে পারেন: আরিমা (1,0,0) দিয়ে শুরু করুন এবং আরিমা (5,2,5) বা অন্য কিছু পর্যন্ত সমস্ত সম্ভাবনার চেষ্টা করুন। প্রতিটি সিরিজে মডেল ফিট করুন এবং এমএপিই বা ম্যাসের মতো স্কেল-স্বতন্ত্র ত্রুটি পরিমাপের অনুমান করুন (ম্যাসেজ সম্ভবত আরও ভাল হবে)। আপনার সমস্ত মডেল জুড়ে সর্বনিম্ন গড় MASE সহ আরিমা মডেলটি চয়ন করুন।

আপনি প্রতিটি সিরিজের জন্য আপনার ত্রুটি পরিমাপকে ক্রস-বৈধ করে এই পদ্ধতিটি উন্নত করতে পারেন এবং আপনার ফলাফলকে একটি নির্দোষ পূর্বাভাসের সাথে তুলনা করে ।

আপনি কেন সিরিজের সমস্ত বর্ণনা দেওয়ার জন্য একটি একক মডেল খুঁজছেন তা জিজ্ঞাসা করা ভাল ধারণা হতে পারে। যদি না তারা একই প্রক্রিয়া দ্বারা উত্পন্ন হয়, এটি ভাল ধারণা বলে মনে হয় না।


2
আপনাকে ধন্যবাদ - আমি এটি চেষ্টা করব। আমি সম্মত হই যে এটিকে সর্বোত্তম ধারণা বলে মনে হচ্ছে না। আমি যে যুক্তিটি পেয়েছি তা হল যে প্রতিটি সিরিজের ভাল অনুমানের জন্য পর্যাপ্ত পর্যবেক্ষণ (~ 28) নেই এবং সমস্ত সিরিজটি অনুমান করা আরও দৃ rob় হবে। আমি নিশ্চিত নই যে আমি সেই যুক্তির সাথে একমত।
স্পার্ক_স্প্রেড

21

এটি করার একটি উপায় হ'ল আপনার সমস্ত ডেটা এবং একটি পৃথক করার জন্য সিরিজের মধ্যে থাকা মূল্যবোধের ক্রমগুলি সহ একটি দীর্ঘ সময়ের সিরিজ তৈরি করা। উদাহরণ হিসেবে বলা যায়, আর, আপনি তিনটি সিরিজ (আছে যদি x, yএবং z) দৈর্ঘ্য 100 টি এবং ফ্রিকোয়েন্সি 12 প্রতিটি, আপনি তাদের নিম্নরূপ যোগ দিতে পারেন

combined <- ts(c(x,rep(NA,56),y,rep(NA,56),z,rep(NA,56)),frequency=12)

লক্ষ্য করুন যে অনুপস্থিত মানগুলির সংখ্যাটি মৌসুমী সময় ধরে রাখা যায় তা নিশ্চিত করার জন্য চয়ন করা হয়। আমি 8 টি হারিয়ে যাওয়া মান দিয়ে চূড়ান্ত বছরটি প্যাড করেছি এবং তারপরে পরবর্তী সিরিজের আগে চারটি অনুপস্থিত বছর (48 মান) যুক্ত করেছি। সিরিজের মধ্যে যে কোনও সিরিয়াল সম্পর্কের হাতছাড়া হয়েছে তা নিশ্চিত করার জন্য এটি যথেষ্ট হওয়া উচিত।

তারপরে আপনি auto.arima()সেরা মডেলটি সন্ধান করতে ব্যবহার করতে পারেন :

library(forecast)
fit <- auto.arima(combined)

শেষ অবধি, পূর্বাভাস পাওয়ার জন্য আপনি প্রতিটি সিরিজে আলাদাভাবে সম্মিলিত মডেল প্রয়োগ করতে পারেন:

fit.x <- Arima(x,model=fit)
fit.y <- Arima(y,model=fit)
fit.z <- Arima(z,model=fit)

5
+1, ঝরঝরে কৌশল। অন্য উত্তরে ওপির মন্তব্যে বিচার করে আমি এক ধরণের প্যানেল ডেটা মডেল প্রস্তাব করতে যাচ্ছিলাম তবে এটি আরও ভাল।
এমপিটিকাস

এটি একটি বিশাল সাহায্য, অনেক প্রশংসিত। আপনি আরও ব্যাখ্যা করতে পারেন: missingতু কালকে বজায় রাখা নিশ্চিত করার জন্য নিখোঁজ মানের সংখ্যা চয়ন করা হয় ? দুঃখিত আমি পুরোপুরি অনুসরণ করিনি - ধন্যবাদ।
স্পারক_স্প্রেড

1
যদি ডেটাতে মৌসুমতা থাকে (যেমন প্রায়শই মাসিক পর্যবেক্ষণের সাথে থাকে), আপনি দীর্ঘ সিরিজটি এখনও জানুয়ারিগুলিকে একাধিক 12, ফেব্রুয়ারিগুলি 12 এর আলাদা একাধিক এবং আরও অনেক কিছু রাখতে চান। তারপরে, যখন মডেলটি বেছে নেওয়া হচ্ছে, তখন theতুটি যথাযথভাবে মডেল করা যায়।
রব হ্যান্ডম্যান

3
এই কৌশলটিতে যুক্ত করতে - আপনি বহিরাগত রেজিস্ট্রার (xreg) বিভাগের সদস্যপদ নির্দেশ করে যুক্ত করতে পারেন। এটি বিভিন্ন সিরিজের পৃথক মাধ্যমের জন্য অ্যাকাউন্ট করবে, অন্য সংখ্যককে এখনও সাধারণ রাখবে।
জেমসন কুইন

6

একাধিক সময় সিরিজের জন্য একক মডেল অনুমান করা প্যানেল ডেটা ইকোনোমেট্রিক্সের ক্ষেত্র । তবে আপনার ক্ষেত্রে কোনও ব্যাখ্যামূলক ভেরিয়েবল না থাকলে @ রব হ্যান্ডম্যান উত্তরটি সম্ভবত সবচেয়ে উপযুক্ত। তবে যদি এটির প্রমাণ হয় যে সময়ের সিরিজের মাধ্যমগুলি আলাদা are (এটি পরীক্ষা করুন, যেহেতু এই ক্ষেত্রে @ রব হ্যান্ডম্যানের পদ্ধতিটি ব্যর্থ হওয়া উচিত!), তবে এআরএমএ কাঠামোটি একই, তবে আপনাকে আরেল্লানো-বন্ড ব্যবহার করতে হবে (দুঃখিত উইকিপিডিয়া রয়েছে এটিতে কোনও পৃষ্ঠা নেই, সুতরাং এটি গুগলে অনুসন্ধান করুন) টাইপ অনুমানকারী। সেক্ষেত্রে মডেলটি হ'ল:

Yআমিটি=αআমি+ +ρ1Yআমি,টি-1+ ++ +ρপিYআমি,টি-পি+ +εআমিটি

আমিεআমিটিআমি


1
সত্যিই আপনার সমাধান এবং অন্যদেরও প্রশংসা করুন। আপনি উল্লেখ করেছেন যে: তবে যদি এটি প্রমাণিত হয় যে সময়ের সিরিজের মাধ্যমগুলি আলাদা ? ধন্যবাদ।
স্পার্ক_স্প্রেড

2
@ স্পার_স্প্রেড, ধরুন এটি মাত্র দুটি সিরিজ। একটি ভেরিয়েন্স 1 এর সাথে প্রায় 0 এবং কেন্দ্রীভূত হয় 1000 এর ভেরিয়েন্স 1 দিয়ে। তারপর যদি উভয় সিরিজ একই সহগ ব্যবহার করে ফিট হয় তবে এর অর্থ আমরা আলফা_1 = আলফা_2 বাধা দিচ্ছি, সুতরাং উভয় সিরিজের ভবিষ্যদ্বাণীগুলি প্রায় হবে 500, ভয়াবহভাবে বন্ধ। মূলত, সমস্ত সিরিজ একই মডেলের অন্তর্ভুক্ত হিসাবে গণ্য করার জন্য যৌথ মডেলটি ফিট করার আগে কিছুটা পুনর্নির্মাণ / স্বাভাবিককরণের প্রয়োজন হতে পারে।
zkurtz

4

একক ডেটা সিরিজ তৈরির জন্য রব হ্যান্ডম্যানের পদ্ধতির বিকল্প হ'ল ডেটা মার্জ করা। আপনার একাধিক সময় সিরিজ একই ইভেন্ট রেকর্ডিং মেশিনের সেট থেকে শোরগোল পড়ার উপস্থাপন করে তবে এটি উপযুক্ত হতে পারে। (প্রতিটি সময় সিরিজ যদি আলাদা স্কেলে থাকে তবে আপনাকে প্রথমে ডেটাটি স্বাভাবিক করতে হবে))

দ্রষ্টব্য: আপনি এখনও কেবল 28 টি রিডিং দিয়ে শেষ করেন, কেবলমাত্র কম শব্দ, সুতরাং এটি আপনার পরিস্থিতির জন্য উপযুক্ত নাও হতে পারে।

t1=xts(jitter(sin(1:28/10),amount=0.2),as.Date("2012-01-01")+1:28)
t2=xts(jitter(sin(1:28/10),amount=0.2),as.Date("2012-01-01")+1:28)
t3=(t1+t2)/2

এখানে চিত্র বর্ণনা লিখুন


এটি কেবলমাত্র তখনই কাজ করবে যদি সমস্ত সংকেত প্রকৃতিতে একই রকম হয় (যেমন পর্যায়ক্রমিক) সমস্ত পর্যায়ে থাকে - আপনার উদাহরণে যদি সাইন তরঙ্গগুলির মধ্যে দু'টি 180 ডিগ্রির বাইরে থাকে তবে তারা সম্পূর্ণ বাতিল হয়ে যায়!
tdc

3
হ্যাঁ, প্রতিটি ডেটা সিরিজ একই ডেটার প্রতিনিধিত্ব করার কথা মনে করা হয় এবং আপনার ডেটা গড় গড়ে তোলা তখনই উপযুক্ত, এবং (আপনি এটি ধরে আনতে পেরে খুশি হন) এর মধ্যে কেবলমাত্র আলাদা আলাদা শব্দ রয়েছে তার মধ্যে তারতম্য রয়েছে।
ড্যারেন কুক

1

আমি লুকানো মার্কভ মডেল এবং গতিশীল বায়েশিয়ান নেটওয়ার্কগুলি দেখতে চাই। তারা সময় সিরিজের ডেটা মডেল করে। এছাড়াও তারা একাধিক টাইম সিরিজ উদাহরণগুলি ব্যবহার করে যেমন বিভিন্ন ব্যক্তির একাধিক রক্তচাপ সময় সিরিজ ব্যবহার করে প্রশিক্ষিত হয়। এগুলি তৈরির জন্য আপনার পাইথন এবং আর এ প্যাকেজগুলি পাওয়া উচিত। আপনাকে এই মডেলগুলির জন্য কাঠামো নির্ধারণ করতে পারে।


0

আমি একই জিনিস করার চেষ্টা করছি। স্পষ্টতই, সেখানে 'মাল্টিভারিয়েট অটোরেজিটিভ' মডেল বলে কিছু আছে। আমি এর রেফারেন্স পেয়েছি, তবে কীভাবে এটি ব্যবহার করব তা নয়। লিঙ্কযুক্ত কাগজের ভিত্তিতে, আমি ধারণা করি এটি আরে প্রয়োগ করা হয়েছে।

http://journal.r-project.org/archive/2012-1/RJournal_2012-1_Holmes~et~al.pdf


মান পন্থা ভেক্টর autoregression এবং সেখানে একটি r- প্যাকেজ বলা হয় Var
শি'য়ান

প্যানেল ডেটাতে কোনও ভেক্টর অটোরগিজিয়ন আলাদা? বা এটি বিভিন্ন ক্ষেত্রের, বিভিন্ন নামের বিষয়? প্লাম প্যাকেজটি প্যানেল ডেটার জন্য প্রস্তাবিত হয়েছিল। cran.r-project.org/web/packages/plm/vignettes/plm.pdf clidyn.ethz.ch/papers/arfit.pdf
Mox
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.