আমি বুঝতে পারি আমাদের কোনও স্টেশানবিহীন সময় সিরিজের মডেলিংয়ের জন্য আরিমা ব্যবহার করা উচিত। এছাড়াও, আমি যা কিছু পড়েছি তা এআরএমএ কেবল স্থায়ী সময় সিরিজের জন্য ব্যবহার করা উচিত।
আমি যা বোঝার চেষ্টা করছি তা হ'ল, যখন কোনও মডেলকে ভুলভাবে শ্রেণিবদ্ধ করা হয় এবং d = 0
এমন কোনও সময় ধারাবাহিকের জন্য ধরে নেওয়া যায় না যা স্থির হয় না? উদাহরণ স্বরূপ:
controlData <- arima.sim(list(order = c(1,1,1), ar = .5, ma = .5), n = 44)
নিয়ন্ত্রণ ডেটা দেখতে দেখতে:
[1] 0.0000000 0.1240838 -1.4544087 -3.1943094 -5.6205257
[6] -8.5636126 -10.1573548 -9.2822666 -10.0174493 -11.0105225
[11] -11.4726127 -13.8827001 -16.6040541 -19.1966633 -22.0543414
[16] -24.8542959 -25.2883155 -23.6519271 -21.8270981 -21.4351267
[21] -22.6155812 -21.9189036 -20.2064343 -18.2516852 -15.5822178
[26] -13.2248230 -13.4220158 -13.8823855 -14.6122867 -16.4143756
[31] -16.8726071 -15.8499558 -14.0805114 -11.4016515 -9.3330560
[36] -7.5676563 -6.3691600 -6.8471371 -7.5982880 -8.9692152
[41] -10.6733419 -11.6865440 -12.2503202 -13.5314306 -13.4654890
ধরে নিলাম আমি ডেটা জানতাম না ARIMA(1,1,1)
, আমার এক নজরে থাকতে পারে pacf(controlData)
।
তারপরে আমি ডিকি-ফুলার ব্যবহার করে দেখি যে ডেটাটি স্থিতিশীল নয়:
require('tseries')
adf.test(controlData)
# Augmented Dickey-Fuller Test
#
# data: controlData
# Dickey-Fuller = -2.4133, Lag order = 3, p-value = 0.4099
# alternative hypothesis: stationary
adf.test(controlData, k = 1)
# Augmented Dickey-Fuller Test
#
#data: controlData
# Dickey-Fuller = -3.1469, Lag order = 1, p-value = 0.1188
# alternative hypothesis: stationary
সুতরাং, আমি ধরে নিতে পারি ডেটাটি আরিমা (২,০, *) তারপরে auto.arima(controlData)
কী সেরা ফিট পাওয়ার চেষ্টা করবেন?
require('forecast')
naiveFit <- auto.arima(controlData)
naiveFit
# Series: controlData
# ARIMA(2,0,1) with non-zero mean
#
# Coefficients:
# ar1 ar2 ma1 intercept
# 1.4985 -0.5637 0.6427 -11.8690
# s.e. 0.1508 0.1546 0.1912 3.2647
#
# sigma^2 estimated as 0.8936: log likelihood=-64.01
# AIC=138.02 AICc=139.56 BIC=147.05
সুতরাং, অতীত ও ভবিষ্যতের ডেটা আরিমা (1,1,1) হওয়া সত্ত্বেও আমি এআরআইএমএ (2,0,1) হিসাবে শ্রেণিবদ্ধ করার জন্য প্রলুব্ধ হতে পারি। tsdata(auto.arima(controlData))
খুব ভাল দেখাচ্ছে।
একজন অবগত মডেলার যা খুঁজে পাবেন তা এখানে:
informedFit <- arima(controlData, order = c(1,1,1))
# informedFit
# Series: controlData
# ARIMA(1,1,1)
#
# Coefficients:
# ar1 ma1
# 0.4936 0.6859
# s.e. 0.1564 0.1764
#
# sigma^2 estimated as 0.9571: log likelihood=-62.22
# AIC=130.44 AICc=131.04 BIC=135.79
1) কেন এই তথ্য মানদণ্ডগুলি নির্বাচিত মডেলটির চেয়ে ভাল auto.arima(controlData)
?
এখন, আমি কেবল গ্রাফিকভাবে আসল ডেটা এবং 2 টি মডেল তুলনা করছি:
plot(controlData)
lines(fitted(naiveFit), col = "red")
lines(fitted(informedFit), col = "blue")
2) শয়তানের উকিল বাজানো, আমি একটি এরিমা (2, 0, 1) মডেল হিসাবে ব্যবহার করে কী ধরণের পরিণতি দেব? এই ত্রুটির ঝুঁকি কি?
3) আমি বেশিরভাগ বহু-সময়ের ভবিষ্যদ্বাণীগুলির কোনও প্রভাব সম্পর্কে উদ্বিগ্ন। আমি ধরে নিলাম এগুলি কি কম নির্ভুল হবে? আমি শুধু কিছু প্রমাণ খুঁজছি।
৪) আপনি কি মডেল নির্বাচনের জন্য বিকল্প পদ্ধতির পরামর্শ দিতে চান? "অজ্ঞাতনামা" মডেলার হিসাবে আমার যুক্তিতে কোনও সমস্যা আছে?
আমি সত্যিই কৌতূহল বোধ করি যে এই ধরণের ভুল সংকলনের অন্যান্য পরিণতিগুলি কী। আমি কিছু উত্স সন্ধান করেছি এবং কেবল কিছুই পাইনি। সমস্ত সাহিত্য আমি এই বিষয়টিতে কেবল ছোঁয়া পেতে পারি, পরিবর্তে কেবল এআরএমএ সম্পাদনের আগে ডেটা স্থিতিশীল হওয়া উচিত উল্লেখ করে এবং এটি যদি অ-স্থির হয়, তবে এটির জন্য আলাদা আলাদা সময় প্রয়োজন d
ধন্যবাদ!