এআরএমএ ব্যবহার করে কোনও অ-স্টেশনারী প্রক্রিয়া মডেলিংয়ের ফলাফল?


23

আমি বুঝতে পারি আমাদের কোনও স্টেশানবিহীন সময় সিরিজের মডেলিংয়ের জন্য আরিমা ব্যবহার করা উচিত। এছাড়াও, আমি যা কিছু পড়েছি তা এআরএমএ কেবল স্থায়ী সময় সিরিজের জন্য ব্যবহার করা উচিত।

আমি যা বোঝার চেষ্টা করছি তা হ'ল, যখন কোনও মডেলকে ভুলভাবে শ্রেণিবদ্ধ করা হয় এবং d = 0এমন কোনও সময় ধারাবাহিকের জন্য ধরে নেওয়া যায় না যা স্থির হয় না? উদাহরণ স্বরূপ:

controlData <- arima.sim(list(order = c(1,1,1), ar = .5, ma = .5), n = 44)

নিয়ন্ত্রণ ডেটা দেখতে দেখতে:

 [1]   0.0000000   0.1240838  -1.4544087  -3.1943094  -5.6205257
 [6]  -8.5636126 -10.1573548  -9.2822666 -10.0174493 -11.0105225
[11] -11.4726127 -13.8827001 -16.6040541 -19.1966633 -22.0543414
[16] -24.8542959 -25.2883155 -23.6519271 -21.8270981 -21.4351267
[21] -22.6155812 -21.9189036 -20.2064343 -18.2516852 -15.5822178
[26] -13.2248230 -13.4220158 -13.8823855 -14.6122867 -16.4143756
[31] -16.8726071 -15.8499558 -14.0805114 -11.4016515  -9.3330560
[36]  -7.5676563  -6.3691600  -6.8471371  -7.5982880  -8.9692152
[41] -10.6733419 -11.6865440 -12.2503202 -13.5314306 -13.4654890

ধরে নিলাম আমি ডেটা জানতাম না ARIMA(1,1,1), আমার এক নজরে থাকতে পারে pacf(controlData)

pacf (controlData)

তারপরে আমি ডিকি-ফুলার ব্যবহার করে দেখি যে ডেটাটি স্থিতিশীল নয়:

require('tseries')
adf.test(controlData)

# Augmented Dickey-Fuller Test
#
# data:  controlData
# Dickey-Fuller = -2.4133, Lag order = 3, p-value = 0.4099
# alternative hypothesis: stationary

adf.test(controlData, k = 1)

# Augmented Dickey-Fuller Test
#
#data:  controlData
# Dickey-Fuller = -3.1469, Lag order = 1, p-value = 0.1188
# alternative hypothesis: stationary

সুতরাং, আমি ধরে নিতে পারি ডেটাটি আরিমা (২,০, *) তারপরে auto.arima(controlData)কী সেরা ফিট পাওয়ার চেষ্টা করবেন?

require('forecast')
naiveFit <- auto.arima(controlData)
naiveFit
# Series: controlData 
# ARIMA(2,0,1) with non-zero mean 
# 
# Coefficients:
#          ar1      ar2     ma1  intercept
#      1.4985  -0.5637  0.6427   -11.8690
# s.e.  0.1508   0.1546  0.1912     3.2647
#
# sigma^2 estimated as 0.8936:  log likelihood=-64.01
# AIC=138.02   AICc=139.56   BIC=147.05

সুতরাং, অতীত ও ভবিষ্যতের ডেটা আরিমা (1,1,1) হওয়া সত্ত্বেও আমি এআরআইএমএ (2,0,1) হিসাবে শ্রেণিবদ্ধ করার জন্য প্রলুব্ধ হতে পারি। tsdata(auto.arima(controlData))খুব ভাল দেখাচ্ছে।

একজন অবগত মডেলার যা খুঁজে পাবেন তা এখানে:

informedFit <- arima(controlData, order = c(1,1,1))
# informedFit
# Series: controlData 
# ARIMA(1,1,1)                    
#
# Coefficients:
#          ar1     ma1
#       0.4936  0.6859
# s.e.  0.1564  0.1764
#
# sigma^2 estimated as 0.9571:  log likelihood=-62.22
# AIC=130.44   AICc=131.04   BIC=135.79

1) কেন এই তথ্য মানদণ্ডগুলি নির্বাচিত মডেলটির চেয়ে ভাল auto.arima(controlData)?

এখন, আমি কেবল গ্রাফিকভাবে আসল ডেটা এবং 2 টি মডেল তুলনা করছি:

plot(controlData)
lines(fitted(naiveFit), col = "red")
lines(fitted(informedFit), col = "blue")

tsPlots

2) শয়তানের উকিল বাজানো, আমি একটি এরিমা (2, 0, 1) মডেল হিসাবে ব্যবহার করে কী ধরণের পরিণতি দেব? এই ত্রুটির ঝুঁকি কি?

3) আমি বেশিরভাগ বহু-সময়ের ভবিষ্যদ্বাণীগুলির কোনও প্রভাব সম্পর্কে উদ্বিগ্ন। আমি ধরে নিলাম এগুলি কি কম নির্ভুল হবে? আমি শুধু কিছু প্রমাণ খুঁজছি।

৪) আপনি কি মডেল নির্বাচনের জন্য বিকল্প পদ্ধতির পরামর্শ দিতে চান? "অজ্ঞাতনামা" মডেলার হিসাবে আমার যুক্তিতে কোনও সমস্যা আছে?

আমি সত্যিই কৌতূহল বোধ করি যে এই ধরণের ভুল সংকলনের অন্যান্য পরিণতিগুলি কী। আমি কিছু উত্স সন্ধান করেছি এবং কেবল কিছুই পাইনি। সমস্ত সাহিত্য আমি এই বিষয়টিতে কেবল ছোঁয়া পেতে পারি, পরিবর্তে কেবল এআরএমএ সম্পাদনের আগে ডেটা স্থিতিশীল হওয়া উচিত উল্লেখ করে এবং এটি যদি অ-স্থির হয়, তবে এটির জন্য আলাদা আলাদা সময় প্রয়োজন d

ধন্যবাদ!


আমার ধারণাটি এটি ক্রস-বিভাগীয় রিগ্রেশন (অর্থাত্ এটি স্ট্যান্ডার্ড ত্রুটিগুলিকে নয় তবে সহগগুলি নয়) অনুমানের সাথে অনাথিত, তবে আমি প্রকৃত উত্তরটি শুনে সত্যিই আগ্রহী।
শ্যাডএলকার 21

উত্তর:


11

আমার ধারণাটি হ'ল এই প্রশ্নের কোনও অনন্য, সম্পূর্ণ সাধারণ উত্তর নেই, সুতরাং আমি কেবল সহজতম মামলাটি এবং কিছুটা অনানুষ্ঠানিকভাবে অন্বেষণ করব।

(1)yt=yt1+ut,t=1,...,T,y0=0
utE(ut2)=σu2

(2)yt=i=1tui

A

(3)yt=βyt1+ut,t=1,...,T,y0=0

β^β

k

(4)y^T+k=β^kyT

এবং এর এমএসই হবে

MSEA[y^T+k]=E(β^kyTyT+k)2

(5)=E[(β^k1)yTi=T+1T+kui]2=E[(β^k1)2yT2]+kσu2

(বর্গক্ষেত্রের মাঝামাঝি মেয়াদ, পাশাপাশি ভবিষ্যতের ত্রুটির ক্রস-পণ্যগুলি)।

আসুন এখন বলুন যে আমরা আমাদের ডেটা পার্থক্য করেছি এবং একটি মডেল নির্দিষ্ট করেছিB

(6)Δyt=γΔyt1+ut

γ^

(7)yt=yt1+γ(yt1yt2)+ut

সুতরাং প্রক্রিয়া স্তর পূর্বাভাস, আমরা হবে

y^T+1=yT+γ^(yTyT1)

যা বাস্তবে সত্যিকারের ডিজিপি দেওয়া হবে

(8)y^T+1=yT+γ^uT

B

Y^টি+ +=Yটি+ +(γ^+ +γ^2+ ++ +γ^)তোমার দর্শন লগ করাটি

|γ^|<10

(9)Y^টি+ +=Yটি+ +γ^-γ^+ +11-γ^তোমার দর্শন লগ করাটি

এবং তাই

(10)এমএসবি[Y^টি+ +]=[(γ^-γ^+ +11-γ^)2তোমার দর্শন লগ করাটি2]+ +σতোমার দর্শন লগ করা2

যখন আমি সুবিধার জন্য পুনরাবৃত্তি

(5)এমএসএকজন[Y^টি+ +]=[(β^-1)2Yটি2]+ +σতোমার দর্শন লগ করা2

সুতরাং, এমএসইর পূর্বাভাসের ক্ষেত্রে পার্থক্যযুক্ত মডেলটি আরও ভাল পারফর্ম করার জন্য, আমরা চাই

এমএসবি[Y^টি+ +]এমএসএকজন[Y^টি+ +]

[(γ^-γ^+ +11-γ^)2তোমার দর্শন লগ করাটি2][(β^-1)2Yটি2]

বিএকজনβ^

β^>1বিএকজন

একজনβ^<1

[(γ^1-γ^)2তোমার দর্শন লগ করাটি2][Yটি2]=টিσতোমার দর্শন লগ করা2??

(γ^1-γ^)20বি

γ^তোমার দর্শন লগ করাটি

Cov[(γ^1-γ^)2,তোমার দর্শন লগ করাটি2]+ +[(γ^1-γ^)2]σতোমার দর্শন লগ করা2টিσতোমার দর্শন লগ করা2??

Cov[(γ^1-γ^)2,তোমার দর্শন লগ করাটি2](টি-[(γ^1-γ^)2])σতোমার দর্শন লগ করা2??

γ^টিγ^(0,1)

সুতরাং সর্বোপরি, কোনও নির্দিষ্ট অনুমানের পদ্ধতি নিয়ে আলোচনা না করেই আমি বিশ্বাস করি যে আমরা অনানুষ্ঠানিকভাবে প্রদর্শন করতে সক্ষম হয়েছি যে পার্থক্যযুক্ত মডেলটি ভবিষ্যদ্বাণী MSE এর ক্ষেত্রে আরও ভাল পারফর্ম করার আশা করা উচিত।


1

এটি একটি ভাল প্রশ্ন।

আমি যেমন উপলব্ধি করেছি, আপনি কেবল প্যাকফ বিবেচনা করেছেন তবে এটি যথেষ্ট নয়। এসিএফ এবং পিএসিএফ উভয়ই সেরা মডেলটি নির্বাচন করার জন্য প্রয়োজনীয়।

অন্যদিকে, স্টেশনারি টেস্টগুলি দুর্বল এবং সংবেদনশীল এবং পরীক্ষার জন্য প্রচুর পরিমাণে ল্যাগ দরকার।

তদতিরিক্ত, কোনও মডেল প্রয়োগের আগে সময় সিরিজকে স্থির করে তুলতে বেশি পছন্দ করা হয়। মোটামুটিভাবে বলতে গেলে, এআরআইএমএ মডেলগুলি কেবল স্থিতিশীল না হওয়ার একটি বিশেষ ক্ষেত্রে বিবেচনা করে (পছন্দসই প্রবণতায়)।

আপনার প্রশ্নগুলির বিষয়ে, আমি অটো.রিমা ফাংশন সম্পর্কে নিশ্চিত নই তবে আমি নিশ্চিত যে আপনার উদাহরণে ডেটা পয়েন্টের সংখ্যা কম। একটি উচ্চ সংখ্যক ডেটা পয়েন্ট ব্যবহার করে মডেল সিমুলেট করা আপনার প্রশ্নের উত্তরগুলি ভালভাবে দিতে পারে। এছাড়াও, আমি আপনাকে সময় সিরিজের এসিএফ পাশাপাশি পিএসিএফ বিবেচনা করার পরামর্শ দিচ্ছি। মডেল নির্বাচন সম্পর্কে থাম্বের বিধিটি সবচেয়ে সহজ মডেলটি বেছে নিচ্ছে (নোট করুন যে সময় সিরিজটি নিশ্চল করার পরে সর্বাধিকতম মডেল)।

আমি আপনাকে এই রেফারেন্স রেফার করি । এই বইটি আপনার সমস্ত প্রশ্নের উত্তর দেয় না তবে আপনাকে কিছু সূত্র দেয়।

----- পরিপূরক বিভাগ ------- @ আপনার ডেটাতে একটি ট্রেন্ড বিবেচনা করে এনএনএস। আপনি যদি কোনও স্থির মডেল বিবেচনা করেন, তবে এর ফলে উপরে / নীচের দিকে পূর্বাভাস পাওয়া যায় তবে আসলে এআরএমএ মডেলগুলি ফ্ল্যাট ডেটা পূর্বাভাস দেওয়ার জন্য তৈরি করা হয়। এই পার্থক্য প্রতিফলিত করতে আমি আপনার কোড পরিবর্তন করেছি:

( 'পূর্বাভাস') প্রয়োজন

( 'Tseries') প্রয়োজন

কন্ট্রোলডাটা <- অরিমা.সিম (তালিকা (অর্ডার = সি (1,1,1), আর = .5, মা = .5), এন = 1000 )

ACF (controlData)

ts.plot (controlData)

naiveFit <- অ্যারিমা (কন্ট্রোলডাটা, অর্ডার = সি (২,০,১))

ট্রুফিট <- অরিমা (কন্ট্রোলডাটা, অর্ডার = সি (1,1,1))

PrnaiveFit <-forecast.Arima (naiveFit, 10)

PrtrueFit <- পূর্বাভাস.আরিমা (ট্রুফিট, 10)

ম্যাটপ্ল্লট (সিবাইন্ড (প্রানাইভফিট $ গড়, প্র্রুফিট $ গড়), টাইপ = 'বি', কোল = সি ('লাল', 'সবুজ'), ইল্যাব = সি ('পূর্বাভাস আয়ন'), পিচ্চি = সি ('এন', 'T'))


1
প্রশ্নটি কেন "সময়ের সিরিজকে স্থির করে তুলতে" পছন্দ করা হয় তা জিজ্ঞাসা করে । এটি আসলে এই প্রশ্নের উত্তর দেয় না।
শ্যাডট্যালকার

@ এসএসডেকট্রোল আপনি সাধারণভাবে ঠিক আছেন। আমি ভুল বানানের পরে ভবিষ্যদ্বাণীতে অন্তর্নিহিত পরিণতি সম্পর্কে সত্যই বেশি উদ্বিগ্ন। তবে আমি হামেডকে মারতে চাই না Hএইচএম খুব বেশি। তিনি এখনও আমার শেষ প্রশ্নটির বিষয়ে সম্বোধন করেছিলেন, "এটি কোনও মডেল নির্বাচন করার সঠিক উপায়?" তবে কেবল পুনরাবৃত্তি করতে, এটি আমার উদ্বেগের মধ্যে অন্তত।
ক্লার্ক হেনরি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.