একটি সংক্ষিপ্ত মাল্টিভারিয়েট সময় সিরিজের পূর্বাভাস দেওয়ার সবচেয়ে মূ .় উপায়


16

সময়ের 29 তম ইউনিটের জন্য আমাকে নিম্নলিখিত 4 টি ভেরিয়েবলের পূর্বাভাস দিতে হবে। আমার কাছে প্রায় 2 বছরের মূল্যবান historicalতিহাসিক তথ্য রয়েছে, যেখানে 1 এবং 14 এবং 27 সমস্ত একই সময়ের (বা বছরের সময়)। শেষ পর্যন্ত, আমি একটি ওয়াক্সাকা-চোখের ঠুলি শৈলী পচানি করছি , , , এবং ।Wwdwcp

time    W               wd              wc               p
1       4.920725        4.684342        4.065288        .5962985
2       4.956172        4.73998         4.092179        .6151785
3       4.85532         4.725982        4.002519        .6028712
4       4.754887        4.674568        3.988028        .5943888
5       4.862039        4.758899        4.045568        .5925704
6       5.039032        4.791101        4.071131        .590314
7       4.612594        4.656253        4.136271        .529247
8       4.722339        4.631588        3.994956        .5801989
9       4.679251        4.647347        3.954906        .5832723
10      4.736177        4.679152        3.974465        .5843731
11      4.738954        4.759482        4.037036        .5868722
12      4.571325        4.707446        4.110281        .556147
13      4.883891        4.750031        4.168203        .602057
14      4.652408        4.703114        4.042872        .6059471
15      4.677363        4.744875        4.232081        .5672519
16      4.695732        4.614248        3.998735        .5838578
17      4.633575        4.6025          3.943488        .5914644
18      4.61025         4.67733         4.066427        .548952
19      4.678374        4.741046        4.060458        .5416393
20      4.48309         4.609238        4.000201        .5372143
21      4.477549        4.583907        3.94821         .5515663
22      4.555191        4.627404        3.93675         .5542806
23      4.508585        4.595927        3.881685        .5572687
24      4.467037        4.619762        3.909551        .5645944
25      4.326283        4.544351        3.877583        .5738906
26      4.672741        4.599463        3.953772        .5769604
27      4.53551         4.506167        3.808779        .5831352
28      4.528004        4.622972        3.90481         .5968299

আমি বিশ্বাস করি যে প্লাস পরিমাপ ত্রুটির মাধ্যমে প্রায় অনুমান করা যায় তবে আপনি দেখতে পাচ্ছেন যে বর্জ্য, আনুমানিক ত্রুটি বা চুরির কারণে সর্বদা যথেষ্ট পরিমাণে ছাড়িয়ে যায়।Wpwd+(1p)wcW

এখানে আমার 2 প্রশ্ন।

  1. আমার প্রথম চিন্তাটি ছিল এই ভেরিয়েবলগুলিতে 1 ল্যাগ এবং একটি বহিরাগত সময় এবং সময় পরিবর্তনশীল সহ ভেক্টর অটোরগ্রেশন চেষ্টা করা, তবে আমার কাছে কতটা অল্প ডেটা দেওয়া হয়েছে তা একটি খারাপ ধারণা বলে মনে হয়। এমন কোনও টাইম-সিরিজ পদ্ধতি রয়েছে যা (1) "মাইক্রো-নিউমরোসিটি" এর মুখে আরও ভাল সম্পাদন করে এবং (2) ভেরিয়েবলগুলির মধ্যে লিঙ্কটি কাজে লাগাতে সক্ষম হবে?

  2. অন্যদিকে, ভিএআর-এর ইগেনভ্যালুগুলির মডুলিগুলি সমস্ত 1 এর চেয়ে কম, সুতরাং আমি মনে করি না যে আমাকে অ-স্থিরতা সম্পর্কে চিন্তা করার দরকার নেই (যদিও ডিকি-ফুলার পরীক্ষা অন্যথায় পরামর্শ দেয়)। ভবিষ্যদ্বাণীগুলি বেশিরভাগ সময় এবং বাদে সময় প্রবণতা সহ একটি নমনীয় অবিবাহিত মডেলের অনুমানগুলির সাথে সামঞ্জস্যপূর্ণ বলে মনে হয় which ল্যাগের সহগগুলি বেশিরভাগ ক্ষেত্রেই যুক্তিসঙ্গত বলে মনে হয় যদিও তারা বেশিরভাগ অংশের জন্য তুচ্ছ। লিনিয়ার ট্রেন্ডের সহগ উল্লেখযোগ্য, যেমন পিরিয়ড ডামি কিছু। তবুও, ভিএআর মডেলের চেয়ে এই সরল পদ্ধতির পছন্দ করার জন্য কি কোনও তাত্ত্বিক কারণ রয়েছে?পিWp

সম্পূর্ণ প্রকাশ: আমি কোনও প্রতিক্রিয়া ছাড়াই স্ট্যাটালিস্টের উপর অনুরূপ প্রশ্ন জিজ্ঞাসা করেছি ।


হাই, আপনি যে পচনটি করতে চান তার আশেপাশে আপনি আরও কিছু প্রসঙ্গ দিতে পারেন, যেমন আমি এটি টাইম সিরিজের ডেটাতে প্রয়োগ করতে দেখিনি?
মিশেল

ওয়াট'-ওয়াট=পি'*(Wডি'-Wডি)+ +(1-পি')*(Wসি'-Wসি)+ +(Wডি-Wসি)*(পি'-পি)+ +(ε'-ε)যেখানে প্রাইমগুলি ভেরিয়েবলের বর্তমান মান বোঝায়।
দিমিত্রি ভি। মাস্টারভ

হুমম, রিগ্রেশন হওয়ার আগে প্রথমে আউটলিয়ারদের কীভাবে বাদ দেওয়া যায়?
এথোস

আপনার কোন স্তরের নির্ভুলতার প্রয়োজন? আমি জিজ্ঞাসা করছি কারণ আপনি জানেন, আপনি আরিমা মডেলগুলি ব্যবহার করতে পারেন এবং খুব কম এমএসই পেতে পারেন। তবে, যেহেতু maximum মডেলগুলি সাধারণত সর্বাধিক সম্ভাবনা ব্যবহার করে ফিট হয়, এটি আপনার পক্ষে বেশি পরিচ্ছন্ন হবে তা প্রায় নিশ্চিত। বায়েশিয়ান মডেলগুলি অল্প ডেটা নিয়ে কাজ করার সময় দৃ when় হয় তবে আমি মনে করি আপনি এমএসইতে আরিমা মডেলের চেয়ে বেশি মাত্রার অর্ডার পাবেন।
রবার্ট স্মিথ

উত্তর:


2

আমি বুঝতে পারি যে এই প্রশ্নটি এখানে বছরের পর বছর ধরে বসে আছে, তবে এখনও, নিম্নলিখিত ধারণাগুলি কার্যকর হতে পারে:

  1. যদি ভেরিয়েবলগুলির মধ্যে লিঙ্ক থাকে (এবং তাত্ত্বিক সূত্রটি এত ভাল কাজ করে না), পিসিএ একটি পদ্ধতিগত উপায়ে (রৈখিক) নির্ভরতা সন্ধান করতে ব্যবহার করা যেতে পারে। আমি দেখাব যে এটি এই প্রশ্নের প্রদত্ত ডেটার জন্য ভাল কাজ করে।

  2. এখানে খুব বেশি ডেটা নেই (মোট ১১২ টি সংখ্যা রয়েছে) দেওয়া মাত্র কয়েকটি মডেলের প্যারামিটার অনুমান করা যায় ( উদাহরণস্বরূপ পুরো মৌসুমী প্রভাবগুলি ফিট করা কোনও বিকল্প নয়), এবং একটি কাস্টম মডেলের চেষ্টা করা বোধগম্য হতে পারে।

এই নীতিগুলি অনুসরণ করে আমি কীভাবে পূর্বাভাস করব:

পদক্ষেপ 1. আমরা ডেটা নির্ভরতা প্রকাশ করতে পিসিএ ব্যবহার করতে পারেন। আর ব্যবহার করে, এতে থাকা ডেটা সহ x:

> library(jvcoords)
> m <- PCA(x)
> m
PCA: mapping p = 4 coordinates to q = 4 coordinates

                              PC1         PC2          PC3          PC4
standard deviation     0.18609759 0.079351671 0.0305622047 0.0155353709
variance               0.03463231 0.006296688 0.0009340484 0.0002413477
cum. variance fraction 0.82253436 0.972083769 0.9942678731 1.0000000000

ওয়াট=0,234W-1,152W-8,842পি

4×4

পদক্ষেপ 2. পিসি 1 এ একটি স্পষ্ট প্রবণতা রয়েছে:

> t <- 1:28
> plot(m$y[,1], type = "b", ylab = "PC1")
> trend <- lm(m$y[,1] ~ t)
> abline(trend)

পিসি 1 এর প্রবণতা

আমি এই প্রবণতাটি সরিয়ে পিসি স্কোরগুলির একটি অনুলিপি তৈরি করেছি:

> y2 <- m$y
> y2[,1] <- y2[,1] - fitted(trend)

অন্যান্য পিসির স্কোর প্লট করা কোনও পরিষ্কার প্রবণতা প্রকাশ করে না, তাই আমি এগুলি অপরিবর্তিত রেখেছি।

পিসি স্কোরগুলি কেন্দ্রিক হওয়ায়, প্রবণতাটি পিসি 1 নমুনার ভর কেন্দ্রের মধ্য দিয়ে যায় এবং প্রবণতাটি কেবল একটি পরামিতি অনুমানের সাথে মিলে যায়।

পদক্ষেপ ৩. একটি জোড়া স্কেটার প্লট কোনও পরিষ্কার কাঠামো দেখায় না, তাই আমি পিসিগুলিকে স্বাধীন বলে মডেল করি:

> pairs(y2, asp = 1, oma = c(1.7, 1.7, 1.7, 1.7))

প্রবণতা অপসারণের পরে পিসিগুলির স্কেটার প্লট যুক্ত করুন

পদক্ষেপ ৪. পিসি 1 এ একটি স্পষ্ট সময়কালীনতা রয়েছে, 13 এর পিছনে (প্রশ্ন অনুসারে প্রস্তাবিত)। এটি বিভিন্ন উপায়ে দেখা যায়। উদাহরণস্বরূপ, লেগ ১৩ টি স্বতঃসংশোধন একটি সংশোধনগ্রামে 0 থেকে উল্লেখযোগ্যভাবে পৃথক হিসাবে দেখায়:

> acf(y2[,1])

ড্রিফট অপসারণের পরে পিসি 1 এর এসিএফ

(স্থানান্তরিত স্থানটি দৃশ্যত আরও আকর্ষণীয় হয় যখন স্থানান্তরিত অনুলিপি সহ ডেটা প্লট করার সময়))

Yটি+ +13(1)=α13Yটি(1)+ +σεটি+ +13εটিα13σlm()

> lag13 <- lm(y2[14:28,1] ~ y2[1:15,1] + 0)
> lag13

Call:
lm(formula = y2[14:28, 1] ~ y2[1:15, 1] + 0)

Coefficients:
y2[1:15, 1]  
     0.6479  

> a13 <- coef(lag13)
> s13 <- summary(lag13)$sigma

প্লাজিবিিলিটি টেস্ট হিসাবে আমি পিসি 1 (নীল) এর জন্য আমার মডেলটির একটি এলোমেলো ট্র্যাজেক্টোরির সাথে একসাথে ভবিষ্যতে এক বছরের জন্য প্রদত্ত ডেটা (কালো) প্লট করি:

t.f <- 29:41
pc1 <- m$y[,1]
pc1.f <- (predict(trend, newdata = data.frame(t = t.f))
          + a13 * y2[16:28, 1]
          + rnorm(13, sd = s13))
plot(t, pc1, xlim = range(t, t.f), ylim = range(pc1, pc1.f),
     type = "b", ylab = "PC1")
points(t.f, pc1.f, col = "blue", type = "b")

PC1 এর জন্য একটি সিমুলেটেড ট্রাজেক্টোরি

পথের নীল, সিমুলেটেড টুকরাটি তথ্যের যুক্তিসঙ্গত ধারাবাহিকতার মতো দেখায়। পিসি 2 এবং পিসি 3 এর জন্য সংযুক্তিগুলি কোনও উল্লেখযোগ্য সম্পর্ককে দেখায় না, তাই আমি এই উপাদানগুলিকে সাদা গোলমাল হিসাবে মডেল করি। পিসি 4 পারস্পরিক সম্পর্ক দেখায়, তবে মোট বৈকল্পিকের পক্ষে এতটা কম অবদান রাখে যে এটি মডেলিংয়ের পক্ষে উপযুক্ত নয় বলে মনে হয় এবং আমি এই উপাদানটিকে সাদা শোরগোল হিসাবেও মডেল করি।

এখানে আমরা আরও দুটি পরামিতি লাগিয়েছি। এটি আমাদের মডেলটিতে মোট নয়টি পরামিতি নিয়ে আসে (পিসিএ সহ), যখন আমরা ১১২ সংখ্যার সমন্বিত ডেটা দিয়ে শুরু করি তখন অযৌক্তিক বলে মনে হয় না।

পূর্বাভাস। আমরা শব্দটি বাদ দিয়ে (গড় বোঝার জন্য) এবং পিসিএকে উল্টিয়ে একটি সংখ্যার পূর্বাভাস পেতে পারি:

> pc1.f <- predict(trend, newdata = data.frame(t = t.f)) + a13 * y2[16:28, 1]
> y.f <- data.frame(PC1 = pc1.f, PC2 = 0, PC3 = 0, PC4 = 0)
> x.f <- fromCoords(m, y.f)
> rownames(x.f) <- t.f
> x.f
          W       wd       wc         p
29 4.456825 4.582231 3.919151 0.5616497
30 4.407551 4.563510 3.899012 0.5582053
31 4.427701 4.571166 3.907248 0.5596139
32 4.466062 4.585740 3.922927 0.5622955
33 4.327391 4.533055 3.866250 0.5526018
34 4.304330 4.524294 3.856824 0.5509898
35 4.342835 4.538923 3.872562 0.5536814
36 4.297404 4.521663 3.853993 0.5505056
37 4.281638 4.515673 3.847549 0.5494035
38 4.186515 4.479533 3.808671 0.5427540
39 4.377147 4.551959 3.886586 0.5560799
40 4.257569 4.506528 3.837712 0.5477210
41 4.289875 4.518802 3.850916 0.5499793

অনিশ্চয়তা ব্যান্ডগুলি বিশ্লেষণাত্মকভাবে বা সহজভাবে মন্টি কার্লো ব্যবহার করে প্রাপ্ত করা যেতে পারে:

N <- 1000 # number of Monte Carlo samples
W.f <- matrix(NA, N, 13)
for (i in 1:N) {
    y.f <- data.frame(PC1 = (predict(trend, newdata = data.frame(t = t.f))
              + a13 * y2[16:28, 1]
              + rnorm(13, sd = s13)),
              PC2 = rnorm(13, sd = sd(y2[,2])),
              PC3 = rnorm(13, sd = sd(y2[, 3])),
              PC4 = rnorm(13, sd = sd(y2[, 4])))
    x.f <- fromCoords(m, y.f)
    W.f[i,] <- x.f[, 1]
}
bands <- apply(W.f, 2,
               function(x) quantile(x, c(0.025, 0.15, 0.5, 0.85, 0.975)))
plot(t, x$W, xlim = range(t, t.f), ylim = range(x$W, bands),
     type = "b", ylab = "W")
for (b in 1:5) {
    lines(c(28, t.f), c(x$W[28], bands[b,]), col = "grey")
}

পূর্বাভাসের জন্য অনিশ্চয়তা ব্যান্ডগুলি

ওয়াট


1
আকর্ষণীয় পদ্ধতির। আমাকে এই কিছুটা হজম করুন।
দিমিত্রি ভি। মাস্টারভ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.