Tsoutliers প্যাকেজ এবং অটো.রিমা ব্যবহার করে কীভাবে ব্যাখ্যা এবং পূর্বাভাস দেওয়া যায়


9

আমি 1993 থেকে 2015 পর্যন্ত মাসিক ডেটা পেয়েছি এবং এই ডেটাগুলির পূর্বাভাস করতে চাই। আমি আউটলিয়ারগুলি সনাক্ত করতে tsoutliers প্যাকেজ ব্যবহার করেছি, তবে আমি কীভাবে আমার ডেটা সেট করে পূর্বাভাস অবিরত করব তা জানি না।

এটি আমার কোড:

product.outlier<-tso(product,types=c("AO","LS","TC"))
plot(product.outlier)

Tsoutliers প্যাকেজ থেকে এটি আমার আউটপুট

ARIMA(0,1,0)(0,0,1)[12]                    

Coefficients:
        sma1    LS46    LS51    LS61    TC133   LS181   AO183   AO184   LS185   TC186    TC193    TC200
      0.1700  0.4316  0.6166  0.5793  -0.5127  0.5422  0.5138  0.9264  3.0762  0.5688  -0.4775  -0.4386
s.e.  0.0768  0.1109  0.1105  0.1106   0.1021  0.1120  0.1119  0.1567  0.1918  0.1037   0.1033   0.1040
       LS207    AO237    TC248    AO260    AO266
      0.4228  -0.3815  -0.4082  -0.4830  -0.5183
s.e.  0.1129   0.0782   0.1030   0.0801   0.0805

sigma^2 estimated as 0.01258:  log likelihood=205.91
AIC=-375.83   AICc=-373.08   BIC=-311.19

 Outliers:
    type ind    time coefhat  tstat
1    LS  46 1996:10  0.4316  3.891
2    LS  51 1997:03  0.6166  5.579
3    LS  61 1998:01  0.5793  5.236
4    TC 133 2004:01 -0.5127 -5.019
5    LS 181 2008:01  0.5422  4.841 
6    AO 183 2008:03  0.5138  4.592
7    AO 184 2008:04  0.9264  5.911
8    LS 185 2008:05  3.0762 16.038
9    TC 186 2008:06  0.5688  5.483
10   TC 193 2009:01 -0.4775 -4.624
11   TC 200 2009:08 -0.4386 -4.217
12   LS 207 2010:03  0.4228  3.746
13   AO 237 2012:09 -0.3815 -4.877
14   TC 248 2013:08 -0.4082 -3.965
15   AO 260 2014:08 -0.4830 -6.027
16   AO 266 2015:02 -0.5183 -6.442

এটা আমার চক্রান্ত

আমার কাছে এই সতর্কতা বার্তাও রয়েছে।

Warning messages:
1: In locate.outliers.iloop(resid = resid, pars = pars, cval = cval,  :
  stopped when maxit was reached
2: In locate.outliers.iloop(resid = resid, pars = pars, cval = cval,  :
  stopped when maxit was reached
3: In locate.outliers.oloop(y = y, fit = fit, types = types, cval = cval,  :
  stopped when maxit was reached
4: In arima(x, order = c(1, d, 0), xreg = xreg) :
  possible convergence problem: optim gave code = 1
5: In auto.arima(x = c(5.77, 5.79, 5.79, 5.79, 5.79, 5.79, 5.78, 5.78,  :
  Unable to fit final model using maximum likelihood. AIC value approximated

সন্দেহ:

  1. আমি যদি ভুল না হয়ে থাকি তবে সসুটিলার্স প্যাকেজটি এটি সনাক্তকারী আউটলিয়ারগুলি সরিয়ে ফেলবে এবং অপসারণকারীদের সাথে ডেটাসেট ব্যবহারের মাধ্যমে এটি আমাদের জন্য ডেটা সেটের জন্য উপযুক্ত সেরা আরিমা মডেল দেবে, এটি কি সঠিক?
  2. লেভেল শিফট ইত্যাদি অপসারণের কারণে সামঞ্জস্য করা সিরিজের ডেটা সেটটি অনেকাংশে নীচে স্থানান্তরিত হচ্ছে। এর অর্থ এই নয় যে যদি পূর্বাভাসটি সামঞ্জস্য করা সিরিজে করা হয় তবে পূর্বাভাসের আউটপুটটি খুব ভুল হবে, যেহেতু সাম্প্রতিকতম ডেটা ইতিমধ্যে 12 এরও বেশি, যখন অ্যাডজাস্ট করা ডেটা এটি প্রায় 7-8-এ স্থানান্তরিত করে।
  3. সতর্কতা বার্তা 4 এবং 5 এর অর্থ কী? এর মানে কি এটি অ্যাডজাস্ট করা সিরিজটি ব্যবহার করে অটো.রিমা করতে পারে না?
  4. আরিমা (0,1,0) (0,0,1) [12] এর [12] এর অর্থ কী? এটি কি আমার ডেটাসেটের কেবলমাত্র আমার ফ্রিকোয়েন্সি / পর্যায়ক্রমিকতা, যা আমি এটিকে মাসিক হিসাবে সেট করি? এবং এর অর্থ কি এই যে আমার ডেটা সিরিজগুলিও মৌসুমী?
  5. আমি কীভাবে আমার ডেটা সেটে মৌসুমী সনাক্ত করব? সময় সিরিজের প্লটটির দৃশ্যধারণের মতো আমি কোনও স্পষ্ট প্রবণতা দেখতে পাচ্ছি না এবং আমি যদি পচন ফাংশনটি ব্যবহার করি তবে এটি ধরে নেওয়া হবে যে একটি seasonতু প্রবণতা রয়েছে? সুতরাং আমি কি কেবল বিশ্বাস করি যে চতুররা আমাকে যা বলে, যেখানে মৌসুমী প্রবণতা রয়েছে, যেহেতু অর্ডার 1 এর এমএ আছে?
  6. এই বিদেশীদের চিহ্নিত করার পরে আমি কীভাবে এই ডেটা দিয়ে আমার পূর্বাভাসটি করতে পারি?
  7. কীভাবে এই আউটলিয়ারগুলিকে অন্যান্য পূর্বাভাস মডেলগুলিতে অন্তর্ভুক্ত করা যায় - এক্সফোনেনশিয়াল স্মুথিং, আরিমা, স্ট্রুটুরাল মডেল, র্যান্ডম ওয়াক, থিতা? আমি নিশ্চিত যে লেভেল শিফট থাকায় আমি আউটলিয়রদের অপসারণ করতে পারি না, এবং আমি যদি কেবল সামঞ্জস্য করা সিরিজের ডেটা নিই তবে মানগুলি খুব ছোট হবে, তাই আমি কী করব?

পূর্বাভাসের জন্য আমার কি এই আউটলিয়ারদের অটো.রিমাতে রেজিস্ট্রার হিসাবে যুক্ত করতে হবে? কিভাবে এই কাজ করে?

উত্তর:


5

এই মন্তব্যগুলি খুব দীর্ঘ ... সুতরাং একটি "উত্তর"

  1. আপনি ভুল হন এটি সামঞ্জস্য করে না এবং তারপরে আরিমা সনাক্ত করে (অটোবক্স যেমন করে) এটি অনুমানগতভাবে কোনও হস্তক্ষেপের সামঞ্জস্যতা গ্রহণ করে না এবং তারপরে ব্যঙ্গতার চিকিত্সা না করে প্রভাবিত এমন একটি আরিমা মডেল সনাক্ত করতে ছুটে যায়। প্রায়শই একজনকে এআরআইএমএ কাঠামো সনাক্তকরণের আগে ব্যবহারকারী-নির্ধারিত কার্যকারণ সিরিজ এবং / বা অনির্ধারিত ডিটারমিনিস্টিক কাঠামো (আউটলিয়ার্স / স্তর স্তর, মৌসুমী ডাল, স্থানীয় সময়ের প্রবণতা) উভয়ই সামঞ্জস্য করতে হয়। একটি দুর্বল মর্যাদাবোধের এই উদাহরণটি দেখুন যা অযৌক্তিকভাবে মূল সিরিজকে আলাদা করার ভুল করে যখন প্রকৃতির সত্য / সঠিক অবস্থার কোনও আলাদা করার প্রয়োজন হয় না। অ-স্টেশনারিটি অগত্যা পৃথককরণের প্রয়োজনীয়তা বোঝায় না তবে প্রায়শই স্তর / গড়ের পরিবর্তনের জন্য ডি-অর্থ iethe সামঞ্জস্যের পরামর্শ দিতে পারে

  2. সঠিক পূর্বাভাস সবসময় মূল সিরিজ থেকে করা হয় সুতরাং ইতিহাসের প্রেক্ষিতে পূর্বাভাসটি বিশ্বাসযোগ্য হওয়া উচিত।

  3. আমি এই পদ্ধতিটি সক্রিয়ভাবে ব্যবহার করি না বলে আমার কোনও ধারণা নেই। আমি আপনাকে এটি সুপারিশ করেছি কারণ আপনি বিনামূল্যে আর ভিত্তিক সমাধানের জন্য বলেছিলেন, কারণ আমি ভেবেছিলাম এটি ভাল বা পর্যাপ্ত ছিল কারণ আরিমা মডেলিংটি একটি পুনরাবৃত্তি (মাল্টি-স্টেজ) স্ব-চেকিং প্রক্রিয়া।

  4. মডেলটি মনে করে যে এটি মনে করে যে ডেটাতে একটি মা (12) মৌসুমী উপাদান রয়েছে তবে এটি কেবল একটি মৌসুমী নাড়ির প্রয়োজনীয়তার প্রতিফলন করতে পারে।

  5. একটি seasonতু প্রবণতার ধারণাটি অস্পষ্ট।

  6. আমার উত্তরটি খুব সুস্পষ্ট এবং স্ব-প্রভাবিত হবে


1
tu খুব বেশি @ricardo
আইরিশস্ট্যাট

4

প্যাকেজ 'tsoutliers' চেন এবং লিউ দ্বারা বর্ণিত পদ্ধতি প্রয়োগ করে (1993) [1]। প্যাকেজ এবং পদ্ধতির একটি বিবরণও এই নথিতে দেওয়া আছে ।

সংক্ষেপে, পদ্ধতিটি দুটি প্রধান পর্যায় নিয়ে গঠিত:

  1. নির্বাচিত আরিমা মডেল অনুসারে আউটলিয়ারদের সনাক্তকরণ।
  2. পূর্ববর্তী পদক্ষেপে চিহ্নিত আউটলিয়ার্স সহ আরিমা মডেলটি বেছে নিন এবং / অথবা রিফাইট করুন এবং নতুন ফিটের ক্ষেত্রে তাত্পর্যপূর্ণ নয় এমন অপ্রদর্শকদের সরিয়ে দিন।

এরপরে সিরিজটি সনাক্তকারী আউটলিয়ারদের জন্য সামঞ্জস্য করা হয় এবং আরও 1 জন outliers সনাক্ত না করা বা সর্বাধিক সংখ্যক পুনরাবৃত্তি না হওয়া পর্যন্ত পর্যায়গুলি (1) এবং (2) পুনরাবৃত্তি করা হয়।


প্রথম পর্যায়ে (বহিরাগতদের সনাক্তকরণ) এছাড়াও একটি পুনরাবৃত্ত প্রক্রিয়া। প্রতিটি পুনরাবৃত্তির শেষে এআরআইএমএ মডেলের অবশিষ্টাংশগুলিকে এই পর্যায়ে সনাক্ত করা বিদেশীদের জন্য সামঞ্জস্য করা হয়। আর কোনও বহিরাগত না পাওয়া বা সর্বাধিক সংখ্যক পুনরাবৃত্তি না হওয়া অবধি প্রক্রিয়াটি পুনরাবৃত্তি করা হয় (ডিফল্ট 4 পুনরাবৃত্তির দ্বারা)। প্রথম যে তিনটি সতর্কতা আপনি পেয়েছেন তা এই অভ্যন্তরীণ লুপের সাথে সম্পর্কিত, অর্থাত্ চারটি পুনরাবৃত্তির পরে পর্যায়টি বেরিয়ে আসে।

maxit.iloopফাংশনে যুক্তির মাধ্যমে আপনি এই সর্বাধিক সংখ্যক পুনরাবৃত্তি বৃদ্ধি করতে পারেন tso। প্রথম পর্যায়ে একটি উচ্চ সংখ্যক পুনরাবৃত্তি সেট না করে এবং প্রক্রিয়াটিকে দ্বিতীয় পর্যায়ে এগিয়ে যাওয়ার পরামর্শ দেওয়া হয় যেখানে আরিমা মডেলটি রিফিট করা হয় বা আবার নির্বাচিত হয়।


4 এবং 5 সতর্কতাগুলি এআরআইএমএ মডেলটি ফিট করার প্রক্রিয়া সম্পর্কিত এবং ফাংশন stats::arimaএবং জন্য যথাক্রমে মডেলটি বেছে নিয়েছে forecast:auto.arima। সম্ভাবনা কার্যটি সর্বাধিকতর করে এমন অ্যালগরিদম সর্বদা কোনও সমাধানে রূপান্তর করে না। আপনি এই সমস্যাগুলি সম্পর্কিত কিছু বিশদ জানতে পারেন, উদাহরণস্বরূপ, এই পোস্ট এবং এই পোস্টে


[1] চুং চেন এবং লন-মিউ লিউ (1993) "টাইম সিরিজে মডেল প্যারামিটার এবং আউটিলার এফেক্টের যৌথ অনুমান", আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশন জার্নাল , 88 (421), পৃষ্ঠা 284-297। ডিওআই: 10.1080 / 01621459.1993.10594321


tso () চালাতে কত সময় লাগবে?
আনুপ টফফাই

অ্যানুপটিফাই এটি ডেটার দৈর্ঘ্য, পর্যায়ক্রমিক ইত্যাদির উপর নির্ভর করে। বার্ষিক, মাসিক, ত্রৈমাসিক তথ্যগুলির জন্য, প্রায় 120 টি পর্যবেক্ষণের একটি নমুনার আকার এবং একটি এআরআইএমএ মডেল দ্বারা যুক্তিসঙ্গতভাবে ধরা যেতে পারে এমন একটি গতিশীল, অ্যালগরিদম বেশিরভাগ অংশে চলবে প্রায় 10 সেকেন্ড (সাধারণত অনেক কম)
javlacalle
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.