দৈনিক ডেটা সহ টাইম সিরিজের পূর্বাভাস: রেজিস্টার সহ আরিমা


15

আমি প্রতিদিনের ডেটা টাইম সিরিজ বিক্রয় ডেটা ব্যবহার করছি যাতে প্রায় 2 বছর দৈনিক ডেটা পয়েন্ট থাকে। কিছু অনলাইন-টিউটোরিয়াল / উদাহরণগুলির ভিত্তিতে আমি ডেটাতে seasonতুসত্তাকে সনাক্ত করার চেষ্টা করেছি। দেখে মনে হয় যে এখানে একটি সাপ্তাহিক, মাসিক এবং সম্ভবত একটি বার্ষিক পর্যায় / seasonতু রয়েছে।

উদাহরণস্বরূপ, বেতন-বেতন রয়েছে, বিশেষত মাসের প্রথম পয়দা দিবস যা সপ্তাহের কয়েক দিন স্থায়ী হয়। কিছু নির্দিষ্ট হলিডে এফেক্ট রয়েছে যা পর্যবেক্ষণগুলিকে লক্ষ্য করে পরিষ্কারভাবে চিহ্নিত করা যায়।

এই পর্যবেক্ষণগুলির কয়েকটি দিয়ে সজ্জিত, আমি নিম্নলিখিতটি চেষ্টা করেছি:

  1. আরিমা ( আর-পূর্বাভাস প্যাকেজ সহ Arimaএবং এর সাথে auto.arima), রেজিস্টার ব্যবহার করে (এবং ফাংশনে প্রয়োজনীয় অন্যান্য ডিফল্ট মান)। আমি যে রেজিস্টার তৈরি করেছি তা মূলত 0/1 মানের একটি ম্যাট্রিক্স:

    • 11 মাস (এন -1) ভেরিয়েবল
    • 12 ছুটির ভেরিয়েবল
    • বেতন-পর্বের অংশটি বের করতে পারিনি ... যেহেতু এটি আমার ধারণা থেকে কিছুটা বেশি জটিল প্রভাব। মাসের 1 ম সপ্তাহের দিনের উপর নির্ভর করে বেতন-দেয়ার প্রভাবটি ভিন্নভাবে কাজ করে।

    সময় সিরিজের মডেল করতে আমি 7 (অর্থাত্ সাপ্তাহিক ফ্রিকোয়েন্সি) ব্যবহার করেছি। আমি পরীক্ষার চেষ্টা করেছিলাম - একবারে 7 দিন পূর্বাভাস। ফলাফল যুক্তিসঙ্গত: 11 সপ্তাহের পূর্বাভাসের গড় যথার্থতা সাপ্তাহিক গড় আরএমএসইতে 5% আসে।

  2. টিবিএটিএস মডেল (আর-পূর্বাভাস প্যাকেজ থেকে) - একাধিক seasonতু ব্যবহার (7, 30.4375, 365.25) এবং সম্ভবত কোনও রেজিস্ট্রার নেই। যথার্থতা আশ্চর্যজনকভাবে আরিমা মডেলের তুলনায় সাপ্তাহিক গড় আরএমএসই ৩.৫% এর চেয়ে ভাল।

    এই ক্ষেত্রে, এআরএমএ ত্রুটিবিহীন মডেলটি কিছুটা আরও ভাল পারফর্ম করে। এখন যদি আমি # 1 তে বর্ণিত আরিমা মডেল থেকে কেবলমাত্র হলিডে এফেক্টের জন্য সহগগুলি প্রয়োগ করি, টিবিএটিএস মডেলের ফলাফলগুলিতে সাপ্তাহিক গড় আরএমএসই ২.৯৯% উন্নতি করে

এখন এই মডেলগুলির অন্তর্নিহিত তত্ত্বগুলির বিষয়ে খুব বেশি পটভূমি বা জ্ঞান না থাকলে, আমি এই দ্বিধায় রয়েছি যে এই টিবিএটিএস পদ্ধতিটি এমনকি একটি বৈধ কিনা। যদিও এটি 11 সপ্তাহের পরীক্ষায় আরএমএসইতে উল্লেখযোগ্যভাবে উন্নতি করছে, আমি ভাবছি এটি ভবিষ্যতে এই নির্ভুলতা বজায় রাখতে পারে কিনা। অথবা আরিমা থেকে টিবিএটিএস ফলাফলের জন্য হলিডে এফেক্ট প্রয়োগ করা ন্যায়সঙ্গত। যে কোনও / সমস্ত অবদানকারীদের কাছ থেকে যে কোনও ধারণা প্রশংসিত হবে।

পরীক্ষার ডেটার জন্য লিঙ্ক

দ্রষ্টব্য: ফাইলটি ডাউনলোড করতে "লিঙ্কটি সেভ করুন" করুন।


1
@CKI, সাইটে আপনাকে স্বাগতম। আপনি যদি ওয়েবে কোথাও আপনার ডেটা আপলোড করতে পারেন তবে আপনি এখানে একটি লিঙ্ক পোস্ট করতে পারেন।
গুং - মনিকা পুনরায়

নিবন্ধগুলি কীভাবে সেট আপ করা হয়েছিল সে সম্পর্কে আমি আরও জানতে আগ্রহী।
অরবিটাল

সপ্তাহের 6 দিনের ডমি, 11 টি মাসিক ডামি এবং ছুটির দিনগুলি সহজ 0/1 রেজিস্ট্রার। মাসের নির্দিষ্ট দিন, ছুটি, সময় প্রবণতা, মৌসুমী ডাল এবং নাড়ি চারপাশে সীসা এবং পিছনে পিছনে একটি তাত্ত্বিক অনুসন্ধানের ভিত্তিতে তৈরি করা হয়।
টম রিলি

সুতরাং সিকেআই, আপনি কীভাবে এটি সমাধান করেছেন?
টম রিলি

হ্যালো সি কেআই, আপনি মৌসুমী ম্যাট্রিক্স তৈরি করতে ব্যবহৃত কিছু আর স্ক্রিপ্ট ভাগ করতে পারেন
আহমেদ

উত্তর:


9

আপনার দৃষ্টিভঙ্গিটি নির্ধারণের জন্য বিভিন্ন দিগন্ত জুড়ে বিভিন্ন উত্স থেকে মডেল এবং পূর্বাভাসের মূল্যায়ন করা উচিত।

আমি ধরে নিই যে আপনার ডেটা মার্কিন যুক্তরাষ্ট্রের। আমি প্রতিদিনের ডেটা 3+ বছর পছন্দ করি কারণ আপনি সপ্তাহান্তে দুটি ছুটি অবতরণ করতে পারেন এবং কোনও সপ্তাহের দিন পড়তে পারেন না। দেখে মনে হচ্ছে আপনার থ্যাঙ্কসগিভিং প্রভাবটি ২০১২ সালের একদিন ছুটির দিন বা কোনও প্রকারের রেকর্ডিং ত্রুটি ছিল এবং মডেলটিকে থ্যাঙ্কসগিভিং ডে এফেক্টটি মিস করেছিল।

আপনি যদি বছরের একটি% হিসাবে দেখেন তবে জানুয়ারী সাধারণত ডেটাসেটে কম থাকে। সপ্তাহান্তে উচ্চতা। ডামিগুলি এই আচরণটির প্রতিফলন করে .... MONTH_EFF01, FIXED_EFF_N10507, FIXED_EFF_N10607

আমি খুঁজে পেয়েছি যে প্রতিদিনের ডেটা সহ একটি এআর উপাদান ব্যবহার করে ধরে নেওয়া হয় যে সপ্তাহের প্যাটার্নের শেষ দুই সপ্তাহের দিনটি কীভাবে প্যাটার্নটি সাধারণভাবে হয় যা একটি বড় অনুমান। আমরা 11 টি মাসিক ডামি এবং 6 টি ডামি দিয়ে শুরু করেছি। কেউ কেউ বাদ পড়ে মডেল থেকে। বি ** 1 এর অর্থ হল যে ছুটির পরের দিন একটি পিছনে প্রভাব রয়েছে। মাসের 6 টি বিশেষ দিন ছিল (দিন 2,3,5,21,29,30 ---- 21 উত্সাহী হতে পারে?) এবং 3 সময়ের প্রবণতা, 2 মরসুমের ডাল (যেখানে সপ্তাহের একটি দিন থেকে বিচ্যুতি শুরু হয়েছিল টিপিক্যাল, এই ডেটার আগে 0 এবং প্রতি 7 তম দিন পরে 1 এবং 2 জন আউটলিয়ার (থ্যাঙ্কসগিভিং নোট!) এটি চালাতে মাত্র 7 মিনিটেরও বেশি সময় নিয়েছিল। সমস্ত ফলাফল এখানে ডাউনলোড করুন www.autobox.com/se/dd/daily.zip

এটিতে একটি দ্রুত এবং নোংরা এক্সএলএস শীট অন্তর্ভুক্ত রয়েছে কিনা তা পরীক্ষা করে দেখার জন্য মডেলটি বুদ্ধিমান হয়। অবশ্যই, এক্সএলএস% সত্যই খারাপ কারণ তারা অশোধিত মানদণ্ড।

এই মডেলটি অনুমান করার চেষ্টা করুন:

Y(T) =  .53169E+06                                                                                        
       +[X1(T)][(+  .13482E+06B** 1)]                                       M_HALLOWEEN
       +[X2(T)][(+  .17378E+06B**-3)]                                       M_JULY4TH
       +[X3(T)][(-  .11556E+06)]                                            M_MEMORIALDAY
       +[X4(T)][(-  .16706E+06B**-4+  .13960E+06B**-3-  .15636E+06B**-2                                                 
       -  .19886E+06B**-1)]                                                 M_NEWYEARS
       +[X5(T)][(+  .17023E+06B**-2-  .26854E+06B**-1-  .14257E+06B** 1)]   M_THANKSGIVI
       +[X6(T)][(-  71726.    )]                                            MONTH_EFF01
       +[X7(T)][(+  55617.    )]                                            MONTH_EFF02
       +[X8(T)][(+  27827.    )]                                            MONTH_EFF03
       +[X9(T)][(-  37945.    )]                                            MONTH_EFF09
       +[X10(T)[(-  23652.    )]                                            MONTH_EFF10
       +[X11(T)[(-  33488.    )]                                            MONTH_EFF11
       +[X12(T)[(+  39389.    )]                                            FIXED_EFF_N10107
       +[X13(T)[(+  63399.    )]                                            FIXED_EFF_N10207
       +[X14(T)[(+  .13727E+06)]                                            FIXED_EFF_N10307
       +[X15(T)[(+  .25144E+06)]                                            FIXED_EFF_N10407
       +[X16(T)[(+  .32004E+06)]                                            FIXED_EFF_N10507
       +[X17(T)[(+  .29156E+06)]                                            FIXED_EFF_N10607
       +[X18(T)[(+  74960.    )]                                            FIXED_DAY02
       +[X19(T)[(+  39299.    )]                                            FIXED_DAY03
       +[X20(T)[(+  27660.    )]                                            FIXED_DAY05
       +[X21(T)[(-  33451.    )]                                            FIXED_DAY21
       +[X22(T)[(+  43602.    )]                                            FIXED_DAY29
       +[X23(T)[(+  68016.    )]                                            FIXED_DAY30
       +[X24(T)[(+  226.98    )]                                            :TIME TREND        1                   1/  1   1/ 3/2011   I~T00001__010311stack
       +[X25(T)[(-  133.25    )]                                            :TIME TREND      423                  61/  3   2/29/2012   I~T00423__010311stack
       +[X26(T)[(+  164.56    )]                                            :TIME TREND      631                  91/  1   9/24/2012   I~T00631__010311stack
       +[X27(T)[(-  .42528E+06)]                                            :SEASONAL PULSE  733                 105/  5   1/ 4/2013   I~S00733__010311stack
       +[X28(T)[(-  .33108E+06)]                                            :SEASONAL PULSE  370                  53/  6   1/ 7/2012   I~S00370__010311stack
       +[X29(T)[(-  .82083E+06)]                                            :PULSE           326                  47/  4  11/24/2011   I~P00326__010311stack
       +[X30(T)[(+  .17502E+06)]                                            :PULSE           394                  57/  2   1/31/2012   I~P00394__010311stack
      +                    +   [A(T)]
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.