সময় সিরিজের পূর্বাভাসটি কীভাবে নির্ধারণ করবেন?


10

গুরুত্বপূর্ণ বিষয় পূর্বাভাস মুখোমুখি হচ্ছে এক প্রদত্ত সিরিজের যদি পারেন বা পূর্বাভাস করা না?

আমি পিটার ক্যাট দ্বারা " একটি পূর্বোক্তির প্রিনোরি সূচক হিসাবে এন্ট্রপি " শিরোনামে একটি নিবন্ধে হোঁচট খেয়েছি , যা নির্দিষ্ট সময়ের সিরিজ নির্ধারণের জন্য আপেক্ষিক পরিমাপ হিসাবে আনুমানিক এনট্রপি (অ্যাপেন) ব্যবহার করে fore

নিবন্ধটি বলে,

"ছোট অ্যাপেন মানগুলি বৃহত্তর সম্ভাবনা নির্দেশ করে যে উপাত্তগুলির একটি সেট একই ধরণের ডেটা (নিয়মিততা) অনুসরণ করবে Con বিপরীতভাবে, এপেনের একটি বৃহত্তর মান একই ধরণের ডেটা পুনরাবৃত্তি হওয়ার (কম অনিয়ম) হওয়ার কম ইঙ্গিত দেয় Hence তাই বৃহত্তর মানগুলি আরও ব্যাধি প্রকাশ করে vey , এলোমেলোতা এবং সিস্টেম জটিলতা। "

এবং এপেন গণনার জন্য গাণিতিক সূত্রগুলি অনুসরণ করে। এটি একটি আকর্ষণীয় পদ্ধতির কারণ এটি একটি সংখ্যামূলক মান সরবরাহ করে যা আপেক্ষিক অর্থে পূর্বাভাসের মূল্যায়ন করতে ব্যবহার করা যেতে পারে। আনুমানিক এনট্রপির অর্থ আমি জানি না, আমি এটি সম্পর্কে আরও পড়ছি।

সেখানে একটি প্যাকেজ বলা হয় pracma মধ্যে Rআপনি Apen নিরূপণ করতে দেয়। উদাহরণস্বরূপ উদ্দেশ্যে, আমি 3 টি বিভিন্ন সময় সিরিজ ব্যবহার করেছি এবং অ্যাপেন সংখ্যা গণনা করেছি।

  1. সিরিজ 1: বিখ্যাত এয়ারপ্যাসেঞ্জার টাইম সিরিজটি অত্যন্ত নির্বিচারক এবং আমাদের সহজেই পূর্বাভাস করতে সক্ষম হওয়া উচিত।
  2. সিরিজ 2: সানস্পট টাইম সিরিজ - খুব ভাল সংজ্ঞায়িত তবে এটি সিরিজ 1 এর চেয়ে কম পূর্বাভাসযোগ্য হওয়া উচিত।
  3. সিরিজ 3: এলোমেলো সংখ্যা এই সিরিজটির পূর্বাভাস দেওয়ার কোনও উপায় নেই।

সুতরাং আমরা যদি অ্যাপেন গণনা করি তবে সিরিজ 1 সিরিজ 2 এর চেয়ে কম হওয়া উচিত সিরিজ 3 খুব কম হওয়া উচিত।

নীচে আর স্নিপেট যা তিনটি সিরিজের জন্য অ্যাপেন গণনা করে।

library("pracma")
> series1 <- approx_entropy(AirPassengers)
> series1
[1] 0.5157758
> series2 <- approx_entropy(sunspot.year)
> series2
[1] 0.762243
> series3 <- approx_entropy(rnorm(1:30))
> series3
[1] 0.1529609

এটি আমি প্রত্যাশা করে না। এলোপাতাড়ি সিরিজটি ভাল সংজ্ঞায়িত করে এলোমেলো সিরিজের কম নম্বর রয়েছে। এমনকি আমি এলোমেলো সংখ্যা 100 করে বাড়িয়ে দিলেও, আমি এখনও নিম্নলিখিতটি পেয়েছি যা ভাল সংজ্ঞায়িত সিরিজ 2 / সানস্পট.আইয়ালারি সিরিজের চেয়ে কম।

> series3 <- approx_entropy(rnorm(1:100))
> series3
[1] 0.747275

নীচে আমার প্রশ্নগুলি হল:

  1. ApEn ( mএবং r) গণনা করার জন্য 2 টি পরামিতি রয়েছে ? কীভাবে সেগুলি নির্ধারণ করবেন। উপরের কোডটিতে ডিফল্ট ব্যবহার করা হয়নি R
  2. আমি ভুলভাবে কী করছি যা দেখিয়ে দিচ্ছে যে এপেন এলোমেলো সংখ্যার তুলনায় কম। সূর্যস্পট.ইয়ারলি এর মতো একটি ভাল সংজ্ঞায়িত সিরিজ।
  3. আমি কি সিরিজটিকে ডিসসোনালাইজ / ডিটারেন্ডেন্ড করব এবং তারপরে অ্যাপেনের অনুমান করব। তবে লেখক অ্যাপেনকে সরাসরি সিরিজে প্রয়োগ করেছেন।
  4. সিরিজটি পূর্বাভাসযোগ্য কিনা তা নির্ধারণের অন্য কোনও উপায় আছে?

নিবন্ধে যেমন বলা হয়েছে আনুমানিক এনট্রপিটি স্বল্প সময়ের সিরিজ, এন <200 ব্যবহার করা উচিত নয়। আরও গুরুত্বপূর্ণ, নিবন্ধটি নমুনা এনট্রপি ব্যবহার করে না আনুমানিক এনট্রপি। প্র্যাকমায় দুটোই থাকে। ধন্যবাদ

এটি কি ব্যাখ্যামূলক ভেরিয়েবলের জন্য অ্যাকাউন্ট করে? উদাহরণস্বরূপ, আপনি যদি কোনও ফার্মের অ্যাকাউন্ট অ্যাট্রিটিশনের পূর্বাভাস দিচ্ছেন তবে এটি বিপণনের ব্যয়ের সাথে সম্পর্কিত হতে পারে এবং ব্যয়টি অত্যন্ত পূর্বাভাসযোগ্য, বাস্তবে, এটি কয়েক মাস আগেই পরিকল্পনা করা হয়েছে। প্রস্তাবিত পদ্ধতির ক্ষেত্রে এটি কীভাবে গণ্য হবে?
আকসকল

@ আকসাল, কোনও ব্যাখ্যামূলক ভেরিয়েবল নেই। আমি বড় আকারের অবিচ্ছিন্ন (কোনও ব্যাখ্যাযোগ্য পরিবর্তনশীল) সময় সিরিজের পূর্বাভাসের সন্ধান করছিলাম যেখানে আমাদের পূর্বাভাসের মূল্যায়ন করার জন্য একটি উদ্দেশ্যমূলক ব্যবস্থা প্রয়োজন। এছাড়াও, অনেকগুলি ক্ষেত্রে, ব্যাখ্যামূলক ভেরিয়েবলগুলির সাথে নির্মিত মডেলের তুলনায় অবিচ্ছিন্ন পূর্বাভাস অনেক বেশি নির্ভুল।
পূর্বাভাসকারী


1
আমার অনুভূতিটি হ'ল প্রস্তাবিত সদৃশটির তুলনায় এটি অনেক সংকীর্ণ প্রশ্ন। ভোটাভুটি খোলা রাখুন, তবে উভয়কে বিভ্রান্ত না করার জন্য ওপিকে আরও নির্দিষ্ট শিরোনাম বিবেচনা করার পরামর্শ দিন। বলুন, " আনুমানিক এনট্রপি ব্যবহার করে টাইম সিরিজের পূর্বাভাসটি কীভাবে নির্ধারণ করা যায় ?"
শান ইস্টার

উত্তর:


7

প্যারামিটারগুলি mএবং সময় সিরিজের আনুমানিক এনট্রপি (অ্যাপেন)r গণনায় জড়িত , উইন্ডো (ক্রম) দৈর্ঘ্য এবং সহনশীলতা (ফিল্টার মান) , যথাযথভাবে are বস্তুত, পদ , সেইসাথে (ডাটা বিন্দুর সংখ্যা), Apen হয় সংজ্ঞায়িত হিসাবে "দৈর্ঘ্য পুনরাবৃত্তিমূলক নিদর্শন আপেক্ষিক প্রাদুর্ভাব স্বাভাবিক লগারিদম দৈর্ঘ্যের সাথে তুলনায় " (Balasis, Daglis, Anastasiadis & Eftaxias, 2011 , পৃষ্ঠা 215):mrNmm + 1

একজনপিএন(মি,R,এন)=Φমি(R)-Φমি+ +1(R),

কোথায় 

Φমি(R)=Σআমিএনসিআমিমি(R)/(এন-মি+ +1)

অতএব, দেখা যাচ্ছে যে সহনশীলতা পরিবর্তন করা সময় সিরিজের 'এনট্রপি নির্ধারণের r(অস্থায়ী) গ্রানুলারিটি নিয়ন্ত্রণ করতে দেয় । তা সত্ত্বেও, ডিফল্ট উভয়ের জন্য মান ব্যবহার করে mএবং rএর মধ্যে পরামিতি pracmaপ্যাকেজ এর এনট্রপি ফাংশান কল কাজ করে জরিমানা। সমস্ত তিনটি সময়ের সিরিজের সঠিক এনট্রপি মানগুলি দেখার জন্য কেবলমাত্র একমাত্র ঠিক করা (আরও ভালভাবে সংজ্ঞায়িত সিরিজের জন্য নিম্ন এনট্রপি, আরও এলোমেলো তথ্যের জন্য উচ্চতর এনট্রপি) এলোমেলো ডাটা ভেক্টরের দৈর্ঘ্য বৃদ্ধি করতে হয় :

 library(pracma)
 set.seed(10)
 all.series <- list(series1 = AirPassengers,
                    series2 = sunspot.year,
                    series3 = rnorm(500)) # <== size increased
 sapply(all.series, approx_entropy)
  series1   series2   series3 
  0.5157758 0.7622430 1.4741971 

ফলাফল হিসাবে আশা করা যায় - যেমন অস্থিরতার ভবিষ্যদ্বাণীর কমে সবচেয়ে নির্ধারিত থেকে series1সবচেয়ে র্যান্ডম করার series 3, তাদের এনট্রপি পরিণামে বৃদ্ধি: ApEn(series1) < ApEn(series2) < ApEn(series3)

পূর্বাভাসের অন্যান্য ব্যবস্থাগুলি সম্পর্কে , আপনি গড় নিরঙ্কুশ স্কেলড ত্রুটিগুলি পরীক্ষা করতে চাইতে পারেন (ম্যাসেজ) - আরও বিশদের জন্য এই আলোচনাটি দেখুন। পূর্বাভাসযোগ্য উপাদান বিশ্লেষণও সময় সিরিজের পূর্বাভাসটি নির্ধারণের জন্য একটি আকর্ষণীয় এবং নতুন পদ্ধতির বলে মনে হয় । এবং, প্রত্যাশিতভাবে, এর জন্য একটি প্যাকেজ রয়েছে, যেমন - ফোরসিএR

library(ForeCA)
sapply(all.series,
       Omega, spectrum.control = list(method = "wosa"))
 series1   series2   series3 
 41.239218 25.333105  1.171738 

Ω[0,1]Ω(Wআমিটিএনআমিগুলি)=0%Ω(গুলিআমিএনতোমার দর্শন লগ করাগুলিআমি)=100%

তথ্যসূত্র

বালাসিস, জি।, ডাগলিস, আইএ, আনস্তাসিয়াদিস, এ।, এবং ইফ্ট্যাক্সিয়াস, কে। (2011)। এন্ট্রপি ধারণা এবং পুনরুদ্ধারকৃত পরিসীমা বিশ্লেষণ ব্যবহার করে ডিএসটি টাইম এসরিজে গতিময় জটিলতার পরিবর্তনগুলি সনাক্ত করা। ডব্লিউ। লিউ এবং এম ফুজিমোটো (এড।) -তে, ডায়নামিক ম্যাগনেটোস্ফিয়ার, আইএজিএ স্পেশাল সোপ্রন বুক, সিরিজ 3, 211. ডয়ি : 10.1007 / 978-94-007-0501-2_12। স্প্রিঙ্গের। Http://mebers.noa.gr/anastasi/papers/B29.pdf থেকে প্রাপ্ত

জর্জি এম গোয়ার্গ (২০১৩): পূর্বাভাসযোগ্য উপাদান বিশ্লেষণ। জেএমএলআর, ডাব্লু ও এসসিপি (2) 2013: 64-72। http://machinelearning.wustl.edu/mlpapers/papers/goerg13


আমি pracma::sample_entropy()ফাংশনটিও পরীক্ষা করেছি এবং সময় দৃশ্যের সাথে সম্পর্কিত সম্পর্কের সংশোধন করে।
আলেকসান্দ্র ব্লেক

@ ফরেস্টার: আপনাকে স্বাগতম!
আলেকসান্দ্র ব্লেক 20'15

1
এই কাগজটিও notsoirrational.files.wordpress.com/2015/04/schulz15.pdf দেখুন যা তাদের ভবিষ্যদ্বাণীমূলক পদক্ষেপের ন্যায্যতার জন্য পরীক্ষামূলক ডেটা ব্যবহার করে। এটি এই পোস্টে উল্লিখিত ফোরসিএ কাজের সাথে কিছু কাজের সাথে সম্পর্কিতও রয়েছে
জর্জি এম গোয়ের্গ

@ জর্জিএম.গোয়ার্গ: পরামর্শ, লিঙ্ক এবং সম্পাদনার জন্য আপনাকে ধন্যবাদ।
আলেকসান্দ্র ব্লেক

@ ফরেস্টার: আমার আনন্দ
আলেকসান্ডার ব্লেক

0

প্রতিবারের সিরিজটি 3 টি উপাদান দিয়ে তৈরি: ট্রেন্ড, asonতু এবং র্যান্ডম। যদি ডেটা একটি শক্তিশালী প্রবণতা প্রদর্শন করে এবং বা অত্যন্ত মৌসুমী হয়, তবে পূর্বাভাস তুলনামূলকভাবে সহজ হবে। যদি ডেটা বেশিরভাগ এলোমেলো হয় তবে সংজ্ঞা অনুসারে আপনি কোনও কিছুর পূর্বাভাস দিতে পারবেন না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.