কেন স্টল ফাংশন এলোমেলো ডেটা সহ উল্লেখযোগ্য seasonতুগত প্রকরণ দেয়


11

আমি stl (Loতু দ্বারা টাইম সিরিজের মৌসুমী ক্ষয়) ফাংশন সহ নিম্নলিখিত কোডের সাথে প্লট করেছি:

plot(stl(ts(rnorm(144), frequency=12), s.window="periodic"))

এটি উপরের কোডে র্যান্ডম ডেটা (rnorm ফাংশন) সহ মৌখিক মৌসুমী প্রকরণ দেখায়। প্যাটার্নটি ভিন্ন হলেও এটি চলাকালীন প্রতিটি সময় সংখ্যার বৈচিত্র্য দেখা যায়। এরকম দুটি নিদর্শন নীচে দেখানো হয়েছে:

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন

মৌসুমী প্রকরণটি যখন দেখায় আমরা কীভাবে কিছু ডেটাতে stl ফাংশনের উপর নির্ভর করতে পারি। এই মৌসুমী প্রকরণটি কি অন্য কিছু পরামিতিগুলির দৃষ্টিতে দেখা দরকার? আপনার অন্তর্দৃষ্টি জন্য ধন্যবাদ।

কোডটি এই পৃষ্ঠা থেকে নেওয়া হয়েছে: আত্মহত্যার গণনার ডেটাতে মৌসুমী প্রভাবগুলির পরীক্ষা করার জন্য এটি কি উপযুক্ত পদ্ধতি?


1
এটি ঘটায় কারণ এলোমেলো ডেটাতে "নিদর্শনগুলি" রয়েছে, যদি আপনার ফিটিং কৌশলটিতে পর্যাপ্ত পরামিতি থাকে।
বিল_080

3
এখানে "উল্লেখযোগ্য" শব্দটি কোনও ধরণের তাত্পর্য পরীক্ষা করে প্রতিফলিত করে বলে মনে হয় না।
নিক কক্স

1
Stl একটি ননপ্যারমেট্রিক ডেটা চালিত পদ্ধতি, সুতরাং তাত্পর্য পরীক্ষার মাধ্যমে মৌসুমী অনিশ্চয়তার উপস্থিতি অনুমানের কোনও উপায় নেই।
পূর্বাভাসকারী

উত্তর:


12

Essণ পঁচার ডেটাতে গড় প্রয়োগ করে সিরিজটি মসৃণ করার উদ্দেশ্যে করা হয় যাতে এটি উপাদানগুলিতে পতিত হয়, যেমন ট্রেন্ড বা মৌসুমী, যা ডেটা বিশ্লেষণের জন্য আকর্ষণীয়। তবে এই পদ্ধতিটি মৌসুমতার উপস্থিতির জন্য একটি আনুষ্ঠানিক পরীক্ষা করার উদ্দেশ্যে নয় ।

যদিও আপনার উদাহরণে stlseasonতু পর্যায়ক্রমিকতার একটি ধীরে ধীরে ধীরে ধীরে ফিরে আসে, এই প্যাটার্নটি সিরিজের গতিশীলতা ব্যাখ্যা করার জন্য প্রাসঙ্গিক নয়। এটি দেখার জন্য, আমরা প্রতিটি সিরিজের বৈকল্পিককে মূল সিরিজের পরিবর্তনের সাথে তুলনা করতে পারি।

set.seed(123)
x <- ts(rnorm(144, sd=1), frequency=12)
a <- stl(x, s.window="periodic")
apply(a$time.series, 2, var) / var(x)
#   seasonal      trend  remainder 
# 0.07080362 0.07487838 0.81647852 

আমরা দেখতে পাচ্ছি যে এটি বাকী যা ডেটার বিভিন্ন প্রকারের ব্যাখ্যা দেয় (যেমনটি আমরা একটি সাদা শব্দ প্রক্রিয়া আশা করব)।

আমরা যদি মৌসুমীতার সাথে একটি সিরিজ নিই, তবে theতু উপাদানগুলির আপেক্ষিক প্রকরণটি অনেক বেশি প্রাসঙ্গিক (যদিও আমাদের কাছে এটি পরীক্ষা করার সোজা উপায় নেই কারণ লোস প্যারাম্যাট্রিক নয়)।

y <- diff(log(AirPassengers))
b <- stl(y, s.window="periodic")
apply(b$time.series, 2, var) / var(y)
#    seasonal       trend   remainder 
# 0.875463620 0.001959407 0.117832537 

আপেক্ষিক বৈকল্পগুলি সূচিত করে যে মৌসুমটি সিরিজের গতিশীলতা ব্যাখ্যা করার মূল উপাদান।


প্লট থেকে একটি গাফিল চেহারা stlবিভ্রান্তিকর হতে পারে। ফিরে আসা সুন্দর প্যাটার্নটি stlআমাদের ভাবতে পারে যে প্রাসঙ্গিক patternতুভিত্তিক তথ্যগুলি ডেটাতে চিহ্নিত করা যেতে পারে, তবে আরও ঘনিষ্ঠ দৃষ্টিভঙ্গি প্রকাশ করতে পারে যে এটি আসলে তা নয়। যদি উদ্দেশ্যটি alityতুপরিবর্তনের উপস্থিতি সম্পর্কে সিদ্ধান্ত নেওয়া হয় তবে লোম পচা প্রাথমিক দৃশ্য হিসাবে কার্যকর হতে পারে তবে এটি অন্যান্য সরঞ্জামের সাথে পরিপূরক হওয়া উচিত।


আপনার এয়ারপ্যাসেঞ্জার উদাহরণস্বরূপ, আউটপুট আসার কোনও প্রবণতা নেই, যখন প্লটের (এয়ারপ্যাসেভার্স) স্পষ্ট প্রবণতা রয়েছে। "ডিফ (লগ (এয়ারপ্যাসেঞ্জার্স))" বিবৃতিটি সরানো থাকলে ট্রেন্ডটি 0.86 এ আসে (কেবলমাত্র 0.1 এর মরসুমের সাথে)। কি করা উচিত?
rnso

আমি একটি উদাহরণ দিয়েছি যা সংখ্যাগতভাবে পরিষ্কার clear অনুশীলনে, কেবল স্মুথড উপাদানগুলির বৈচিত্রের সাথে তুলনা করে seasonতুসত্তার উপস্থিতি সম্পর্কে কোনও সিদ্ধান্তে পৌঁছানোর পক্ষে যথেষ্ট নাও হতে পারে। উদাহরণস্বরূপ, আপনি যেমনটি খুঁজে পেয়েছেন, পার্থক্যগুলি গ্রহণের মাধ্যমে যদি প্রবণতাটি সরানো হয় না, trendতু উপাদানগুলির প্রকরণের প্রবণতার বৈচিত্রটি প্রাধান্য পায়। প্রশ্নটি হল: এই উপাদানটিকে প্রাসঙ্গিক বিবেচনা করার জন্য 0.1 এর তুলনামূলক বৈকল্পিক কি যথেষ্ট বড়? সমস্যাটি হ'ল লোসের উপর ভিত্তি করে, উপাদানটির বৈচিত্র্য তাৎপর্যপূর্ণ কিনা তা পরীক্ষা করার সহজ সরল উপায় নেই।
জাভালাকল

যেমনটি আমি বলেছিলাম, এটি এবং অন্যান্য ক্ষেত্রে আমাদের কী করা উচিত তা হ'ল seasonতুপরিবর্তনের উপস্থিতি পরীক্ষা করার জন্য অন্যান্য পদ্ধতিগুলি ব্যবহার করা। উদাহরণস্বরূপ এখানে আমার উত্তর দ্বিতীয় অংশ দেখুন । একবার আমরা উপসংহারে পৌঁছেছি যে ডেটাতে seasonতু উপস্থিতি উপস্থিত রয়েছে, আমরা এই উপাদানটির প্যাটার্নটি অর্জন করতে লোস ব্যবহার করতে পারি।
জাভালাকলে

কেবলমাত্র আরও স্পষ্টতার জন্য, আপেক্ষিক বৈকল্পিকতা কীভাবে দেখাবে যে পঁচনের একটি অংশ সামগ্রিক ডেটাতে কতটা অভিনয় করে? IE 70% মৌসুমী, 20% প্রবণতা। ইত্যাদি
টেড মোসবি

1
@ টেডমসবি ভেরিয়েন্সটি ডেটাতে পরিবর্তনশীলতা / ছড়িয়ে পড়ার একটি পরিমাপ। উপাদানগুলির বৈচিত্রের যোগফল (উদাহরণস্বরূপ, প্রবণতা, মৌসুমী) এবং বাকীটির বৈচিত্রটি মূল সিরিজের বৈচিত্রকে যুক্ত করে। এইভাবে, মূল সিরিজের পরিবর্তনের সাথে কোনও উপাদানটির বৈকল্পিকের তুলনা করে আমরা উপাদানটি কতটা প্রাসঙ্গিক, তার একটি ধারণা পেতে পারি (যেমন, উপাদানটির দ্বারা ডেটাতে তারতম্যটি কতটা ব্যাখ্যা করা হয়েছে)।
জাভালাকলে

2

অনুরূপ শিরাতে আমি ফিউরির মডেলগুলি অ-মৌসুমী ডেটা ব্যবহার করতে দেখেছি, একটি seasonতু কাঠামোকে ফিট এবং পূর্বাভাসের মানগুলিতে জোর করে, একইরকম (হাঁফ!) ফলাফল তৈরি করে। একটি অনুমিত মডেল ফিট করা ব্যবহারকারীকে সে চাপিয়ে দেয় / অনুমান করে যা যা ভাল বিশ্লেষণের প্রস্তাব / বিতরণ করতে পারে তা সবসময় হয় না।


1
stl()ফুরিয়ার ধারণা ভিত্তিক নয়। যদিও আমি এখনও "বুদ্ধিহীন" বিশ্লেষণের পক্ষে কাউকে সমর্থন করতে দেখিনি, তবে নোট করুন যে কোনও মডেল পরিবার লাগানোকে চাপানো বা অনুমান হিসাবে বিবেচনা করা যেতে পারে। কোনও প্রক্রিয়া ব্যবহারকারীদের উপলব্ধি করতে কতদূর অবধি সুযোগ দেয় তা এবং কোনও নির্দিষ্ট ডেটাসেটের জন্য এটি কীভাবে খারাপভাবে কাজ করে তা প্রশ্ন।
নিক কক্স

@ নিককক্স বেশ সত্য ....
আইরিশস্ট্যাট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.