আর মৌসুমী সময় সিরিজ


9

আমি decomposeফাংশনটি ব্যবহার করি Rএবং আমার মাসিক সময় সিরিজের 3 টি উপাদান (প্রবণতা, মৌসুমী এবং এলোমেলো) নিয়ে আসি। যদি আমি চার্টটি প্লট করি বা টেবিলটি দেখি তবে আমি স্পষ্ট দেখতে পাচ্ছি যে সময় সিরিজটি seasonতুতে প্রভাবিত হয়।

যাইহোক, আমি যখন 11 টি মৌসুমের ডামি ভেরিয়েবলগুলিতে টাইম সিরিজটি পুনরায় চাপিয়ে দিই তখন সমস্ত সহগ সংখ্যাসূচকভাবে পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ নয়, প্রস্তাবিত কোনও মৌসুম নেই।

আমি বুঝতে পারছি না কেন আমি দুটি খুব ভিন্ন ফলাফল নিয়ে এসেছি। এটা কি কারও সাথেই হয়েছিল? আমি কি ভুল কিছু করছি?


আমি এখানে কিছু দরকারী বিশদ যুক্ত করছি।

এটি আমার সময় ধারাবাহিক এবং সম্পর্কিত মাসিক পরিবর্তন। উভয় চার্টে, আপনি দেখতে পারেন যে এখানে মৌসুমতা রয়েছে (বা এটি আমি মূল্যায়ন করতে চাই)। বিশেষত, দ্বিতীয় চার্টে (যা এই সিরিজের মাসিক পরিবর্তন) আমি বারবার প্যাটার্নটি দেখতে পাই (বছরের একই মাসগুলিতে উচ্চ পয়েন্ট এবং নিম্ন পয়েন্ট)।

TimeSeries

MonthlyChange

নীচে decomposeফাংশন আউটপুট দেওয়া হয় । @ রিচার্ড হার্দি যেমন বলেছিলেন তেমন আমি প্রশংসা করি, ফাংশনটি সত্যিকারের seasonতুস্নাত আছে কিনা তা পরীক্ষা করে না। তবে পচনটি মনে হয় যা আমি মনে করি তা নিশ্চিত করে।

পচা

যাইহোক, আমি যখন 11 মৌসুমের ডামি ভেরিয়েবলগুলিতে টাইম সিরিজটি পুনরায় চাপি (জানুয়ারি থেকে নভেম্বর, ডিসেম্বর বাদে) আমি নিম্নলিখিতটি পাই:

    Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 5144454056  372840549  13.798   <2e-16 ***
    Jan     -616669492  527276161  -1.170    0.248    
    Feb     -586884419  527276161  -1.113    0.271    
    Mar     -461990149  527276161  -0.876    0.385    
    Apr     -407860396  527276161  -0.774    0.443    
    May     -395942771  527276161  -0.751    0.456    
    Jun     -382312331  527276161  -0.725    0.472    
    Jul     -342137426  527276161  -0.649    0.520    
    Aug     -308931830  527276161  -0.586    0.561    
    Sep     -275129629  527276161  -0.522    0.604    
    Oct     -218035419  527276161  -0.414    0.681    
    Nov     -159814080  527276161  -0.303    0.763

মূলত, সমস্ত মৌসুমের সহগগুলি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ নয়।

লিনিয়ার রিগ্রেশন চালাতে আমি নিম্নলিখিত ফাংশনটি ব্যবহার করি:

lm.r = lm(Yvar~Var$Jan+Var$Feb+Var$Mar+Var$Apr+Var$May+Var$Jun+Var$Jul+Var$Aug+Var$Sep+Var$Oct+Var$Nov)

যেখানে আমি মাসিক ফ্রিকোয়েন্সি (ফ্রিকোয়েন্সি = 12) সহ টাইম সিরিজ ভেরিয়েবল হিসাবে ইয়াওয়ার সেট আপ করেছি।

আমি টাইম সিরিজের ট্রেন্ডিং উপাদানটিও রিগ্রেশন-এর ট্রেন্ড ভেরিয়েবল সহ একাউন্টে নেওয়ার চেষ্টা করি। তবে ফল পরিবর্তন হয় না।

                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 3600646404   96286811  37.395   <2e-16 ***
    Jan     -144950487  117138294  -1.237    0.222    
    Feb     -158048960  116963281  -1.351    0.183    
    Mar      -76038236  116804709  -0.651    0.518    
    Apr      -64792029  116662646  -0.555    0.581    
    May      -95757949  116537153  -0.822    0.415    
    Jun     -125011055  116428283  -1.074    0.288    
    Jul     -127719697  116336082  -1.098    0.278    
    Aug     -137397646  116260591  -1.182    0.243    
    Sep     -146478991  116201842  -1.261    0.214    
    Oct     -132268327  116159860  -1.139    0.261    
    Nov     -116930534  116134664  -1.007    0.319    
    trend     42883546    1396782  30.702   <2e-16 ***

সুতরাং আমার প্রশ্ন: আমি কি রিগ্রেশন বিশ্লেষণে কিছু ভুল করছি?


1
@ ফরেস্টার, আপনার প্রশ্নের উত্তর এখানে রয়েছে (ওপি বলছে decomposeফাংশন ইন Rব্যবহৃত হয়েছে)।
রিচার্ড হার্ডি

1
decomposeফাংশনের সহায়তা ফাইলটি পড়ে মনে হয় যে ফাংশনটি seasonতুবদ্ধতা আছে কিনা তা পরীক্ষা করে না। পরিবর্তে, এটি প্রতিটি মৌসুমের জন্য গড় অর্জন করে, গড়কে বিয়োগ করে এবং এটিকে মৌসুমী উপাদান বলে। সুতরাং এটি সত্যিকারের অন্তর্নিহিত মৌসুমী উপাদান বা কেবল গোলমাল নির্বিশেষে মৌসুমী উপাদান তৈরি করবে। তবুও, এটি আপনার ডমিগুলি কেন তুচ্ছ তা ব্যাখ্যা করে না যদিও আপনি বলছেন যে ডেটার প্লট থেকে theতুটি দৃশ্যমান। এটি কি আপনার নমুনাটি উল্লেখযোগ্য মৌসুমী ডামি পেতে খুব ছোট? তারা যৌথভাবে তাৎপর্যপূর্ণ?
রিচার্ড হার্ডি

3
আপনাকে স্কেলগুলি দেখতে হবে, মৌসুমী চার্টটি দেখায় seasonতুর প্রকরণ -0.02 এবং +0.04 এর মধ্যে, যখন আসল মানগুলি 4 বিলিয়ন থেকে 6 বিলিয়ন পর্যন্ত। পচন ফাংশনটি আপনার ডেটাটিকে কিছু seasonতুচিহ্ন প্রদর্শন করতে বাধ্য করে যে কারণে এটি একটি নগদ দেখাচ্ছে যা নগন্য নয়। আপনার ডেটাতে কোনও মৌসুমতা নেই।
পূর্বাভাস 21

1
আমি ভেবেছিলাম মৌসুমতা আন্দোলনের পরিমাণের চেয়ে নির্দিষ্ট "নির্দিষ্ট" ফ্রিকোয়েন্সি নিয়ে চলাচল সম্পর্কে আরও বেশি। স্কেলগুলি আলাদা হয় কারণ প্রথম চার্টটি ভারসাম্য দেখায় (পাউন্ডের ক্ষেত্রে) এবং দ্বিতীয়টি পরিবর্তন হয় (শতাংশের শর্তে প্রকাশিত)। আমি কেবলমাত্র রিগ্রেশনটি আবার চালানোর চেষ্টা করেছি: যদি আমি একটি বহুবর্ষের প্রবণতা বিবেচনা করি তবে কিছু সহগ উল্লেখযোগ্য হতে শুরু করে। আমার ধারণা, @ আদনো যেমন পরামর্শ দিয়েছেন, তেমন প্রবণতা খুব তাৎপর্যপূর্ণ।
ম্যাটিয়াস

1
ক্যানোভা এবং হানসেন পরীক্ষা আপনার ডেটাতে একটি মৌসুমী প্যাটার্নের উপস্থিতি এবং স্থায়িত্ব সম্পর্কে আপনাকে আরও কিছু তথ্য দিতে পারে। এই পরীক্ষার কিছু অ্যাপ্লিকেশনগুলির জন্য উদাহরণস্বরূপ এই পোস্টটি দেখুন , যা মূল কাগজে এবং স্যাম্পল কোডের লিঙ্কটি দেয়।
জাভালাকলে

উত্তর:


1

ট্রেন্ডটি সরিয়ে দেওয়ার পরে আপনি কি ডেটাতে রিগ্রেশন করছেন ? আপনার ইতিবাচক প্রবণতা রয়েছে এবং আপনি ইভারে প্রবণতার জন্য দায়বদ্ধ না হলে আপনার ressionতুতে স্বাক্ষরটি সম্ভবত আপনার প্রতিরোধের মুখোশযুক্ত (প্রবণতার কারণে বৈকল্পিক, বা ত্রুটির কারণে, মাসের তুলনায় বড়))

এছাড়াও, আমি সময় সিরিজের সাথে মারাত্মকভাবে আত্মবিশ্বাসী নই, তবে প্রতিটি পর্যবেক্ষণকে এক মাসের জন্য নির্ধারিত করা উচিত নয় এবং আপনার প্রতিরোধকে এরকম কিছু দেখাচ্ছে?

lm(Yvar ~ Time + Month)

ক্ষমা প্রার্থনা যদি এর কোনও অর্থ হয় না ... এখানে কি রিগ্রেশন সর্বাধিক অর্থ বোধ করে?


আমি একটি ইকোনোমেট্রিক্সের পাঠ্যপুস্তকে (ওল্ড্রিজ) পড়েছিলাম যে আপনি যদি রিগ্রেশনটিতে "সময়" ফ্যাক্টরটি চালু করেন তবে এটি আপনার মূল সময় সিরিজটিকে ডি-ট্রেন্ডিংয়ের মতো। "সময়" ফ্যাক্টরের জন্য আমি একটি ভেক্টরকে বোঝাতে চাইছি [1, 2, ..., n] এর সাথে এন = পর্যবেক্ষণের সংখ্যা। আমি সত্যিই আপনার দ্বিতীয় পয়েন্ট পাই না। আমার দ্বিতীয় প্রতিরোধটি নীচের মত দেখাচ্ছে: lm.r = lm (ইভার ~ ভার)টিআমিমি+ +ভীএকটিRজানুয়ারী + + Var স্বাগতমএফ+ ++ +ভীএকটিRনভেম্বর)। এই আপনি কি বোঝাতে চেয়েছিলেন?
ম্যাটিটিস

এটি আপনার ডেটা কয়েক লাইন দেখতে সাহায্য করবে। তবে, আমি কল্পনা করেছি যে আপনি তিনটি কলাম পেয়েছেন, সময়, ইয়ার, মাস। সারিগুলি পর্যবেক্ষণ। সুতরাং, আমি আপনার এলএম () এর উপাদানগুলি সময় এবং মাস (মাসের ফ্যাক্টরের স্তর নয়) হিসাবে বিবেচনা করব। এছাড়াও, আমি মনে করি সময় সিরিজে lm () নিয়ে কিছু সমস্যা রয়েছে ... পর্যবেক্ষণটি স্বাধীন নয় - অস্থায়ীভাবে স্বতঃসংশ্লিষ্ট।
ড্যানো

1

সময় সিরিজের আপনার গ্রাফিকাল চিত্রায়, এটি স্পষ্ট যে "প্রবণতা" - সময়ের একটি লিনিয়ার উপাদান - এটি উপলব্ধির এককতম অবদানকারী। আমরা মন্তব্য করব যে এই সময়ের সিরিজের সর্বাধিক গুরুত্বপূর্ণ দিকটি প্রতি মাসে স্থিতিশীল বৃদ্ধি।

এর পরে, আমি মন্তব্য করব যে theতু পরিবর্তনের তুলনা করে ক্ষুদ্র is অবাক হওয়ার মতো বিষয় নয়, তাই 6 বছরেরও বেশি সময় ধরে মাসিক ব্যবস্থা নেওয়া (মোট 72 টি পর্যবেক্ষণের মধ্যে) লিনিয়ার রিগ্রেশন মডেলটি 11 মাসের বিপরীতে যে কোনও একটিকে পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ হিসাবে চিহ্নিত করার যথার্থতা পেতে ব্যর্থ হয়েছিল । তদুপরি এটি অবাক হওয়ার মতো কিছু নয় যে সময় প্রভাবটি পরিসংখ্যানিক তাত্পর্য অর্জন করে , কারণ এটি প্রায় consistent২ টি পর্যবেক্ষণের মধ্যে প্রায় একই সামঞ্জস্যপূর্ণ রৈখিক বৃদ্ধি যা তাদের theirতু প্রভাবের উপর শর্তাধীন al

11 মাসের বিপরীতে যে কোনওটির জন্য পরিসংখ্যানগত তাত্পর্য না থাকা মানে এই নয় যে কোনও মৌসুমী প্রভাব নেই। আসলে, আপনি যদি কোনও seasonতুবদ্ধতা আছে কিনা তা নির্ধারণ করার জন্য যদি কোনও রিগ্রেশন মডেল ব্যবহার করতে চান তবে উপযুক্ত পরীক্ষাটি হ'ল স্বাধীনতা পরীক্ষার নেস্টেড 11 ডিগ্রি যা একই সাথে প্রতিটি মাসের বিপরীতে স্ট্যাটিস্টিকাল তাত্পর্য মূল্যায়ন করে। আপনি একটি এএনওওএ, সম্ভাবনা অনুপাতের পরীক্ষা বা জোরালো ওয়াল্ড পরীক্ষা করে এই জাতীয় পরীক্ষা গ্রহণ করবেন। এই ক্ষেত্রে:

library(lmtest) model.mt <- lm(outcome ~ time + month) model.t <- lm(outcome ~ time) aov(model.mt, model.t) lrtest(model.mt, model.t) library(sandwich) ## autoregressive consistent robust standard errors waldtest(lrtest, lmtest, vcov.=function(x)vcovHAC(x))


0

আমি জানি না এটি আপনার কেস কিনা, তবে আমার সাথে এটি ঘটেছিল যখন আমি আর-তে টাইম সিরিজ বিশ্লেষণ শুরু করেছিলাম এবং বিষয়টি হ'ল সময় সিরিজের সময়টিকে সঠিকভাবে বিবরণ দেওয়ার সময় টাইম সিরিজ অবজেক্ট তৈরি করার সময় আমি সঠিকভাবে বলেছিলাম না। সময় সিরিজের ফাংশনে একটি প্যারামিটার রয়েছে যা আপনাকে এর ফ্রিকোয়েন্সি নির্দিষ্ট করতে দেয়। এটি করা, এটি সঠিকভাবে এর seasonতু প্রবণতাগুলিকে পচে যায়।


কিন্তু, আমি পচন ফাংশনটিতে ফ্রিকোয়েন্সিটি সঠিকভাবে সংজ্ঞায়িত করেছি (= আমার কাছে যেমন মাসিক ডেটা রয়েছে)। আসলে, আমি এই ফাংশনটির ফলাফল নিয়ে খুশি। আমার প্রশ্ন হ'ল আমি যখন ডামি ভেরিয়েবলগুলি ব্যবহার করে লিনিয়ার রিগ্রেশন করি তখন কেন আমি একই ফলাফলটি পাই না (মৌসুমতা তাৎপর্যপূর্ণ)। আমি এটি আর এবং এক্সেল উভয় দিয়েই করেছি এবং ফলাফলগুলিও একই: ডামি সহগগুলি পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ নয়। এটি আগে পচন ফাংশনটিতে যা পেয়েছি তার বিরুদ্ধে। আমি বুঝতে পারি না যে আমি এখানে কিছু মিস করছি
ম্যাটিটিস

সত্য, দুঃখিত, আমি আপনার প্রশ্নটি পুরোপুরি বুঝতে পারি নি। আপনি আপনার কোড পোস্ট করতে পারলে এটি সহায়তা করবে, তাই আমরা চেষ্টা করে এটি পুনরুত্পাদন করতে পারি।
jmnavarro
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.