অ পর্যায়ক্রমিক সময় সিরিজের প্রবণতা কীভাবে বিশ্লেষণ করা যায়


12

ধরা যাক আমি অ পর্যায়ক্রমিক সময় সিরিজ অনুসরণ করছি। অবশ্যই প্রবণতা হ্রাস পাচ্ছে এবং আমি এটি কিছু পরীক্ষার মাধ্যমে প্রমাণ করতে চাই ( পি-মান সহ )। শক্তিশালী টেম্পোরাল (সিরিয়াল) মানগুলির মধ্যে স্ব-সম্পর্কের কারণে আমি ক্লাসিক লিনিয়ার রিগ্রেশন ব্যবহার করতে অক্ষম use

library(forecast)
my.ts <- ts(c(10,11,11.5,10,10.1,9,11,10,8,9,9,
               6,5,5,4,3,3,2,1,2,4,4,2,1,1,0.5,1),
            start = 1, end = 27,frequency = 1)
plot(my.ts, col = "black", type = "p",
     pch = 20, cex = 1.2, ylim = c(0,13))
# line of moving averages 
lines(ma(my.ts,3),col="red", lty = 2, lwd = 2)

এখানে চিত্র বর্ণনা লিখুন

আমার বিকল্পগুলি কি?


4
আমি মনে করি যে সিরিজটি অ-পর্যায়ক্রমিক ( frequency=1) এখানে সামান্য প্রাসঙ্গিক। আরও প্রাসঙ্গিক সমস্যা হতে পারে আপনি নিজের মডেলের জন্য একটি কার্যকরী ফর্ম নির্দিষ্ট করতে ইচ্ছুক কিনা।
রিচার্ড হার্ডি

1
ডেটা কী তা সম্পর্কে আরও কিছু তথ্য সম্ভবত মডেলিংয়ের জন্য দরকারী।
বিডিওনোভিক

তথ্য হ'ল ব্যক্তি জগতের জলাশয়ে প্রতি বছর গণনা করা নির্দিষ্ট প্রজাতির সংখ্যা (হাজারে)।
লাডিস্লাভ ন্যাওও

1
@ লাডিস্লাভনাডো আপনার দেওয়া ধারাবাহিকটি উদাহরণের মতো সংক্ষিপ্ত? আমি জিজ্ঞাসা করি কারণ যদি তাই হয় তবে এটি নমুনার আকারের কারণে নিযুক্ত হওয়া পদ্ধতির সংখ্যা হ্রাস করে।
টিম

1
হ্রাসের দিকটির সুস্পষ্টতা বেশ স্কেল নির্ভর, যা আমার কাছে বিবেচনায় নেওয়া উচিত
লরেন্ট ডুভাল

উত্তর:


7

যেমনটি আপনি বলেছেন, আপনার উদাহরণের ডেটাগুলির প্রবণতা সুস্পষ্ট। লিনিয়ার রিগ্রেশন (সুস্পষ্ট প্যারামেট্রিক পছন্দ) ব্যবহারের চেয়ে আপনি যদি হাইপোথিসিস টেস্টের দ্বারা এই সত্যটি ন্যায়সঙ্গত করতে চান তবে আপনি একঘেয়ে ট্রেন্ডের জন্য নন-প্যারামেট্রিক ম্যান-কেন্ডাল পরীক্ষাটি ব্যবহার করতে পারেন। পরীক্ষায় অভ্যস্ত

সময়ের সাথে সাথে সুদের পরিবর্তনশীলের একরকম upর্ধ্বমুখী বা নিম্নমুখী প্রবণতা আছে কিনা তা নির্ধারণ করুন। একটি মনোোটোনিক wardর্ধ্বমুখী (নিম্নগামী) প্রবণতাটির অর্থ হল চলক ধারাবাহিকভাবে সময়ের সাথে সাথে বৃদ্ধি পায় (হ্রাস), তবে প্রবণতা রৈখিক হতে পারে বা নাও হতে পারে। ( http://vsp.pnnl.gov/help/Vsample/Design_Trend_Man_Kendall.htm )

তদ্ব্যতীত, গিলবার্ট (1987) দ্বারা পরীক্ষা হিসাবে উল্লেখ করা হয়েছে

অনুপস্থিত মানগুলি অনুমোদিত হওয়ার কারণে ডেটাগুলির কোনও নির্দিষ্ট বন্টনের সাথে সামঞ্জস্য হওয়ার দরকার নেই particularly

পরীক্ষার পরিসংখ্যান হ'ল সমস্ত সম্ভাব্য মধ্যে নেতিবাচক এবং ধনাত্মক পার্থক্যগুলির মধ্যে পার্থক্য iexjxin(n1)/2

S=i=1n1j=i+1nsgn(xjxi)

যেখানে একটি সাইন ফাংশন ব্যবহার করা যেতে পারে নিরূপণ করা পরিসংখ্যান যে পারস্পরিক সম্পর্ক অনুরূপ যেমন থেকে রেঞ্জ থেকে , যেখানে চিহ্ন, নেতিবাচক, বা ইতিবাচক প্রবণতা ও এর মান দাড়ায় প্রবণতা ঢাল সমানুপাতিক।sgn()S τ1+1τ

τ=Sn(n1)/2

অবশেষে, আপনি মূল্যগুলি গণনা করতে পারেন । আকারের নমুনাগুলির জন্য আপনি বিভিন্ন মান এবং বিভিন্ন নমুনা আকারের জন্য প্রাক্পম্পিউটেড মূল্যগুলির সারণীগুলি ব্যবহার করতে পারেন (গিলবার্ট, 1987 দেখুন)। বৃহত্তর নমুনাগুলি সহ, প্রথমে আপনার বৈকল্পিক গণনা করা দরকারpn10pSS

var(S)=118[n(n1)(2n+5)p=1gtp(tp1)(2tp+5)]

এবং তারপরে পরীক্ষার পরিসংখ্যান গণনা করুনZMK

ZMK={S1var(S)if S>00if S=0S+1var(S)if S<0

of এর মানটি সাধারণ মানগুলির সাথে তুলনা করা হয় ZMK

  • ZMKZ1α প্রবণতার জন্য,
  • ZMKZ1α নিম্নমুখী প্রবণতার জন্য,
  • |ZMK|Z1α/2 বা নিম্নমুখী প্রবণতার জন্য

ইন এই থ্রেড আপনি এই পরীক্ষা বাস্তবায়ন আর কোড খুঁজে পেতে পারেন।

যেহেতু পরিসংখ্যানগুলি তত্ক্ষণাত সমস্ত সম্ভাব্য পর্যবেক্ষণের সাথে তুলনা করা হয়, ভ্যালুয়ের জন্য সাধারণ আনুমানিক ব্যবহারের পরিবর্তে আপনি অনুচ্ছেদ পরীক্ষা ব্যবহার করতে পারেন যা এই ক্ষেত্রে সুস্পষ্ট is প্রথমে, আপনি আপনার ডেটা থেকে পরিসংখ্যান গণনা করুন এবং তারপরে আপনি এলোমেলোভাবে আপনার ডেটা একাধিকবার স্থানান্তরিত করেন এবং প্রতিটি নমুনার জন্য এটি গণনা করেন। কেবলমাত্র অনুপাত যখন প্রবণতার জন্য or বা নিম্নগামী প্রবণতার জন্যপি এস পি এস ডেটাএস অনুমানের এস ডেটাএস অনুগতিSpSpSdataSpermutationSdataSpermutation


গিলবার্ট, আরও (1987)। পরিবেশ দূষণ নিরীক্ষণের জন্য পরিসংখ্যানগত পদ্ধতি। উইলে, এনওয়াই

আনাজ, বি।, এবং বায়াজিট, এম। (2003) প্রবণতা সনাক্তকরণের জন্য পরিসংখ্যান পরীক্ষার শক্তি। প্রকৌশল ও পরিবেশ বিজ্ঞান তুর্কি জার্নাল, 27 (4), 247-251।


1

আপনার যে সমস্যাটি রয়েছে "মানগুলির মধ্যে শক্তিশালী টেম্পোরাল (সিরিয়াল) স্বতঃসংযোগের কারণে আমি ক্লাসিক লিনিয়ার রিগ্রেশন ব্যবহার করতে অক্ষম।" বাস্তবে একটি সুযোগ। আমি আপনার 27 টি মান নিয়েছি এবং অটোবক্সকে এক টুকরো সফটওয়্যার ব্যবহার করেছি (যা আমি বিকাশ করতে সহায়তা করেছি) যা ()চ্ছিকভাবে) একটি সম্ভাব্য মডেলটি স্বয়ংক্রিয়ভাবে নির্ধারণ করতে পারে। প্রকৃত / ফিট এবং পূর্বাভাস গ্রাফ এখানে এখানে চিত্র বর্ণনা লিখুন। অবশিষ্টাংশের এসিএফ এখানে অবশিষ্টাংশের প্লট রয়েছে এখানে চিত্র বর্ণনা লিখুন। মডেলটি এখানে এখানে চিত্র বর্ণনা লিখুনএবং এখানে এখানে চিত্র বর্ণনা লিখুনএবং এখানে রয়েছেএখানে চিত্র বর্ণনা লিখুন। দুটি সহগতি অনুমানযুক্ত "ট্রেন্ড" ওরফে "ড্রিফট" অর্থাত্ পিরিয়ড -5.56 এর ডিফারেনশনের সাথে ডেটা বর্ণনা করে। মনে রাখবেন এটি এমন এক ধরণের প্রবণতা যেখানে আপনার মডেল প্রিভিডেক্টর ভেরিয়েবল হিসাবে গণনা সংখ্যা 1,2, ... 27 ব্যবহার করে। যদি আপনার ডেটা ধরণের প্রবণতার পরামর্শ দেয় তবে সফ্টওয়্যারটি এটি আরও বেশি প্রযোজ্য বলে মনে হত। আমি চেষ্টা করব এবং আমার একটি পূর্ববর্তী পোস্ট খুঁজে পাব যা এই দুই ধরণের ট্রেন্ডকে পুরোপুরি বিশদ / বিপরীতে করেছে। এখানে স্টোকাস্টিক ট্রেন্ড মডেল সনাক্তকরণ এবং প্রাথমিক প্রবণতা বা আউটলিয়ারগুলি সনাক্ত করা

এখানে চিত্র বর্ণনা লিখুন


2
অটোবক্স পূর্বাভাস 1996, 1999, 2000, 2009 প্রতি আকর্ষণীয় পয়েন্ট মিস করে যেখানে সাম্প্রতিক প্রবণতাটি নষ্ট হয়েছে। এটি প্রায় এক বছরের মধ্যে ফেজ শিফটের মতো। সে ক্ষেত্রে এটি কোনও ব্যাখ্যা দেয় না।
আকসকল

আপনার পূর্ববর্তী সুপারিশ (গালে জিহ্বা) ডেটাতে একটি উচ্চ ডিগ্রি বহুপদী ফিটিং করার জন্য আপনি যা চেয়েছিলেন ঠিক তাই করবে। তবে আমরা মোটামুটি মডেলিংয়ের বিষয়ে ফিটিংয়ের বিষয়ে নই। অবশিষ্ট প্লটটি কোনও বাহ্যিক / অজানা কারণের কারণে একটি ত্রুটি প্রক্রিয়া পর্যাপ্তরূপে বর্ণনা করেছে বলে মনে হয়। সমস্ত মডেল ভুল তবে কিছু দরকারী। এটি আমি বিশ্বাস করি এটি একটি দরকারী মডেল তবে আপনি যদি ভাবেন আপনি আরও ভাল করতে পারেন তবে আপনার ফলাফল পোস্ট করুন যাতে আমরা সবাই শিখতে পারি। একটি আরিমা মডেল থেকে কোনও ব্যাখ্যা নেই কারণ অতীত বাদ দেওয়া ভেরিয়েবলগুলির কেবলমাত্র প্রক্সি।
আইরিশস্ট্যাট

2
এক্ষেত্রে মনে হয় পরিসংখ্যানের সাথে তেমন কিছু করার নেই। এটি মোটেও আকর্ষণীয় পরিসংখ্যানের প্রশ্ন নয়। একটি সুস্পষ্ট প্রবণতা রয়েছে, এবং ওপিকে অবশ্যই ঘটনার পদার্থবিজ্ঞান অধ্যয়ন করতে হবে। আমি মনে করি এই মডেলগুলি অটোবক্সের মতো ফিট করে কেবল ওপিকেই ভুল দিকে চালিত করে। তারা ইতিমধ্যে সুস্পষ্ট প্রমাণের বাইরে মূল্যবোধের কিছুই প্রকাশ করছে না।
আকসকল

বিশ্লেষকরা মানুষের চোখের প্রতিস্থাপন করতে পারে কিনা তা প্রশ্ন ... বিশ্লেষণটি চোখের সমর্থন কী করে তা প্রকাশ করে, এই কারণেই আমরা তাত্ক্ষণিকভাবে দৃশ্যমান হতে পারে তার চেয়ে বেশি কিছু করার জন্য পরিসংখ্যান অনুশীলন করি। অটোবক্স সমাধানটি ওপিকে সঠিক দিকে অর্থাৎ নীচে নিয়ে যায়। আপনার মন্তব্যগুলি আমার মতে মোটেও ফলদায়ক নয় তবে আমি আগে যেমন জিজ্ঞাসা করেছি (নম্রভাবে) দয়া করে একটি পরিসংখ্যান ভিত্তিক কার্যকর বিকল্প সরবরাহ করুন। আমার মতে এটি একটি খুব আকর্ষণীয় পরিসংখ্যানগত প্রশ্ন এবং এর একটি উত্তর প্রয়োজন। আপনি যদি পারেন তবে একটি সরবরাহ করুন।
আইরিশস্ট্যাট

1

আপনার ডেটা যে এক ডিগ্রীতে একঘেয়ে রয়েছে তা নির্ধারণ করতে আপনি স্পিয়ারম্যানের র‌্যাঙ্ক সহসংযোগ সহগ ব্যবহার করতে পারেন । এটি মনোোটোনিক বর্ধমান ডেটার জন্য ইতিবাচক মান এবং একঘেয়েমিক হ্রাসকারী ডেটার (-1 এবং +1 এর মধ্যে) নেতিবাচক মানগুলি প্রদান করে। উপরের লিঙ্কটি অনুসরণ করার পরেও একটি বিভাগ রয়েছে যা তাত্পর্যপূর্ণ পরীক্ষা করে চলেছে, যদিও আমি নিশ্চিত যে বেশিরভাগ সফ্টওয়্যার প্যাকেজগুলি আপনার জন্য পি-ভ্যালু সম্পন্ন করবে যখন পরিসংখ্যান সহগগুলি গণনা করা হবে (যেমন মতলব:; [RHO,PVAL] = corr(...)আর তে cor.test(x,...):)


0

আপনি ওএলএস ব্যবহার করতে পারেন কারণ কোনও সিরিয়াল স্বতঃসংশ্লিষ্টতা নেই (কমপক্ষে আপনার সরবরাহিত নমুনায়); 1.966 (≈2) এর ডুর্বিন-ওয়াটসন পরীক্ষার পরিসংখ্যান নোট করুন।

সুতরাং, এক্স 1 এর জন্য উল্লেখযোগ্যভাবে নেতিবাচক সহগের প্রাক্কলনটি আপনার মতো কিছু বলার দরকার

[নির্দিষ্ট প্রজাতির] পর্যবেক্ষণ করা গণনা প্রতিবছর প্রায় এক হাজার কমেছে।

অথবা

[নির্দিষ্ট প্রজাতির] পর্যবেক্ষণ করা গণনা প্রতি বছর 628 থেকে 1,408 এর মধ্যে হ্রাস পাচ্ছে (95% আত্মবিশ্বাসে)।

এটি ধরে নিয়েছে যে প্রজাতি গণনা করার পদ্ধতিটির ভাল কভারেজ রয়েছে এবং এটি আপনার নমুনায় বছরের পর বছর ধরে সামঞ্জস্যপূর্ণ।

এখানে চিত্র বর্ণনা লিখুন

এটি এই পাইথন কোডটি দিয়ে তৈরি করা হয়েছিল (দুঃখিত; আর হাতে লাগবে না):

import numpy as np
import statsmodels.api as sm

y = [10,12,10,11,8,9,6,4,2,4]
x = np.arange(len(y))
x = sm.add_constant(x)

mod = sm.OLS(y, x)
result = mod.fit()
print(result.summary())

0

তথ্যের উত্স জানা খুব সহায়ক হবে, এবং মানগুলি my.tsনেতিবাচক পেতে পারে কিনা সে সম্পর্কেও তথ্য ।

যাইহোক, ধ্রুবক রৈখিক প্রবণতা দেখার চেয়ে প্লটটি সম্পর্কে তাত্ক্ষণিকভাবে নজর দেওয়া , আমি বরং প্রস্তাব দিই যে সময় সিরিজ স্থির নয়, তাই একীভূত । উদাহরণস্বরূপ, শেয়ারের দামগুলিও সংহত হয়, তবে স্টক আর দেয় না (তারা 0 এর কাছাকাছি ওঠানামা করে)।

এই অনুমানটি অগমেন্টেড ডিকি ফুলার টেস্ট ব্যবহার করেও পরীক্ষা করা যেতে পারে:

require(tseries)
adf.test(my.ts)

Augmented Dickey-Fuller Test
Dickey-Fuller = -2.9557, Lag order = 2, p-value = 0.7727
alternative hypothesis: stationary

প্রদত্ত পি-মানটি 0.05 এর চেয়ে কম নয়, প্রক্রিয়াটি স্থির রয়েছে এমন কোনও প্রমাণ নেই।

তথ্য স্টেশনারি পেতে, আপনাকে এটির পার্থক্য করতে হবে:

diff.ts <- diff(my.ts)
plot(diff.ts)

এখানে চিত্র বর্ণনা লিখুন

এখন ডেটাগুলি আর কোনও প্রবণতা দেখায় না, এবং আপনি যে একমাত্র জিনিসটি পাবেন সেটি হল অর্ডার 2 (ব্যবহার acf(diff.ts)) এর একটি অটোরিগ্রেসিভ শব্দ ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.