দুটি সময়ের সিরিজের মধ্যে সম্পর্ক: আরিমা


12

নিম্নলিখিত দুটি টাইম সিরিজ দেওয়া ( x , y ; নীচে দেখুন), এই ডেটাতে দীর্ঘমেয়াদী প্রবণতার মধ্যে সম্পর্কের মডেল করার সেরা পদ্ধতিটি কী?

উভয় সময় সিরিজের উল্লেখযোগ্য ডুর্বিন-ওয়াটসন পরীক্ষা করা হয় যখন সময়ের ফাংশন হিসাবে মডেল করা হয় এবং না হয় স্থির থাকে (যেমন আমি এই শব্দটি বুঝি, বা এর অর্থ কী এটির অবশিষ্টাংশগুলিতে কেবল স্থির হওয়া দরকার?)। আমাকে বলা হয়েছে যে এর অর্থ প্রত্যেকটি সিরিজের প্রথম অর্ডার পার্থক্য (কমপক্ষে, এমনকি ২ য় অর্ডার) নেওয়া উচিত, আমি অপরিহার্যভাবে একটি অরিমা ব্যবহার করে (১,১,০) ), আরিমা (1,2,0) ইত্যাদি

আমি বুঝতে পারছি না কেন আপনি তাদের মডেল করার আগে আপনাকে কেন পিছিয়ে ফেলতে হবে। আমি স্বতঃসম্পর্ক মডেল করার প্রয়োজনীয়তাটি বুঝতে পারি, তবে কেন সেখানে আলাদা হওয়া দরকার তা আমি বুঝতে পারি না। আমার কাছে, এটি পৃথক করে ডিটারেন্ডিংয়ের মাধ্যমে এটি প্রদর্শিত হচ্ছে যা আমরা আগ্রহী এমন ডেটাতে প্রাথমিক সংকেতগুলি (এই ক্ষেত্রে দীর্ঘমেয়াদী প্রবণতাগুলি) সরিয়ে দিচ্ছি এবং উচ্চ-ফ্রিকোয়েন্সি "শব্দ" (শব্দটি আলগাভাবে শব্দটি ব্যবহার করে) রেখে চলেছি। প্রকৃতপক্ষে, সিমুলেশনে যেখানে আমি এক সময় সিরিজ এবং অন্যটির মধ্যে প্রায় কোনও নিখুঁত সম্পর্ক তৈরি করি, যেখানে কোনও স্ব-সংশ্লেষণ না করে, সময় সিরিজের ভিন্নতা আমাকে ফলাফল দেয় যা সম্পর্ক সনাক্তকরণের উদ্দেশ্যে বিপরীত, যেমন,

a = 1:50 + rnorm(50, sd = 0.01)
b = a + rnorm(50, sd = 1)
da = diff(a); db = diff(b)
summary(lmx <- lm(db ~ da))

এই ক্ষেত্রে, সঙ্গে দৃঢ়ভাবে সম্পর্কিত হয় একটি , কিন্তু আরো গোলমাল হয়েছে। আমার কাছে এটি দেখায় যে স্বল্প ফ্রিকোয়েন্সি সংকেতের মধ্যে সম্পর্কগুলি সনাক্ত করার জন্য আদর্শের ক্ষেত্রে পৃথকীকরণ কাজ করে না । আমি বুঝতে পেরেছি যে ডিফারেন্সিং সাধারণত সময়-সিরিজ বিশ্লেষণের জন্য ব্যবহৃত হয় তবে এটি উচ্চ-ফ্রিকোয়েন্সি সংকেতের মধ্যে সম্পর্ক নির্ধারণের জন্য আরও কার্যকর বলে মনে হয়। আমি কী মিস করছি?

উদাহরণ ডেটা

df1 <- structure(list(
x = c(315.97, 316.91, 317.64, 318.45, 318.99, 319.62, 320.04, 321.38, 322.16, 323.04, 324.62, 325.68, 326.32, 327.45, 329.68, 330.18, 331.08, 332.05, 333.78, 335.41, 336.78, 338.68, 340.1, 341.44, 343.03, 344.58, 346.04, 347.39, 349.16, 351.56, 353.07, 354.35, 355.57, 356.38, 357.07, 358.82, 360.8, 362.59, 363.71, 366.65, 368.33, 369.52, 371.13, 373.22, 375.77, 377.49, 379.8, 381.9, 383.76, 385.59, 387.38, 389.78), 
y = c(0.0192, -0.0748, 0.0459, 0.0324, 0.0234, -0.3019, -0.2328, -0.1455, -0.0984, -0.2144, -0.1301, -0.0606, -0.2004, -0.2411, 0.1414, -0.2861, -0.0585, -0.3563, 0.0864, -0.0531, 0.0404, 0.1376, 0.3219, -0.0043, 0.3318, -0.0469, -0.0293, 0.1188, 0.2504, 0.3737, 0.2484, 0.4909, 0.3983, 0.0914, 0.1794, 0.3451, 0.5944, 0.2226, 0.5222, 0.8181, 0.5535, 0.4732, 0.6645, 0.7716, 0.7514, 0.6639, 0.8704, 0.8102, 0.9005, 0.6849, 0.7256, 0.878),
ti = 1:52), 
.Names = c("x", "y", "ti"), class = "data.frame", row.names = 110:161)

ddf<- data.frame(dy = diff(df1$y), dx = diff(df1$x))
ddf2<- data.frame(ddy = diff(ddf$dy), ddx = diff(ddf$dx))
ddf$ti<-1:length(ddf$dx); ddf2$year<-1:length(ddf2$ddx)
summary(lm0<-lm(y~x, data=df1))      #t = 15.0
summary(lm1<-lm(dy~dx, data=ddf))    #t = 2.6
summary(lm2<-lm(ddy~ddx, data=ddf2)) #t = 2.6

উত্তর:


6

ম্যাট, আপনি যে উদ্বেগকে অপ্রয়োজনীয় বিবিধ কাঠামো ব্যবহারের ক্ষেত্রে উত্থাপন করেছেন তাতে আপনি খুব সঠিক। একটি এসিএফ দিয়ে এখানে চিত্র বর্ণনা লিখুনগাউসিয়ান ত্রুটি প্রক্রিয়াটি রেন্ডার করার সময় আপনার ডেটা উল্লেখযোগ্য কাঠামোর উত্সাহদানের জন্য উপযুক্ত মডেল সনাক্ত করতেএখানে চিত্র বর্ণনা লিখুনএখানে চিত্র বর্ণনা লিখুনট্রান্সফার ফাংশন সনাক্তকরণ মডেলিং প্রক্রিয়াটি (এই ক্ষেত্রে) সরোগেট সিরিজগুলি তৈরি করতে উপযুক্ত পৃথকীকরণের প্রয়োজন যা স্থির এবং এইভাবে সম্পর্কটিকে চিহ্নিত করার জন্য ব্যবহারযোগ্য। এর মধ্যে সনাক্তকরণের জন্য পৃথককারী প্রয়োজনীয়তাগুলি এক্সের জন্য দ্বিগুণ এবং ওয়াইয়ের জন্য একক পৃথক ছিল were অতিরিক্তভাবে দ্বিগুণ পার্থক্যযুক্ত এক্সের জন্য একটি আরিমা ফিল্টারটি একটি এআর (1) হিসাবে পাওয়া গেছে। উভয় স্টেশনারি সিরিজে এই আরিমা ফিল্টারটি (কেবল সনাক্তকরণের উদ্দেশ্যে!) প্রয়োগ করা নিম্নলিখিত ক্রস-রিলেটিভ কাঠামোটি পেয়েছে। এখানে চিত্র বর্ণনা লিখুনএকটি সাধারণ সমসাময়িক সম্পর্ক প্রস্তাব। এখানে চিত্র বর্ণনা লিখুন। মনে রাখবেন যে মূল সিরিজটি অ-স্থিরত্ব প্রদর্শন করার সময় এটি অবশ্যই বোঝায় না যে কার্যকারণে মডেলটিতে পৃথকীকরণের প্রয়োজন। চূড়ান্ত মডেল এখানে চিত্র বর্ণনা লিখুনএবং চূড়ান্ত এসিএফ এটি সমর্থন করেএখানে চিত্র বর্ণনা লিখুন। চূড়ান্ত সমীকরণটি বন্ধ করে দেওয়ার সাথে সাথে একের পরম্পরাগতভাবে চিহ্নিত স্তরের শিফ্ট (সত্যিকারের বিরতি পরিবর্তন) হয়

 Y(t)=-4.78 + .192*X(t) - .177*X(t-1) which is NEARLY equal to 

 Y(t)=-4.78 + .192*[X(t)-X(t-1)] which means that changes in X effect the level of Y

পরিশেষে প্রস্তাবিত মডেলের বৈশিষ্ট্যগুলি নোট করুন।এখানে চিত্র বর্ণনা লিখুন

লেভেল শিফট সিরিজ (0,0,0,0,0,0,0,0,1,1, ........., 1) পরামর্শ দেয় যদি অপরিশোধিত না রেখে মডেলের অবশিষ্টাংশগুলি একটি স্তর প্রদর্শন করে প্রথম সময়কালে বা শেষ 42 এর মধ্যে একটি সাধারণ অবশিষ্টাংশের অনুমানের পরীক্ষার সময় সময় বা তার কাছাকাছি সময়ে স্থান পরিবর্তন করুন "-4.10" এর টেস্টের উপর ভিত্তি করে আলফা = .0002 এ তাৎপর্যপূর্ণ হবে। নোট করুন যে একটি ধ্রুবক গ্যারান্টি অন্তর্ভুক্তি যে বাকী অংশগুলির সামগ্রিক গড়টি শূন্যের তুলনায় উল্লেখযোগ্যভাবে পৃথক হয় না তবে এটি সব উপসেট সময়ের ব্যবধানের জন্য অগত্যা নয়। নিম্নলিখিত গ্রাফটি পরিষ্কারভাবে এটি দেখায় (আপনাকে দেখার জন্য বলা হয়েছিল!)। প্রকৃত / ফিট / পূর্বাভাসটি বেশ আলোকিত এখানে চিত্র বর্ণনা লিখুন। পরিসংখ্যান ল্যাম্পপোস্টগুলির মতো, কেউ কেউ এগুলি অন্যের উপর ঝুঁকতে ব্যবহার করে আলোকসজ্জার জন্য ব্যবহার করে।


ডেভ ব্যাপক বিশ্লেষণের জন্য ধন্যবাদ। ঠিক তাই আমি নিশ্চিত হয়েছি যে আমি বুঝতে পেরেছি, 2 হ'ল x ভেরিয়েবল, 3 ল্যাগ -1 সহ এক্স ভেরিয়েবল, এবং 4 স্তর শিফট? কোন আরিমা স্পেসিফিকেশন আছে?
ম্যাট অ্যালব্রেক্ট

@ ম্যাটআলব্র্যাচট ওয়াই নির্ভরশীল (মান সহ আপনার মান .0192, -। 0748 ...); এক্স 1 আপনার 315.97 মান সহ এক্স; এক্স 2 হ'ল ডামি ভেরিয়েবল 0,0,0,0,0,0,0,0,0,1,1,1, ... 1। এক্স 1 ভেরিয়েবলের সহগ [19 .১৯২ এবং -১7777 যথাক্রমে] সহ সমসাময়িক এবং পিছিয়ে যাওয়ার প্রভাব রয়েছে। চূড়ান্ত সম্পূর্ণ সমীকরণটি হল
আইরিশস্ট্যাট

@ ম্যাটআলব্র্যাচট ওয়াই নির্ভরশীল (মান সহ আপনার মান .0192, -। 0748 ...); এক্স 1 আপনার 315.97 মান সহ এক্স; এক্স 2 হ'ল ডামি ভেরিয়েবল 0,0,0,0,0,0,0,0,0,1,1,1, ... 1। এক্স 1 ভেরিয়েবলের সহগ [respectively .১৯২ এবং -১7777 যথাক্রমে] সহ সমসাময়িক এবং পিছনে উভয়ই প্রভাব রয়েছে। চূড়ান্ত সম্পূর্ণ সমীকরণের 4 সহগ রয়েছে; একটি ধ্রুবক; আপনার এক্স এবং এর জন্য দুটি
সহগফল

1

আমি সেই পরামর্শটিও বুঝতে পারি না। পার্থক্যটি বহুপদী প্রবণতাগুলি সরিয়ে দেয়। ধারাবাহিকগুলি একই রকম হয় কারণ বিভিন্ন প্রবণতাগুলির কারণে মূলত সেই সম্পর্কটিকে সরিয়ে দেয়। আপনি কেবল তখনই তা করতে পারেন যদি আপনি অবনমিত উপাদানগুলি সম্পর্কিত বলে আশা করেন। যদি একই ক্রমের বিভ্রান্তির ফলে অবশিষ্টাংশের জন্য acfs বাড়ে যা দেখে মনে হয় যে তারা কোনও সাদা আওয়াজ সহ স্থির এআরএমএ মডেল হতে পারে যা ইঙ্গিত দিতে পারে যে উভয় সিরিজের একই বা অনুরূপ বহুভুজ প্রবণতা রয়েছে।


যখন কোনও প্রবণতা না থাকে তখন অবস্থানহীনতার প্রতিকার করতে পার্থক্যও ব্যবহার করা যেতে পারে। অযৌক্তিকর ব্যবহার আপনি সঠিকভাবে উল্লেখ করার সাথে সাথে পরিসংখ্যান / একনোমেট্রিক বাজে কথা তৈরি করতে পারে।
আইরিশস্ট্যাট

1

আমি এটি যেভাবে বুঝতে পারি, পার্থক্যটি ক্রস-সম্পর্কিত সম্পর্কটিতে পরিষ্কার উত্তর দেয়। তুলনা ccf(df1$x,df1$y)এবং ccf(ddf$dx,ddf$dy)


আমি সম্মত হই যে ক্রস পারস্পরিক সম্পর্ক পার্থক্যযুক্ত সিরিজের মধ্যে কী সম্পর্ক বিদ্যমান তা দেখায় তবে আমার বক্তব্যটি এই সিরিজগুলির সাথে সম্পর্কিত বলে মনে হচ্ছে মূলত ভিন্ন ভিন্ন প্রবণতাগুলির কারণে remove
মাইকেল আর চেরনিক 5'12

আপনি কি সেখানে নিজের প্রশ্নের উত্তর দেন না? একটি প্রচলিত প্রবণতা আছে, আমরা এটিতে একমত। পার্থক্যটি প্রবণতার অতীতটি দেখার অনুমতি দেয়: প্রবণতার চারপাশে কীভাবে ওঠানামা হয়? এই ক্ষেত্রে, x এবং y এর মধ্যে পারস্পরিক সম্পর্ক লেগ 0 এবং 8 এর সাথে ঘটে la লেগ 8 এ এর ​​প্রভাব ddf y dy এর স্বতঃসংশ্লিষ্টতায়ও দৃশ্যমান। পার্থক্য ছাড়াই আপনি তা জানতেন না।
Kees
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.