নিম্নলিখিত দুটি টাইম সিরিজ দেওয়া ( x , y ; নীচে দেখুন), এই ডেটাতে দীর্ঘমেয়াদী প্রবণতার মধ্যে সম্পর্কের মডেল করার সেরা পদ্ধতিটি কী?
উভয় সময় সিরিজের উল্লেখযোগ্য ডুর্বিন-ওয়াটসন পরীক্ষা করা হয় যখন সময়ের ফাংশন হিসাবে মডেল করা হয় এবং না হয় স্থির থাকে (যেমন আমি এই শব্দটি বুঝি, বা এর অর্থ কী এটির অবশিষ্টাংশগুলিতে কেবল স্থির হওয়া দরকার?)। আমাকে বলা হয়েছে যে এর অর্থ প্রত্যেকটি সিরিজের প্রথম অর্ডার পার্থক্য (কমপক্ষে, এমনকি ২ য় অর্ডার) নেওয়া উচিত, আমি অপরিহার্যভাবে একটি অরিমা ব্যবহার করে (১,১,০) ), আরিমা (1,2,0) ইত্যাদি
আমি বুঝতে পারছি না কেন আপনি তাদের মডেল করার আগে আপনাকে কেন পিছিয়ে ফেলতে হবে। আমি স্বতঃসম্পর্ক মডেল করার প্রয়োজনীয়তাটি বুঝতে পারি, তবে কেন সেখানে আলাদা হওয়া দরকার তা আমি বুঝতে পারি না। আমার কাছে, এটি পৃথক করে ডিটারেন্ডিংয়ের মাধ্যমে এটি প্রদর্শিত হচ্ছে যা আমরা আগ্রহী এমন ডেটাতে প্রাথমিক সংকেতগুলি (এই ক্ষেত্রে দীর্ঘমেয়াদী প্রবণতাগুলি) সরিয়ে দিচ্ছি এবং উচ্চ-ফ্রিকোয়েন্সি "শব্দ" (শব্দটি আলগাভাবে শব্দটি ব্যবহার করে) রেখে চলেছি। প্রকৃতপক্ষে, সিমুলেশনে যেখানে আমি এক সময় সিরিজ এবং অন্যটির মধ্যে প্রায় কোনও নিখুঁত সম্পর্ক তৈরি করি, যেখানে কোনও স্ব-সংশ্লেষণ না করে, সময় সিরিজের ভিন্নতা আমাকে ফলাফল দেয় যা সম্পর্ক সনাক্তকরণের উদ্দেশ্যে বিপরীত, যেমন,
a = 1:50 + rnorm(50, sd = 0.01)
b = a + rnorm(50, sd = 1)
da = diff(a); db = diff(b)
summary(lmx <- lm(db ~ da))
এই ক্ষেত্রে, খ সঙ্গে দৃঢ়ভাবে সম্পর্কিত হয় একটি , কিন্তু খ আরো গোলমাল হয়েছে। আমার কাছে এটি দেখায় যে স্বল্প ফ্রিকোয়েন্সি সংকেতের মধ্যে সম্পর্কগুলি সনাক্ত করার জন্য আদর্শের ক্ষেত্রে পৃথকীকরণ কাজ করে না । আমি বুঝতে পেরেছি যে ডিফারেন্সিং সাধারণত সময়-সিরিজ বিশ্লেষণের জন্য ব্যবহৃত হয় তবে এটি উচ্চ-ফ্রিকোয়েন্সি সংকেতের মধ্যে সম্পর্ক নির্ধারণের জন্য আরও কার্যকর বলে মনে হয়। আমি কী মিস করছি?
উদাহরণ ডেটা
df1 <- structure(list(
x = c(315.97, 316.91, 317.64, 318.45, 318.99, 319.62, 320.04, 321.38, 322.16, 323.04, 324.62, 325.68, 326.32, 327.45, 329.68, 330.18, 331.08, 332.05, 333.78, 335.41, 336.78, 338.68, 340.1, 341.44, 343.03, 344.58, 346.04, 347.39, 349.16, 351.56, 353.07, 354.35, 355.57, 356.38, 357.07, 358.82, 360.8, 362.59, 363.71, 366.65, 368.33, 369.52, 371.13, 373.22, 375.77, 377.49, 379.8, 381.9, 383.76, 385.59, 387.38, 389.78),
y = c(0.0192, -0.0748, 0.0459, 0.0324, 0.0234, -0.3019, -0.2328, -0.1455, -0.0984, -0.2144, -0.1301, -0.0606, -0.2004, -0.2411, 0.1414, -0.2861, -0.0585, -0.3563, 0.0864, -0.0531, 0.0404, 0.1376, 0.3219, -0.0043, 0.3318, -0.0469, -0.0293, 0.1188, 0.2504, 0.3737, 0.2484, 0.4909, 0.3983, 0.0914, 0.1794, 0.3451, 0.5944, 0.2226, 0.5222, 0.8181, 0.5535, 0.4732, 0.6645, 0.7716, 0.7514, 0.6639, 0.8704, 0.8102, 0.9005, 0.6849, 0.7256, 0.878),
ti = 1:52),
.Names = c("x", "y", "ti"), class = "data.frame", row.names = 110:161)
ddf<- data.frame(dy = diff(df1$y), dx = diff(df1$x))
ddf2<- data.frame(ddy = diff(ddf$dy), ddx = diff(ddf$dx))
ddf$ti<-1:length(ddf$dx); ddf2$year<-1:length(ddf2$ddx)
summary(lm0<-lm(y~x, data=df1)) #t = 15.0
summary(lm1<-lm(dy~dx, data=ddf)) #t = 2.6
summary(lm2<-lm(ddy~ddx, data=ddf2)) #t = 2.6