আমার একটি মিশ্র ইফেক্ট মডেল রয়েছে (আসলে একটি জেনারেলাইজড অ্যাডিটিভ মিক্সড মডেল) যা আমাকে টাইমসারিগুলির জন্য পূর্বাভাস দেয়। স্বতঃসংশোধনের বিরুদ্ধে লড়াই করার জন্য, আমি আমার কাছে ডেটা অনুপস্থিত রয়েছে তার প্রেক্ষিতে আমি একটি কর্কার 1 মডেল ব্যবহার করি। ডেটা আমাকে মোট বোঝা দেবে বলে মনে করা হচ্ছে, তাই আমার পুরো পূর্বাভাস ব্যবধানের যোগফল প্রয়োজন। তবে আমার মোট লোডের স্ট্যান্ডার্ড ত্রুটির একটি অনুমানও পাওয়া উচিত।
যদি সমস্ত পূর্বাভাস স্বাধীন হয় তবে এটি সহজেই সমাধান করতে পারে:
সহ
সমস্যাটি হ'ল, পূর্বাভাসকৃত মানগুলি একটি মডেল থেকে আসে এবং মূল ডেটাতে স্বতঃসংশ্লিষ্ট হয়। পুরো সমস্যাটি নিম্নলিখিত প্রশ্নগুলির দিকে পরিচালিত করে:
- আমি কি ধরে নিচ্ছি যে গণনা করা পূর্বাভাসের এসই সেই ভবিষ্যদ্বাণীটির প্রত্যাশিত মানের পরিবর্তনের মূল হিসাবে ব্যাখ্যা করা যেতে পারে? আমি ভবিষ্যদ্বাণীগুলিকে "গড় ভবিষ্যদ্বাণী" হিসাবে ব্যাখ্যা করার প্রবণতা পোষণ করি, এবং সেজন্য একটি সম্পূর্ণ সেট যোগ করতে পারি।
- এই সমস্যাটিতে আমি স্বতঃসংশোধনকে কীভাবে অন্তর্ভুক্ত করব, বা আমি নিরাপদে ধরে নিতে পারি যে এটি ফলাফলগুলিকে খুব বেশি প্রভাবিত করবে না?
এটি আর এর একটি উদাহরণ। আমার আসল ডেটাসেটটিতে প্রায় 34.000 পরিমাপ রয়েছে, সুতরাং স্কেলিবিলিটি সমস্যা। এই কারণেই আমি প্রতি মাসের মধ্যে স্বতঃসংশোধনকে মডেল করি, অন্যথায় গণনা আর সম্ভব হয় না। এটি সর্বাধিক সঠিক সমাধান নয়, তবে সবচেয়ে সঠিক সমাধানটি সম্ভব নয়।
set.seed(12)
require(mgcv)
Data <- data.frame(
dates = seq(as.Date("2011-1-1"),as.Date("2011-12-31"),by="day")
)
Data <- within(Data,{
X <- abs(rnorm(nrow(Data),3))
Y <- 2*X + X^2 + scale(Data$dates)^2
month <- as.POSIXlt(dates)$mon+1
mday <- as.POSIXlt(dates)$mday
})
model <- gamm(Y~s(X)+s(as.numeric(dates)),correlation=corCAR1(form=~mday|month),data=Data)
preds <- predict(model$gam,se=T)
Total <- sum(preds$fit)
সম্পাদনা করুন:
শেখার পাঠ: আতঙ্কিত হওয়ার আগে প্রথমে সমস্ত সহায়তা ফাইলের সমস্ত নমুনাটি দেখুন। পূর্বাভাসের সহায়তা ফাইলগুলিতে, আমি খুঁজে পেতে পারি:
#########################################################
## now get variance of sum of predictions using lpmatrix
#########################################################
Xp <- predict(b,newd,type="lpmatrix")
## Xp %*% coef(b) yields vector of predictions
a <- rep(1,31)
Xs <- t(a) %*% Xp ## Xs %*% coef(b) gives sum of predictions
var.sum <- Xs %*% b$Vp %*% t(Xs)
যা আমি করতে চাই কাছাকাছি মনে হয়। এটি এখনও ঠিক কীভাবে এটি করা হয়েছে তা আমাকে জানায় না। আমি যতদূর জানতে পারি যে এটি লিনিয়ার প্রেডিক্টর ম্যাট্রিক্সের উপর ভিত্তি করে। যে কোনও অন্তর্দৃষ্টি এখনও স্বাগত।