একটি টাইমসারিগুলিতে একটি মিশ্র প্রভাব মডেল থেকে পূর্বাভাসিত মানগুলির যোগফলের বৈচিত্র


32

আমার একটি মিশ্র ইফেক্ট মডেল রয়েছে (আসলে একটি জেনারেলাইজড অ্যাডিটিভ মিক্সড মডেল) যা আমাকে টাইমসারিগুলির জন্য পূর্বাভাস দেয়। স্বতঃসংশোধনের বিরুদ্ধে লড়াই করার জন্য, আমি আমার কাছে ডেটা অনুপস্থিত রয়েছে তার প্রেক্ষিতে আমি একটি কর্কার 1 মডেল ব্যবহার করি। ডেটা আমাকে মোট বোঝা দেবে বলে মনে করা হচ্ছে, তাই আমার পুরো পূর্বাভাস ব্যবধানের যোগফল প্রয়োজন। তবে আমার মোট লোডের স্ট্যান্ডার্ড ত্রুটির একটি অনুমানও পাওয়া উচিত।

যদি সমস্ত পূর্বাভাস স্বাধীন হয় তবে এটি সহজেই সমাধান করতে পারে:

Var(i=1nE[Xi])=i=1nVar(E[Xi]) সহVar(E[Xi])=SE(E[Xi])2

সমস্যাটি হ'ল, পূর্বাভাসকৃত মানগুলি একটি মডেল থেকে আসে এবং মূল ডেটাতে স্বতঃসংশ্লিষ্ট হয়। পুরো সমস্যাটি নিম্নলিখিত প্রশ্নগুলির দিকে পরিচালিত করে:

  1. আমি কি ধরে নিচ্ছি যে গণনা করা পূর্বাভাসের এসই সেই ভবিষ্যদ্বাণীটির প্রত্যাশিত মানের পরিবর্তনের মূল হিসাবে ব্যাখ্যা করা যেতে পারে? আমি ভবিষ্যদ্বাণীগুলিকে "গড় ভবিষ্যদ্বাণী" হিসাবে ব্যাখ্যা করার প্রবণতা পোষণ করি, এবং সেজন্য একটি সম্পূর্ণ সেট যোগ করতে পারি।
  2. এই সমস্যাটিতে আমি স্বতঃসংশোধনকে কীভাবে অন্তর্ভুক্ত করব, বা আমি নিরাপদে ধরে নিতে পারি যে এটি ফলাফলগুলিকে খুব বেশি প্রভাবিত করবে না?

এটি আর এর একটি উদাহরণ। আমার আসল ডেটাসেটটিতে প্রায় 34.000 পরিমাপ রয়েছে, সুতরাং স্কেলিবিলিটি সমস্যা। এই কারণেই আমি প্রতি মাসের মধ্যে স্বতঃসংশোধনকে মডেল করি, অন্যথায় গণনা আর সম্ভব হয় না। এটি সর্বাধিক সঠিক সমাধান নয়, তবে সবচেয়ে সঠিক সমাধানটি সম্ভব নয়।

set.seed(12)
require(mgcv)

Data <- data.frame(
    dates = seq(as.Date("2011-1-1"),as.Date("2011-12-31"),by="day")
)

Data <- within(Data,{
X <- abs(rnorm(nrow(Data),3))
Y <- 2*X + X^2 + scale(Data$dates)^2
month <- as.POSIXlt(dates)$mon+1
mday <- as.POSIXlt(dates)$mday
})

model <- gamm(Y~s(X)+s(as.numeric(dates)),correlation=corCAR1(form=~mday|month),data=Data)

preds <- predict(model$gam,se=T)

Total <- sum(preds$fit)

সম্পাদনা করুন:

শেখার পাঠ: আতঙ্কিত হওয়ার আগে প্রথমে সমস্ত সহায়তা ফাইলের সমস্ত নমুনাটি দেখুন। পূর্বাভাসের সহায়তা ফাইলগুলিতে, আমি খুঁজে পেতে পারি:

#########################################################
## now get variance of sum of predictions using lpmatrix
#########################################################

Xp <- predict(b,newd,type="lpmatrix") 

## Xp %*% coef(b) yields vector of predictions

a <- rep(1,31)
Xs <- t(a) %*% Xp ## Xs %*% coef(b) gives sum of predictions
var.sum <- Xs %*% b$Vp %*% t(Xs)

যা আমি করতে চাই কাছাকাছি মনে হয়। এটি এখনও ঠিক কীভাবে এটি করা হয়েছে তা আমাকে জানায় না। আমি যতদূর জানতে পারি যে এটি লিনিয়ার প্রেডিক্টর ম্যাট্রিক্সের উপর ভিত্তি করে। যে কোনও অন্তর্দৃষ্টি এখনও স্বাগত।


6
তোমার দর্শন লগ করা হবে না নিশ্চিত দ প্রোগ্রাম করছে কিন্তু আমরা আছে কোথায় বেশী এবং একটি কলাম ভেক্টর হয় সহভেদাংক হয় জন্য ম্যাট্রিক্স । এটা কি সাহায্য করে?
var(iE[Xi])=aTvar(E[X])a
avar(E[X])E[X]=(E[X1],,E[Xn])T
সম্ভাব্যতাব্লোগিক

@ প্রোব্যাবিলিটিস্লোগিক এটি মূলত আর প্রোগ্রামটি করছে। গণিতের জন্য
থেক্স

2
@ প্রব্যাবিলিসিসলিক আপনি যদি কোনও উত্তরে এটি গুটিয়ে রাখতে পারেন তবে আপনি আমার +50 অনুগ্রহ দখল করতে পারেন। ;)

একটি সমস্যা আমি দেখতে পাচ্ছি এবং সম্ভবত আমি কেবল আপনার স্বরলিপিটির ভুল ব্যাখ্যা দিচ্ছি তবে যা একটি ধ্রুবক তাই সেখানেই আমি বেশিরভাগ ক্ষেত্রে বিভ্রান্ত n i = 1 V a r ( E [ X i ] ) = 0E(Xi)=μii=1nVar(E[Xi])=0
হয়েছি

@ user52220 এইখানেই আপনি ভুল করেছেন। E (Xi) হ'ল প্রত্যাশিত মান এবং অতএব এলোমেলো পরিবর্তনশীল, তবে mu_i জনসংখ্যার গড় এবং তাই একটি নির্দিষ্ট সংখ্যা। ভার (মিউ) = 0, তবে ই (একাদশ) এর জন্য এটি সঠিক নয়।
জোরিস মাইস

উত্তর:


1

ম্যাট্রিক্স স্বরলিপিটিতে একটি মিশ্র মডেল হিসাবে উপস্থাপিত হতে পারে

y = এক্স * বিটা + জেড * ইউ + অ্যাপসিলন

যেখানে এক্স এবং জেড যথাক্রমে স্থির প্রভাব এবং এলোমেলো প্রভাব পর্যবেক্ষণ সম্পর্কিত ডিজাইন ম্যাট্রিক হিসাবে পরিচিত।

আমি প্রথম পর্যবেক্ষণের ক্ষতি হ'ল এবং [y1, y2, ... yn] এর কলাম ভেক্টরকে একের পর এক ছোট করে প্রতিস্থাপনের সাথে জড়িত অটো-সম্পর্কিত সম্পর্কিত সংশোধন করার জন্য একটি সহজ এবং পর্যাপ্ত (তবে সেরা নয়) রূপান্তরটি প্রয়োগ করব পর্যবেক্ষণ কলাম ভেক্টর, যথা: [y2 - rho * y1, y3 - rho * y2, ..., yn - rho * y (n-1)], যেখানে আরএইচও সিরিয়াল স্বয়ংক্রিয়-সম্পর্কের জন্য আপনার আনুমানিক মান।

এটি ম্যাট্রিক্স টি দিয়ে টি * ওয়াই করে গুন করে সম্পাদন করা যেতে পারে, যেখানে টি এর 1 ম সারিটি নিম্নরূপ রচিত: [-হো, 1, 0, 0, ....], ২ য় সারি: [0, -রহো, 1, 0, 0, ...], ইত্যাদি। একইভাবে, অন্যান্য ডিজাইনের ম্যাট্রিকগুলি টি * এক্স এবং টি * জেডে পরিবর্তন করা হয়। এছাড়াও, ত্রুটির শর্তগুলির ভেরিয়েন্স-কোভেরিয়েন্স ম্যাট্রিক্সও এখন পৃথক ত্রুটি পদগুলির সাথে পরিবর্তিত হয়।

এখন, নতুন ডিজাইনের ম্যাট্রিক্সের সাহায্যে সমাধানটি গণনা করুন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.