একটি প্রিন্সিপাল কম্পোনেন্ট অ্যানালাইসিস (পিসিএ) বা এমিরিকাল অর্থোগোনাল ফাংশন (ইওএফ) বিশ্লেষণ থেকে বেরিয়ে আসা উল্লেখযোগ্য নিদর্শনগুলির সংখ্যা নির্ধারণে আমি আগ্রহী। আমি জলবায়ু ডেটাতে এই পদ্ধতিটি প্রয়োগ করতে বিশেষভাবে আগ্রহী। ডেটা ক্ষেত্রটি একটি এমএক্সএন ম্যাট্রিক্স যা এম টাইম ডাইমেনশন (যেমন দিন) এবং এন স্থানিক মাত্রা (যেমন দীর্ঘ / ল্যাট অবস্থান) lat আমি উল্লেখযোগ্য পিসি নির্ধারণের জন্য একটি সম্ভাব্য বুটস্ট্র্যাপ পদ্ধতিটি পড়েছি, তবে আরও বিশদ বিবরণ খুঁজে পেতে সক্ষম হয়েছি। এখন অবধি, আমি এই কাটঅফটি নির্ধারণের জন্য উত্তরের রুল অফ থাম্ব (নর্থ এট আল ।, 1982) প্রয়োগ করে আসছি তবে আমি আরও ভাবছিলাম যে আরও শক্তিশালী পদ্ধতিটি পাওয়া যায় কিনা।
উদাহরণ হিসাবে:
###Generate data
x <- -10:10
y <- -10:10
grd <- expand.grid(x=x, y=y)
#3 spatial patterns
sp1 <- grd$x^3+grd$y^2
tmp1 <- matrix(sp1, length(x), length(y))
image(x,y,tmp1)
sp2 <- grd$x^2+grd$y^2
tmp2 <- matrix(sp2, length(x), length(y))
image(x,y,tmp2)
sp3 <- 10*grd$y
tmp3 <- matrix(sp3, length(x), length(y))
image(x,y,tmp3)
#3 respective temporal patterns
T <- 1:1000
tp1 <- scale(sin(seq(0,5*pi,,length(T))))
plot(tp1, t="l")
tp2 <- scale(sin(seq(0,3*pi,,length(T))) + cos(seq(1,6*pi,,length(T))))
plot(tp2, t="l")
tp3 <- scale(sin(seq(0,pi,,length(T))) - 0.2*cos(seq(1,10*pi,,length(T))))
plot(tp3, t="l")
#make data field - time series for each spatial grid (spatial pattern multiplied by temporal pattern plus error)
set.seed(1)
F <- as.matrix(tp1) %*% t(as.matrix(sp1)) +
as.matrix(tp2) %*% t(as.matrix(sp2)) +
as.matrix(tp3) %*% t(as.matrix(sp3)) +
matrix(rnorm(length(T)*dim(grd)[1], mean=0, sd=200), nrow=length(T), ncol=dim(grd)[1]) # error term
dim(F)
image(F)
###Empirical Orthogonal Function (EOF) Analysis
#scale field
Fsc <- scale(F, center=TRUE, scale=FALSE)
#make covariance matrix
C <- cov(Fsc)
image(C)
#Eigen decomposition
E <- eigen(C)
#EOFs (U) and associated Lambda (L)
U <- E$vectors
L <- E$values
#projection of data onto EOFs (U) to derive principle components (A)
A <- Fsc %*% U
dim(U)
dim(A)
#plot of top 10 Lambda
plot(L[1:10], log="y")
#plot of explained variance (explvar, %) by each EOF
explvar <- L/sum(L) * 100
plot(explvar[1:20], log="y")
#plot original patterns versus those identified by EOF
layout(matrix(1:12, nrow=4, ncol=3, byrow=TRUE), widths=c(1,1,1), heights=c(1,0.5,1,0.5))
layout.show(12)
par(mar=c(4,4,3,1))
image(tmp1, main="pattern 1")
image(tmp2, main="pattern 2")
image(tmp3, main="pattern 3")
par(mar=c(4,4,0,1))
plot(T, tp1, t="l", xlab="", ylab="")
plot(T, tp2, t="l", xlab="", ylab="")
plot(T, tp3, t="l", xlab="", ylab="")
par(mar=c(4,4,3,1))
image(matrix(U[,1], length(x), length(y)), main="eof 1")
image(matrix(U[,2], length(x), length(y)), main="eof 2")
image(matrix(U[,3], length(x), length(y)), main="eof 3")
par(mar=c(4,4,0,1))
plot(T, A[,1], t="l", xlab="", ylab="")
plot(T, A[,2], t="l", xlab="", ylab="")
plot(T, A[,3], t="l", xlab="", ylab="")
এবং, পিসির তাত্পর্য নির্ধারণ করতে আমি যে পদ্ধতিটি ব্যবহার করছি তা এখানে। মূলত, থাম্বের নিয়মটি হ'ল প্রতিবেশী লাম্বডাসের মধ্যে পার্থক্য অবশ্যই তাদের সম্পর্কিত ত্রুটির চেয়ে বেশি হওয়া উচিত।
###Determine significant EOFs
#North's Rule of Thumb
Lambda_err <- sqrt(2/dim(F)[2])*L
upper.lim <- L+Lambda_err
lower.lim <- L-Lambda_err
NORTHok=0*L
for(i in seq(L)){
Lambdas <- L
Lambdas[i] <- NaN
nearest <- which.min(abs(L[i]-Lambdas))
if(nearest > i){
if(lower.lim[i] > upper.lim[nearest]) NORTHok[i] <- 1
}
if(nearest < i){
if(upper.lim[i] < lower.lim[nearest]) NORTHok[i] <- 1
}
}
n_sig <- min(which(NORTHok==0))-1
plot(L[1:10],log="y", ylab="Lambda (dots) and error (vertical lines)", xlab="EOF")
segments(x0=seq(L), y0=L-Lambda_err, x1=seq(L), y1=L+Lambda_err)
abline(v=n_sig+0.5, col=2, lty=2)
text(x=n_sig, y=mean(L[1:10]), labels="North's Rule of Thumb", srt=90, col=2)
আমি জার্নসন এবং ভেনগাসের অধ্যায় বিভাগটি খুঁজে পেয়েছি ( 1997 ) তাত্পর্যপূর্ণ তাত্পর্যপূর্ণ বিষয়ে পরীক্ষাগুলি সহায়ক হওয়ার জন্য - তারা তিনটি বিভাগের পরীক্ষার উল্লেখ করে, যার মধ্যে প্রভাবশালী ভেরিয়েন্স- টাইপ সম্ভবত আমি ব্যবহার করার আশা করছি am সময়ের মাত্রা বদলানো এবং লম্বডাসকে বহু অনুক্রমের মাধ্যমে পুনর্নির্মাণের এক প্রকার মন্টি কার্লো পদ্ধতির উল্লেখ করুন। ভন স্টর্চ এবং জুইয়ার্স (১৯৯৯) ল্যাম্বডা বর্ণালীকে তুলনামূলকভাবে "গোলমাল" বর্ণালীতে তুলনা করে এমন একটি পরীক্ষারও উল্লেখ করে। উভয় ক্ষেত্রেই, এটি কীভাবে হবে তা সম্পর্কে আমি কিছুটা অনিশ্চিত এবং তাও যে অনুমতিটির দ্বারা চিহ্নিত আত্মবিশ্বাসের অন্তরগুলি দিয়ে তা কীভাবে তাত্পর্য পরীক্ষা করা হয়।
আপনার সাহায্যের জন্য ধন্যবাদ.
তথ্যসূত্র: বিজার্নসন, এইচ। এবং ভেনগাস, এসএ (1997)। "ইওএফ এবং এসভিডি জলবায়ু সম্পর্কিত তথ্যের বিশ্লেষণের জন্য একটি ম্যানুয়াল", ম্যাকগিল বিশ্ববিদ্যালয়, সিসিজিসিআর রিপোর্ট নং 97-1, মন্ট্রিয়াল, কোয়েবেক, 52 পিপি। http://andvari.vedur.is/%7Efolk/halldor/PICKUP/eof.pdf
জিআর উত্তর, টিএল বেল, আরএফ কাহালান, এবং এফজে মোয়েং। (1982)। পরীক্ষামূলক অরথোগোনাল ফাংশনগুলির অনুমানের ক্ষেত্রে নমুনা ত্রুটি। সোম WEA। রেভ।, 110: 699–706।
ভন স্টর্চ, এইচ, জুইয়ার্স, এফডাব্লু (1999) জলবায়ু গবেষণায় পরিসংখ্যান বিশ্লেষণ। ক্যামব্রিজ ইউনিভার্সিটি প্রেস.