নিম্নলিখিত পিসিএ বিপ্লট বিবেচনা করুন:
library(mvtnorm)
set.seed(1)
x <- rmvnorm(2000, rep(0, 6), diag(c(5, rep(1,5))))
x <- scale(x, center=T, scale=F)
pc <- princomp(x)
biplot(pc)
সেখানে লাল তীরগুলির একগুচ্ছ প্লট করা হয়েছে, তাদের অর্থ কী? আমি জানতাম যে "ভার 1" লেবেলযুক্ত প্রথম তীরটি ডেটা-সেটের সবচেয়ে বিচিত্র দিকটি নির্দেশ করা উচিত (যদি আমরা এগুলিকে 2000 ডেটা পয়েন্ট হিসাবে মনে করি, প্রত্যেকটি আকার 6 এর ভেক্টর)। আমি কোথাও থেকেও পড়েছি, সর্বাধিক পরিবর্তিত দিকটি 1 ম ইগেন ভেক্টরের দিক হওয়া উচিত।
যাইহোক, আর বাইপ্লটের কোডটি পড়া আর. তীরগুলি সম্পর্কে লাইনটি হ'ল:
if(var.axes)
arrows(0, 0, y[,1L] * 0.8, y[,2L] * 0.8, col = col[2L],
y
আসলে লোডিংস ম্যাট্রিক্সটি কোথায় , এটি ইগেনভেક્ટર ম্যাট্রিক্স। সুতরাং দেখে মনে হচ্ছে 1 ম তীরটি আসলে থেকে ইশারা (0, 0)
করছে (y[1, 1], y[1, 2])
। আমি বুঝতে পারি যে আমরা 2 ডি প্লেনে একটি উচ্চ মাত্রিক তীর চক্রান্ত করার চেষ্টা করছি। এজন্য আমরা y[1, ]
ভেক্টরের প্রথম এবং দ্বিতীয় উপাদানটি নিচ্ছি । তবে আমি যা বুঝতে পারি না তা হ'ল:
y[, 1]
পরিবর্তে, 1 ম ইগেনভেક્ટર দিকটি ভেক্টর দ্বারা চিহ্নিত করা উচিত নয় y[1, ]
? (আবার, এখানে y
পিসিএ বা আইজেন্ডেকম্পোজেশন দ্বারা প্রাপ্ত ইগেনভেেক্টর ম্যাট্রিক্স t(x) %*% x
ie
যদিও আমরা তাদের 2D প্লেনে ষড়যন্ত্র হয়, আমরা 1st দিক থেকে হতে আঁকা উচিত (0, 0)
নির্দেশিত (y[1, 1], y[2, 1])
?