পিসিএ বাইপ্লটের তীরগুলির অর্থ কী?


14

নিম্নলিখিত পিসিএ বিপ্লট বিবেচনা করুন:

library(mvtnorm)
set.seed(1)
x  <- rmvnorm(2000, rep(0, 6), diag(c(5, rep(1,5))))
x  <- scale(x, center=T, scale=F)
pc <- princomp(x)
biplot(pc)

এখানে চিত্র বর্ণনা লিখুন

সেখানে লাল তীরগুলির একগুচ্ছ প্লট করা হয়েছে, তাদের অর্থ কী? আমি জানতাম যে "ভার 1" লেবেলযুক্ত প্রথম তীরটি ডেটা-সেটের সবচেয়ে বিচিত্র দিকটি নির্দেশ করা উচিত (যদি আমরা এগুলিকে 2000 ডেটা পয়েন্ট হিসাবে মনে করি, প্রত্যেকটি আকার 6 এর ভেক্টর)। আমি কোথাও থেকেও পড়েছি, সর্বাধিক পরিবর্তিত দিকটি 1 ম ইগেন ভেক্টরের দিক হওয়া উচিত।

যাইহোক, আর বাইপ্লটের কোডটি পড়া আর. তীরগুলি সম্পর্কে লাইনটি হ'ল:

if(var.axes)
    arrows(0, 0, y[,1L] * 0.8, y[,2L] * 0.8, col = col[2L], 

yআসলে লোডিংস ম্যাট্রিক্সটি কোথায় , এটি ইগেনভেક્ટર ম্যাট্রিক্স। সুতরাং দেখে মনে হচ্ছে 1 ম তীরটি আসলে থেকে ইশারা (0, 0)করছে (y[1, 1], y[1, 2])। আমি বুঝতে পারি যে আমরা 2 ডি প্লেনে একটি উচ্চ মাত্রিক তীর চক্রান্ত করার চেষ্টা করছি। এজন্য আমরা y[1, ]ভেক্টরের প্রথম এবং দ্বিতীয় উপাদানটি নিচ্ছি । তবে আমি যা বুঝতে পারি না তা হ'ল:

y[, 1]পরিবর্তে, 1 ম ইগেনভেક્ટર দিকটি ভেক্টর দ্বারা চিহ্নিত করা উচিত নয় y[1, ]? (আবার, এখানে yপিসিএ বা আইজেন্ডেকম্পোজেশন দ্বারা প্রাপ্ত ইগেনভেেক্টর ম্যাট্রিক্স t(x) %*% xie

যদিও আমরা তাদের 2D প্লেনে ষড়যন্ত্র হয়, আমরা 1st দিক থেকে হতে আঁকা উচিত (0, 0)নির্দেশিত (y[1, 1], y[2, 1])?


2
এছাড়াও সাইটে প্রশ্নগুলির জন্য উপলভ্য বিন্যাসটি ব্যবহার করার চেষ্টা বিবেচনা করুন, উন্নত মার্কডাউন সহায়তা দেখুন । আমি দেখতে পাচ্ছি যে আপনার আগের কোনও প্রশ্নের উত্তর নেই এবং আপনি যদি এগুলিকে কিছুটা বেশি পঠনযোগ্য হিসাবে সম্পাদনা করেন তবে তারা তালিকার শীর্ষে নেমে যাবে এবং উত্তরগুলি আকর্ষণ করতে পারে।
অ্যান্ডি ডব্লিউ

@Andy ডব্লিউ চমৎকার রেফারেন্স
conjugateprior

@ অ্যান্ডি ডাব্লু: আপনার দুর্দান্ত রেফারেন্সগুলি পড়ার পরেও আমি এখনও মনে করি আর কোড বিপ্লল্ট.প্রিনম্পম্পে একটি বাগ রয়েছে: লোডিং ম্যাট্রিক্স (আইজেনভেেক্টর ম্যাট্রিক্স) বাইপ্লট.প্রিনম্পম্পে প্রেরণ করার আগে স্থানান্তরিত করা উচিত ... কোন চিন্তা?
লুনা


@ অ্যান্ডি ডাব্লু: আপনি কি আপনার মন্তব্যগুলিকে একটি "উত্তরের" মধ্যে রাখতে চান যাতে আমি আপনার উত্তরটি গ্রহণ করতে পারি? এটা দুর্দান্ত! অনেক ধন্যবাদ!
লুনা

উত্তর:


9

ঠিক আছে, কেভিন রাইটকে বিভ্রান্তিটি ব্যাখ্যা করার জন্য সবচেয়ে বেশি কৃতিত্ব দেওয়া উচিত ( আর-হেল্প মেল তালিকা থেকে );

তীরগুলি ডেটার সর্বাধিক-পরিবর্তিত দিক নির্দেশ করছে না। প্রধান উপাদানগুলি ডেটার সর্বাধিক-পরিবর্তিত দিক নির্দেশ করছে। তবে আপনি মূল স্কেলে ডেটা প্লট করছেন না, আপনি ঘোরানো স্কেলে ডেটা প্লট করছেন, এবং এইভাবে অনুভূমিক অক্ষটি হ'ল ডেটার সর্বাধিক পরিবর্তিত দিক।

বাইপ্লটের 2-ডি বিমানের মধ্যে যেমন অনুমান করা হয়েছে তীরগুলি ভেরিয়েবলগুলির দিকে নির্দেশ করছে।

কোনও বাগ নেই।

কেভিন রাইট

মাইকেল গ্রিনাক্রে বাইপলটস, অনুশীলনে বিপ্লটস সম্পর্কে খুব দুর্দান্ত একটি বিনামূল্যে অনলাইন বই রয়েছে এবং প্রথম অধ্যায়টি পড়ার ক্ষেত্রে তীরের স্থানাঙ্কগুলি কোথা থেকে নেওয়া হয়েছে তা অনুপ্রেরণা জাগাতে সহায়তা করবে। এছাড়া যে অনুরূপ সাইটে বেশ কিছু প্রশ্ন আছে এবং আপনার প্রতি আগ্রহী হতে পারেন দেখতে আর প্রধান উপাদান বিশ্লেষণ biplots ব্যাখ্যা এবং MDS ফ্যাক্টর চক্রান্ত ব্যাখ্যা দুটি উদাহরণ জন্য। এছাড়াও সাইটটিতে অনুসন্ধানে বিপ্লট সহ প্রশ্নগুলি দেখুন , কারণ আরও কয়েকটি সম্ভাব্য আগ্রহ রয়েছে (এটি সম্ভবত উপস্থিত রয়েছে এমন প্রশ্নগুলির সংখ্যা দেখিয়ে বাইপ্লট ট্যাগ তৈরি করাও এই সময়ে কার্যকর হবে)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.