সতর্কতা: R
বিভ্রান্তিকর উপায়ে "লোডিং" শব্দটি ব্যবহার করে। আমি এটি নীচে ব্যাখ্যা।
কলামগুলিতে (কেন্দ্রিক) ভেরিয়েবল এবং সারিগুলিতে ডাটা পয়েন্ট সহ ডেটাসেট Consider বিবেচনা করুন । এই ডেটাসেটের পিসিএ সম্পাদন করা একক মান । কলামগুলি মূল উপাদান (পিসি "স্কোর") এবং of এর কলামগুলি মূল অক্ষ হয়। কোভারিয়েন্স ম্যাট্রিক্স given , সুতরাং প্রধান অক্ষগুলি the কোভারিয়েন্স ম্যাট্রিক্সের ইগেনভেেক্টর।এক্সএনএক্স = ইউ এস ভি⊤ইউ এসভী1এন- 1এক্স⊤এক্স = ভি এস2এন- 1ভী⊤ভী
"লোডিংস" কে rac কলাম হিসাবে সংজ্ঞায়িত করা হয়েছে , অর্থাত এগুলি সম্পর্কিত eigenvalues এর বর্গমূল দ্বারা স্কেল করা eigenvectors। এরা আইজেনভেেক্টর থেকে আলাদা! অনুপ্রেরণার জন্য আমার উত্তর এখানে দেখুন ।এল = ভি এসএন- 1√
এই আনুষ্ঠানিকতা ব্যবহার করে, আমরা আসল ভেরিয়েবল এবং মানকৃত পিসিগুলির মধ্যে ক্রস-কোভেরিয়েন্স ম্যাট্রিক্স গণনা করতে পারি: অর্থাৎ এটি লোডিং দ্বারা দেওয়া হয়। মূল ভেরিয়েবল এবং পিসিগুলির মধ্যে ক্রস-সম্পর্ক সম্পর্কিত ম্যাট্রিক্সটি মূল ভেরিয়েবলগুলির মান বিচ্যুতির (পারস্পরিক সম্পর্কের সংজ্ঞা দ্বারা) দ্বারা বিভক্ত একই অভিব্যক্তি দ্বারা দেওয়া হয়। মূল ভেরিয়েবলগুলি পিসিএ সম্পাদনের পূর্বে যদি মানক করা হয় (যেমন পিসিএ পারস্পরিক সম্পর্ক ম্যাট্রিক্সে সঞ্চালিত হয়েছিল) তবে এগুলি সমস্ত সমান । এই শেষ যদি ক্রস কোরিলেশন ম্যাট্রিক্স আবার কেবল দেওয়া হয় ।
1এন- 1এক্স⊤( এন- 1-----√ইউ )= 1এন- 1-----√ভি এস ইউ⊤ইউ = 1এন- 1-----√ভি এস = এল ,
1এল
পরিভাষাজনিত বিভ্রান্তি দূর করতে: আর প্যাকেজটি "লোডিংস" কে মূল অক্ষ হিসাবে চিহ্নিত করে এবং এটি "পারস্পরিক সম্পর্ক লোডিংস" বলে যা সত্য বিষয়গুলির লোডিংগুলিতে (পারস্পরিক সম্পর্ক ম্যাট্রিক্সে করা পিসিএর জন্য)। আপনি যেমন লক্ষ্য করেছেন, সেগুলি কেবল স্কেলিংয়ের ক্ষেত্রেই পৃথক। কি চক্রান্ত করা ভাল, আপনি কি দেখতে চান তার উপর নির্ভর করে। নিম্নলিখিত সাধারণ উদাহরণ বিবেচনা করুন:
বাম সাবপ্ল্লট একটি মূলক 2D ডেটাসেট দেখায় (প্রতিটি ভেরিয়েবলের ইউনিট ভেরিয়েন্স থাকে), মূল তির্যকটি প্রসারিত। মিডল সাবপ্লট একটি বাইপ্লট : এটি পিসি বনাম পিসি 2 এর একটি বিক্ষিপ্ত প্লট (এই ক্ষেত্রে কেবল ডেটাসেটটি 45 ডিগ্রি দ্বারা আবর্তিত) ভেক্টর হিসাবে শীর্ষে প্লট করা হয়েছে of এর সারি দ্বারা । নোট করুন যে এবং ভেক্টরগুলি 90 ডিগ্রি পৃথক; তারা আপনাকে জানায় যে কীভাবে মূল অক্ষগুলি ওরিয়েন্টেড। রাইট উপকাহিনী একই biplot, কিন্তু এখন ভেক্টর সারি দেন । নোট করুন যে এখন এবং ভেক্টরগুলির মধ্যে একটি তীব্র কোণ রয়েছে; তারা আপনাকে জানিয়ে দেয় যে কতগুলি মূল ভেরিয়েবলগুলি পিসি, এবং উভয় এবং সাথে সম্পর্কিত latedভীএক্সYএলএক্সYএক্সYপিসি 2 এর তুলনায় পিসি 1 এর সাথে অনেক বেশি শক্তিশালী সম্পর্কযুক্ত। আমি অনুমান করি যে বেশিরভাগ লোকেরা প্রায়শই সঠিক ধরণের বাইপ্লট দেখতে পছন্দ করেন।
লক্ষ্য করুন যে উভয় ক্ষেত্রেই এবং ভেক্টরের উভয় ইউনিটের দৈর্ঘ্য রয়েছে। এটি কেবলমাত্র ঘটেছিল কারণ ডেটাসেটটি শুরু করতে 2D ছিল; যদি আরও ভেরিয়েবল থাকে তবে পৃথক ভেক্টরগুলির দৈর্ঘ্য কম হতে পারে তবে তারা কখনও ইউনিট বৃত্তের বাইরে পৌঁছতে পারে না। এই সত্যের প্রমাণ আমি একটি অনুশীলন হিসাবে ছেড়ে চলেছি।এক্সY1
আসুন এখন আমরা এমটিকার্স ডেটাসেটের উপর অন্য নজর রাখি । পারস্পরিক সম্পর্ক মেট্রিক্সে করা পিসিএর একটি বাইপ্লট এখানে রয়েছে:
কালো রেখা ব্যবহার অঙ্কিত হয় , লাল লাইন ব্যবহার অঙ্কিত হয় ।ভীএল
এবং এখানে সমবায় ম্যাট্রিক্সে করা পিসিএর একটি বাইপ্লট রয়েছে:
এখানে আমি সমস্ত ভেক্টর এবং ইউনিট বৃত্তটিকে দ্বারা , কারণ অন্যথায় এটি দৃশ্যমান হবে না (এটি একটি ব্যবহৃত ব্যবহৃত কৌশল)। আবার, কালো রেখাগুলি of এর সারি দেখায় এবং লাল রেখাগুলি ভেরিয়েবল এবং পিসিগুলির মধ্যে পারস্পরিক সম্পর্ক দেখায় (যা by দ্বারা আর দেওয়া হয় না, উপরে দেখুন)। লক্ষ্য করুন যে কেবল দুটি কালো রেখা দৃশ্যমান; এটি কারণ দুটি ভেরিয়েবলের খুব উচ্চতম বৈকল্পিক থাকে এবং এমটকার্স ডেটাসেটে আধিপত্য থাকে । অন্যদিকে, সমস্ত লাল রেখা দেখা যায়। উভয় উপস্থাপনা কিছু দরকারী তথ্য বহন করে।100ভীএল
PS পিসিএ বাইপলটগুলির বিভিন্ন রূপ রয়েছে, আরও কিছু ব্যাখ্যা এবং একটি ওভারভিউয়ের জন্য আমার উত্তরটি এখানে দেখুন: পিসিএ বাইপ্লটের উপর তীর স্থাপন করা । ক্রসভিলেটেডে পোস্ট করা সবচেয়ে সুন্দর বাইপলট এখানে পাওয়া যাবে ।