প্রধান উপাদান বিশ্লেষণে (পিসিএ), উপাদানগুলি (তাদের নিজ নিজ আইজেনেক্টর থেকে) খুঁজে পেতে কোভারিয়েন্স ম্যাট্রিক্স বা পারস্পরিক সম্পর্ক ম্যাট্রিক্স চয়ন করতে পারেন। এগুলি বিভিন্ন ফলাফল দেয় (পিসি লোডিং এবং স্কোর), কারণ উভয় ম্যাট্রিকের মধ্যে ইগেনভেেক্টর সমান নয়। আমার বোধগম্যতা এটি একটি কাঁচা ডেটা ভেক্টর এক্স এর কারণে ঘটে এবং এর মানককরণের অর্থোগোনাল ট্রান্সফরমেশনের মাধ্যমে সম্পর্কিত হতে পারে না। গাণিতিকভাবে, অনুরূপ ম্যাট্রিক (যেমন অর্থোগোনাল ট্রান্সফরমেশন দ্বারা সম্পর্কিত) এর একই আইজেনভ্যালু রয়েছে, তবে অগত্যা একই আইজেনভেেক্টর নয়।
এটি আমার মনে কিছু অসুবিধা সৃষ্টি করে:
পিসিএ আসলে কী তা বোঝায়, যদি আপনি একই সূচনা হওয়া ডেটার সেটটির জন্য দুটি পৃথক উত্তর পেতে পারেন তবে উভয়ই একই জিনিস অর্জনের চেষ্টা করছেন (= সর্বোচ্চ বৈকল্পের দিকনির্দেশনা খোঁজেন)?
পারস্পরিক সম্পর্ক মেট্রিক্স পদ্ধতির ব্যবহার করার সময়, প্রতিটি পরিবর্তনশীল পিসি গণনা করার আগে, নিজস্ব স্বতন্ত্র মান বিচ্যুতি দ্বারা প্রমিতকরণ (স্কেলড) করা হচ্ছে। এরপরে, যদি ডেটা ইতিমধ্যে আলাদাভাবে আলাদাভাবে সংক্ষিপ্ত / সংক্রামিত করা হয়ে থাকে তবে সর্বাধিক বৈকল্পিকের দিকনির্দেশগুলি খুঁজে পেতে কীভাবে তা বোঝা যায়? আমি জানি যে পারস্পরিক সম্পর্ক ভিত্তিক পিসিএ খুব সুবিধাজনক (মানযুক্ত ভেরিয়েবলগুলি মাত্রাবিহীন, তাই তাদের রৈখিক সংমিশ্রণগুলি যুক্ত করা যেতে পারে; অন্যান্য সুবিধাগুলিও বাস্তবতত্ত্বের ভিত্তিতে) তবে এটি কি সঠিক?
আমার কাছে মনে হয় যে সমবায় ভিত্তিক পিসিএ হ'ল একমাত্র সত্যই সঠিক (এমনকি যখন ভেরিয়েবলগুলির বৈকল্পিকতাগুলি পৃথকভাবে পৃথক হয়), এবং যে যখনই এই সংস্করণটি ব্যবহার করা যায় না, তখন পারস্পরিক সম্পর্ক ভিত্তিক পিসিএ ব্যবহার করা উচিত নয়।
আমি জানি যে এই থ্রেড আছে: পারস্পরিক সম্পর্ক বা covariance উপর পিসিএ? - তবে এটি কেবল একটি বাস্তববাদী সমাধান সন্ধানের দিকে মনোনিবেশ করে বলে মনে হচ্ছে, যা বীজগণিতভাবে সঠিকও হতে পারে বা নাও হতে পারে।