ডাইমেনটিভিটি পর্যবেক্ষণের সংখ্যার চেয়ে বেশি হলে পিসিএ এখনও কোভারিয়েন্স ম্যাট্রিক্সের ইজেনডিকম্পোজিশনের মাধ্যমে সম্পন্ন হয়?


10

আমার কাছে একটি ম্যাট্রিক্স এক্স রয়েছে , যেখানে ডি = 100- মাত্রিক জায়গাতে আমার এন = 20 নমুনা রয়েছে । আমি এখন মতলবতে আমার নিজস্ব প্রধান উপাদান বিশ্লেষণ (পিসিএ) কোড করতে চাই। আমি এক্স থেকে এক্স 0 টি প্রথম বিবেচনা করি।20×100XN=20D=100XX0

আমি কারও কোড থেকে পড়েছি যে এমন পরিস্থিতিতে যেখানে আমাদের পর্যবেক্ষণের চেয়ে বেশি মাত্রা রয়েছে, আমরা আর এর কোভেরিয়েন্স ম্যাট্রিক্সকে ইগেন-পচন করতে পারি না । পরিবর্তে, আমরা 1 ইগন-পচনX0 । কেন এটা সঠিক?1N1X0X0T

স্বাভাবিক সহভেদাংক ম্যাট্রিক্স আকার হল , প্রতিটি উপাদান যার দুটি মাত্রা মধ্যে সহভেদাংক বলে। আমার কাছে, D×D এমনকি সঠিক মাত্রারও নয়! এটিএন×এনম্যাট্রিক্স, সুতরাং এটি আমাদের কী বলবে? দুটি পর্যবেক্ষণের মধ্যে সম্মতি ?!1N1X0X0TN×N


আপনার প্রশ্নের উত্তরটি এমন পরিস্থিতিতে রয়েছে - যেমনটি আপনার কাজটি প্রকাশ করার পরে যেমনটি ঘটে - আপনার নিজের জন্য কলামগুলির সমবায় ম্যাট্রিক্সের দরকার নেই। আপনি কেবল এটি পিসি পাওয়ার পথ হিসাবে চেয়েছিলেন। রাইট? তবে একই পিসিএ ফলাফল ইগেন X'Xএবং XX'(পাশাপাশি এসভিডি Xএবং X') এর মাধ্যমে পাওয়া যেতে পারে । এক ক্ষেত্রে যাকে "লোডিংস" বলা হয় তাকে অন্য ক্ষেত্রে "পিসি স্কোর" এবং তার বিপরীতে বলা হবে। যেহেতু উভয়ই কেবল সমন্বয়কারী ( উদাহরণস্বরূপ দেখুন ) এবং অক্ষগুলি, "মূল মাত্রা" একই রকম।
ttnphns

1
(অবিরত) যদি তাই হয় এবং আপনি কোনটি পচন করতে চান তা নির্দ্বিধায় - কোনটি দ্রুত / আরও দক্ষতার সাথে করা যায় তা পচিয়ে রাখা বুদ্ধিমানের কাজ। যখন n<pএটি XX'ছোট আকারের হওয়ায় এটি কম র‌্যাম এবং পচতে কম সময় নেয় ।
ttnphns

@ttnphns দুর্দান্ত ব্যাখ্যা। আমি এখন পয়েন্ট দেখুন। তবে, XX'পিসিতে ইগেন থেকে যেতে আমার এখনও সমস্যা আছে have আপনি কি দয়া করে খুব সংক্ষেপে আমাকে দেখাতে পারেন? প্রদত্ত যে পিসিতে সহভেদাংক ম্যাট্রিক্স মাত্র eigenvectors, আমি এর eigen থেকে সরাতে চেষ্টা XX'সহভেদাংক ম্যাট্রিক্স eigen করার X'X, কিন্তু ব্যর্থ হয়।
সিবস জুবিলিং

1
আমার যেতে হবে. সম্ভবত @amoeba (যিনি আমার চেয়ে বীজগণিতের তুলনায় অনেক বেশি চতুর) বা অন্য পাঠক শীঘ্রই এখানে দেখবেন এবং আপনাকে সহায়তা করবেন। চিয়ার্স।
ttnphns

1
@ttnphns: সম্পন্ন :)
অ্যামিবা

উত্তর:


22

D×D

C=1N1X0X0.

N×N

G=1N1X0X0.

প্রিন্সিপাল উপাদান বিশ্লেষণ (পিসিএ) এই ম্যাট্রিকগুলির যে কোনওটির ইজেনডিকম্পোজিশনের মাধ্যমে প্রয়োগ করা যেতে পারে। এটি একই জিনিস গণনা করার জন্য দুটি ভিন্ন উপায়।

X=USVCG

C=VS2N1VG=US2N1U.

VUSUCG

N<DDDN<D



1
দুর্দান্ত উত্তর! আমি জানতাম না এর নাম আছে! অনেক ধন্যবাদ! আমি এখন আমার গণনার গতি বাড়ানোর জন্য এটি ব্যবহার করতে আত্মবিশ্বাসী।
সিবস জুবিলিং

3
US/(n1)VUXU

এই উত্তরটি স্পষ্ট যে আমি বইগুলিতে অনেকগুলি প্রদর্শনী দেখেছি। ধন্যবাদ।
usεr11852

বিশুদ্ধরূপে রেফারেন্সের উদ্দেশ্যে: আমি মনে করি আইজে গুডের 1969 টেকনোমেট্রিক্সের কাগজ " একটি ম্যাট্রিক্সের সিঙ্গুলার পচনের কিছু অ্যাপ্লিকেশন " এটি সম্পূর্ণরূপে প্রথম উল্লেখের মধ্যে প্রথম।
usεr11852

1
নিখুঁতভাবে দেখুন
অ্যামিবা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.