এই প্রশ্নটি মূল উপাদানগুলি গণনা করার একটি কার্যকর উপায় সম্পর্কে।
লিনিয়ার পিসিএর অনেকগুলি পাঠ্য কেসওয়াইজ ডেটার একক-মান পচন ব্যবহার করে অ্যাডভোকেট । এটি হ'ল, যদি আমাদের কাছে ডেটা এবং মূল উপাদানগুলি দ্বারা ভেরিয়েবলগুলি (এর কলামগুলি ) প্রতিস্থাপন করতে চান তবে আমরা এসভিডি করি: , একক মান (ইগেনভ্যালুগুলির বর্গমূল) এর মূল তির্যকটি দখল করে , ডান ইগেনভেেক্টরস \ বিএফ ভি হ'ল অক্ষ-উপাদানগুলির অরথোগোনাল রোটেশন ম্যাট্রিক্সকে অক্ষ-উপাদানগুলিতে বাম ইজিনভেেক্টর \ বিএফ ইউ only বিএফ ভি এর মতো , কেবলমাত্র ক্ষেত্রে। এরপরে আমরা উপাদান হিসাবে মানগুলি \ bf সি = এক্সভি = মার্কিন হিসাবে গণনা করতে পারি । এস ভি ইউ ভি সি = এক্স ভি = ইউ এস
ভেরিয়েবলের পিসিএ করার আরেকটি উপায় হ'ল স্কোয়ার ম্যাট্রিক্সের (যেমন ভেরিয়েবলগুলির মধ্যে পারস্পরিক সম্পর্ক বা সমবায় ইত্যাদি হতে পারে )। পচানি eigen-পচানি হতে পারে অথবা একবচন-মান পচানি: বর্গক্ষেত্র প্রতিসম ইতিবাচক semidefinite ম্যাট্রিক্স সঙ্গে, তারা একই ফলাফল দেব তির্যক হিসাবে eigenvalues সঙ্গে , এবং যেমন আগে বর্ণিত। উপাদানগুলির মানগুলি ।আর এল ভি সি = এক্স ভি
এখন, আমার প্রশ্ন: যদি ডেটা একটি বড় ম্যাট্রিক্স হয়, এবং কেসের সংখ্যা (যা প্রায়শই একটি কেস হয়) ভেরিয়েবলের সংখ্যার চেয়ে অনেক বেশি হয়, তবে উপায় (1) উপায়ের চেয়ে অনেক ধীর হবে বলে আশা করা হচ্ছে (2) ), কারণ উপায় (1) একটি বড় ম্যাট্রিক্সে বেশ ব্যয়বহুল অ্যালগরিদম (যেমন এসভিডি) প্রয়োগ করে; এটি বিশাল ম্যাট্রিক্স গণনা করে এবং সঞ্চয় করে যা আমাদের ক্ষেত্রে সত্যই প্রয়োজন হয় না (ভেরিয়েবলের পিসিএ)। যদি তা হয় তবে এতগুলি পাঠ্যপুস্তক কেন কেবলমাত্র পথ (1) উল্লেখ করে বা সমর্থন করে বলে মনে হচ্ছে? হয়তো এটা হয় দক্ষ ও আমি কিছু অনুপস্থিত করছি?
Joliffe, Principal component analysis, 2nd ed.
আসলে, জলিফ দুটি উপায় বর্ণনা করেছেন, তবে পিসিএর মূল অধ্যায়ে তিনি ঠিক 1 উপায় সম্পর্কে বলেছেন, যতদূর আমি মনে করতে পারি।
R
svd