যদি মাত্রাগুলির সংখ্যা হয় তবে


22

পিসিএ সালে যখন এর মাত্রা সংখ্যা চেয়ে বড় (অথবা এমনকি সমান করার জন্য) নমুনা সংখ্যা কেন যেগুলি আপনি থাকতে হবে নন-জিরো eigenvectors? অন্য কথায়, ডের ডাইমেনশনের মধ্যে কোভেরিয়েন্স ম্যাট্রিক্সের র‌্যাঙ্কটি ।dNN1dNN1

উদাহরণ: আপনার নমুনাগুলি ভেক্টরাইজড ইমেজ, যা ডাইমেনশন , , তবে আপনার কেবল চিত্র রয়েছে।d=640×480=307200N=10


5
2 ডি বা 3 ডি তে পয়েন্ট কল্পনা করুন । এই পয়েন্টগুলি দখল করছে যে বহুগুণের মাত্রিকতা কী? উত্তরটি এন - 1 = 1 : দুটি পয়েন্ট সর্বদা একটি লাইনে থাকে (এবং একটি রেখাটি 1-মাত্রিক)। স্থানটির সঠিক মাত্রিকতা কোনও বিষয় নয় (যতক্ষণ না এটি N এর চেয়ে বড় হবে ), আপনার পয়েন্টগুলি কেবলমাত্র 1-মাত্রিক উপসর্গটি দখল করে। সুতরাং ভেরিয়েন্সটি কেবল এই উপস্থানে "স্প্রেড", অর্থাত্ 1 মাত্রার বরাবর রয়েছে। এটি যে কোনও এন এর ক্ষেত্রে সত্য । N=2N1=1NN
অ্যামিবা বলেছেন মনিকা

1
আমি @ অ্যামিবার মন্তব্যে একটি অতিরিক্ত স্পষ্টতা যুক্ত করব মূল পয়েন্টটিও গুরুত্বপূর্ণ। সুতরাং, আপনার যদি N = 2 + উত্স থাকে তবে মাত্রার সংখ্যাটি সর্বোচ্চ 2 (1 নয়)। তবে, পিসিএতে আমরা সাধারণত ডেটা কেন্দ্র করে থাকি যার অর্থ আমরা উত্সটিকে ডেটা মেঘের জায়গার ভিতরে রাখি - তারপরে একটি মাত্রা গ্রাস হয়ে যায় এবং উত্তরটি হবে "এন -1", যেমন অ্যামিবা দেখায় shown
ttnphns

এটাই আমাকে বিভ্রান্ত করে। এটি প্রতি সেন্টারের কেন্দ্রিক নয় যা মাত্রাটি ধ্বংস করে, তাই না? আপনার যদি ঠিক এন নমুনা এবং এন মাত্রা থাকে তবে কেন্দ্রীকরণ করার পরেও আপনার এখনও এন আইজিনভেেক্টর রয়েছে ..?
গ্রোকিংপিসিএ

2
কেন? এটি কেন্দ্র করে যা একটি মাত্রা ধ্বংস করে। কেন্দ্রিক (গাণিতিক মাধ্যমে) ডেটা দ্বারা "স্প্যানড" স্পেসে "বাইরের" থেকে উত্সকে "স্থান" থেকে "সরান"। এন = 2 এর উদাহরণ সহ। 2 পয়েন্ট + কিছু উত্স সাধারণত একটি বিমান বিস্তৃত হয়। আপনি যখন এই ডেটাটি কেন্দ্র করেন, আপনি মূলটি 2 পয়েন্টের মাঝামাঝি একটি সরল রেখায় রেখে দেন। সুতরাং, তথ্য এখন কেবল রেখা বিস্তৃত।
ttnphns

3
ইউক্লিড এটি ইতিমধ্যে 2300 বছর আগে জানত: দুটি পয়েন্ট একটি লাইন নির্ধারণ করে, তিনটি পয়েন্ট একটি বিমান নির্ধারণ করে। জেনারালাইজিং, পয়েন্টগুলি একটি এন - 1 মাত্রিক ইউক্লিডিয়ান স্থান নির্ধারণ করেNN1
whuber

উত্তর:


20

পিসিএ কী করে তা বিবেচনা করুন। সহজভাবে বলতে গেলে, পিসিএ (সাধারণত চালিত হিসাবে) একটি নতুন সমন্বিত সিস্টেম তৈরি করে:

  1. আপনার ডেটার সেন্ট্রয়েডে উত্স স্থানান্তর করা,
  2. স্কাইজেস এবং / অথবা অক্ষগুলি দৈর্ঘ্যে সমান করার জন্য প্রসারিত করে এবং
  3. আপনার অক্ষগুলি একটি নতুন অভিমুখে রূপান্তরিত করে।

(আরও তথ্যের জন্য, এই দুর্দান্ত সিভি থ্রেডটি দেখুন: মূল উপাদান বিশ্লেষণ, আইজেনভেেক্টর এবং ইগেনালভেগুলি বোধ করা )) তবে এটি কেবল আপনার অক্ষগুলি কোনও পুরানো পথে ঘোরান না। আপনার নতুন (প্রথম প্রধান উপাদান) আপনার ডেটা সর্বাধিক প্রকরণের দিক নির্দেশিত। দ্বিতীয় প্রধান উপাদানটি সর্বকালের বৃহত্তম সর্বাধিক পরিমাণের পরিবর্তনের দিকে পরিচালিত হয় যা প্রথম প্রধান উপাদানটির সাথে অরথোগোনাল । বাকি মূল উপাদানগুলিও একইভাবে গঠিত হয়। X1

এটি মাথায় রেখে, আসুন @ অ্যামিবার উদাহরণটি পরীক্ষা করি । এখানে একটি ত্রিমাত্রিক স্থানে দুটি পয়েন্ট সহ একটি ডেটা ম্যাট্রিক্স রয়েছে:
আসুন এই পয়েন্টগুলি একটি (সিউডো) ত্রিমাত্রিক স্ক্যাটারপ্লোটে দেখুন:

X=[111222]

enter image description here

(1.5,1.5,1.5)(0,0,0)(3,3,3)(0,0,3)(3,3,0)(0,3,0)(3,0,3)

N=2N1=1

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.