পিসিএ লোডিংয়ের ব্যাখ্যা কীভাবে করবেন?


13

পিসিএ সম্পর্কে পড়ার সময়, আমি নিম্নলিখিত ব্যাখ্যাটি পেলাম:

মনে করুন আমাদের কাছে এমন একটি ডেটা সেট রয়েছে যেখানে প্রতিটি ডেটা পয়েন্ট গণিত পরীক্ষা, পদার্থবিজ্ঞান পরীক্ষা, একটি পাঠ্য বোঝার পরীক্ষা এবং ভোকাবুলারি পরীক্ষায় একক শিক্ষার্থীর স্কোরকে উপস্থাপন করে।

আমরা প্রথম দুটি মূল উপাদান খুঁজে পাই, যা ডেটাতে 90% পরিবর্তনশীলতা ক্যাপচার করে এবং তাদের লোডগুলি ব্যাখ্যা করে। আমরা উপসংহারে পৌঁছেছি যে প্রথম প্রধান উপাদান সামগ্রিক একাডেমিক দক্ষতার প্রতিনিধিত্ব করে, এবং দ্বিতীয়টি পরিমাণগত ক্ষমতা এবং মৌখিক দক্ষতার মধ্যে একটি বিপরীতে উপস্থাপন করে।

পাঠ্যটিতে বলা হয়েছে যে পিসি 1 এবং পিসি 2 লোডিংগুলি পিসি 1 এর জন্য এবং পিসি 2 এর জন্য , এবং নিম্নলিখিত ব্যাখ্যা সরবরাহ করে:( ০.৫ , ০.৫ , - ০.০ , - ০.০ )(0.5,0.5,0.5,0.5)(0.5,0.5,0.5,0.5)

[টি] তিনি প্রথম উপাদানটি গড় স্কোরের সমানুপাতিক এবং দ্বিতীয় উপাদানটি প্রথম জোড়া স্কোর এবং দ্বিতীয় জোড়া স্কোরের মধ্যে পার্থক্য পরিমাপ করে।

এই ব্যাখ্যাটির অর্থ কী তা আমি বুঝতে সক্ষম নই।


7
কোনওভাবে @ টিটিএনফেন্সের উত্তর অনেকগুলি গাণিতিক বিশদের মধ্যে যায় তবে আমি মনে করি যে আসল প্রশ্নটি আসলেই সোজা ছিল: পিসি 1 (0.5, 0.5, 0.5, 0.5) এর লোডিং ভেক্টরটির অর্থ কেন প্রথম উপাদানটি "গড় স্কোরের সমানুপাতিক" "? ঠিক আছে, উত্তরটি হ'ল লোডিংগুলি পিসি 1 তৈরি করে এমন মূল ভেরিয়েবলের রৈখিক সংমিশ্রণে [সমানুপাতিক] সহগ। সুতরাং আপনার প্রথম পিসি 1 হ'ল চারটি ভেরিয়েবলের যোগফল 0.5। যার অর্থ এটি চারটি ভেরিয়েবলের গড়ের সমানুপাতিক। এবং একই সাথে পিসি 2। আমি মনে করি এটির আসল প্রশ্নের উত্তর।
অ্যামিবা বলছেন মনিকাকে

@ অ্যামিবা - আপনি কি জানেন যে লোডিংয়ের এত সহজ ব্যাখ্যাটি পাওয়া খুব কঠিন। গুগলে পরবর্তী ব্যাখ্যাতে যাওয়ার সিদ্ধান্ত নেওয়ার আগে কোনওভাবেই, সর্বত্র এটি আমার মুখে জার্গন পিত্তর মুখ। ধন্যবাদ!
মিলোমিন্ডারবিন্দার

উত্তর:


13

লোডিংগুলির (যা ইগেনভেেক্টরগুলির সাথে বিভ্রান্ত হওয়া উচিত নয় ) নিম্নলিখিত বৈশিষ্ট্যগুলি রয়েছে:

  1. প্রতিটি উপাদানগুলির মধ্যে তাদের স্কোমের পরিমাণগুলি হ'ল ইগেনভ্যালু (উপাদানগুলির বৈকল্পিক)।
  2. লোডিংগুলি রৈখিক সংমিশ্রণের সহগ হয় (মানকৃত) উপাদানগুলির দ্বারা ভেরিয়েবলের পূর্বাভাস দেয়।

আপনি 4 এর মধ্যে 2 টি প্রথম পিসি উত্তোলন করেছেন load বিএফ এবং এডিশনগুলি ম্যাট্রিক্স :A

A (loadings)
         PC1           PC2
X1   .5000000000   .5000000000 
X2   .5000000000   .5000000000 
X3   .5000000000  -.5000000000 
X4   .5000000000  -.5000000000
Eigenvalues:
    1.0000000000  1.0000000000

এই উদাহরণে, উভয় ইগেনভ্যালু সমান। এটি বাস্তব বিশ্বে বিরল ঘটনা, এটি বলে যে পিসি 1 এবং পিসি 2 সমান ব্যাখ্যাযোগ্য "শক্তি" of

ধরুন আপনি Nx2মেট্রিক্স , এবং মেট্রিক্স গণনা করেছেন এবং প্রতিটি কলামের মধ্যে এগুলি জেড-স্ট্যান্ডার্ড করেছেন (মানে = 0, স্ট্যান্ড ডেভেল = 1) them তারপরে (উপরে পয়েন্ট 2 যেমনটি বলে), । তবে, আপনি 4 টির মধ্যে মাত্র 2 পিসি রেখেছেন (আপনারা আরও 2 টি কলামের অভাব রয়েছে ) পুনরুদ্ধার করা ডেটা মানগুলি exact যথাযথ নয়, - একটি ত্রুটি রয়েছে (যদি ইগেনভ্যালু 3, 4 না হয় শূন্য)।এক্স = সি একটি ' একটি এক্সCX^=CAAX^

ঠিক আছে. ভেরিয়েবল দ্বারা উপাদানগুলির পূর্বাভাসের সহগগুলি কী কী ? স্পষ্টতই, যদি পূর্ণ হয় তবে এগুলি । অ-বর্গক্ষেত্রের লোডিং ম্যাট্রিক্সের সাহায্যে আমরা তাদেরকে হিসাবে গণনা করতে পারি , যেখানে এর বর্গক্ষেত্রে ইগেনভ্যালুগুলির সাথে বর্গাকার তির্যক ম্যাট্রিক্স এবং সুপারস্ক্রিপ্ট সিউডোয়েন্টারকে বোঝায়। তোমার ক্ষেত্রে:A4x4B=(A1)B=Adiag(eigenvalues)1=(A+)diag(eigenvalues)+

diag(eigenvalues):
1 0
0 1

B (coefficients to predict components by original variables):
    PC1           PC2
X1 .5000000000   .5000000000 
X2 .5000000000   .5000000000 
X3 .5000000000  -.5000000000 
X4 .5000000000  -.5000000000

সুতরাং, যদি মূল কেন্দ্রিক ভেরিয়েবলগুলির ম্যাট্রিক্স হয় (বা মানযুক্ত ভেরিয়েবলগুলি, আপনি যদি কোভেরিয়েন্সের পরিবর্তে পারস্পরিক সম্পর্কের ভিত্তিতে পিসিএ করছেন), তবে ; মূল উপাদান স্কোর। আপনার উদাহরণে যা:XNx4C=XBC

পিসি 1 = 0.5 * এক্স 1 + 0.5 * এক্স 2 + 0.5 * এক্স 3 + 0.5 * এক্স 4 ~ (এক্স 1 + এক্স 2 + এক্স 3 + এক্স 4) / 4

"প্রথম উপাদানটি গড় স্কোরের সমানুপাতিক"

পিসি 2 = 0.5 * এক্স 1 + 0.5 * এক্স 2 - 0.5 * এক্স 3 - 0.5 * এক্স 4 = (0.5 * এক্স 1 + 0.5 * এক্স 2) - (0.5 * এক্স 3 + 0.5 * এক্স 4)

"দ্বিতীয় উপাদান স্কোরগুলির প্রথম জুটি এবং স্কোরের দ্বিতীয় জোড়ার মধ্যে পার্থক্য পরিমাপ করে"

এই উদাহরণে এটি উপস্থিত হয়েছিল যে , তবে সাধারণ ক্ষেত্রে এগুলি পৃথক।B=A


দ্রষ্টব্য : গুণফলের জন্য উপাদানগুলির স্কোরগুলি গণনা করার জন্য উপরের সূত্রটি, , সমান , রয়েছে ভেরিয়েবলের কোভরিয়েন্স (বা পারস্পরিক সম্পর্ক) ম্যাট্রিক্স। পরবর্তী সূত্রটি সরাসরি লিনিয়ার রিগ্রেশন তত্ত্ব থেকে আসে। দুটি সূত্র কেবল পিসিএ প্রসঙ্গে সমান। ফ্যাক্টর বিশ্লেষণে, এগুলি হয় না এবং ফ্যাক্টর স্কোরগুলি গণনা করতে (যা এফএতে সর্বদা আনুমানিক হয়) দ্বিতীয় সূত্রে নির্ভর করা উচিত ly বি = আর - 1 একটি আরB=Adiag(eigenvalues)1B=R1AR


আমার সম্পর্কিত উত্তর:

লোডিং বনাম ইগেনভেেক্টর সম্পর্কে আরও বিস্তারিত

প্রধান উপাদান স্কোর এবং ফ্যাক্টর স্কোরগুলি কীভাবে গণনা করা হয়


2
যদি 4 টির মধ্যে 2 টি উপাদান যদি 90% পরিবর্তনশীলতার জন্য অ্যাকাউন্ট করে তবে তাদের উপার্জনগুলি 2 এর যোগফল কিভাবে হবে?
নিক কক্স

নিক, আমি ওপিকে এই প্রশ্নটি বিশ্বাস করি। তিনি ডেটা বা কোভেরিয়েন্স / পারস্পরিক সম্পর্ক ম্যাট্রিক্স দেন নি। তাঁর কাছ থেকে আমরা যা পেয়েছিলাম তা হ'ল 2 টি প্রথম পিসির একটি (বরং অবাস্তব) লোডিং ম্যাট্রিক্স।
ttnphns

3
গুড পয়েন্ট, @Nick, এই প্রকৃতপক্ষে সম্ভব একটি মোট ভ্যারিয়েন্স হিসাবে, পারস্পরিক সম্পর্ক ম্যাট্রিক্স হতে হবে উভয় eigenvalues যাতে দুই পিসি, জন্য আবশ্যক অ্যাকাউন্ট পরিবর্তনশীলতা করুন। আমি অবশ্যই এটি আপনাকে ব্যাখ্যা করছি না, তবে এই থ্রেডের অন্যান্য সম্ভাব্য পাঠকদের জন্য। টিটিএনফেন্সের উত্তরটি (+1) সত্ত্বেও সঠিক রয়ে গেছে, ওপি দ্বারা রিপোর্ট করা ignore নম্বর উপেক্ষা করার মতো আমাদের কাছে আর কোনও উপায় নেই । 4 1 50 % 90 %4×44150%90%
অ্যামিবা বলছেন মনিকাকে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.