পিসিএ উপাদান (একটি বিপ্লট / লোডিং প্লটের উপর) সহ একটি ভেরিয়েবলের সঠিক সমিতি মাপ কী?


17

আমি FactoMineRসুপ্ত ভেরিয়েবলগুলিতে আমার ডেটার পরিমাপের সেটটি হ্রাস করতে ব্যবহার করছি ।

! [পরিবর্তনশীল মানচিত্র] (http://f.cl.ly/items/071s190V1G3s1u0T0Y3M/pca.png)

উপরের পরিবর্তনশীল মানচিত্রটি ব্যাখ্যা করার জন্য আমার কাছে স্পষ্ট, তবে ভেরিয়েবল এবং উপাদান 1 এর মধ্যে সংযুক্তিগুলি আসার সময় আমি বিভ্রান্ত হয়ে পড়েছি ভেরিয়েবল মানচিত্রের দিকে তাকানো, ddpএবং মানচিত্রের অংশটির covখুব কাছাকাছি অবস্থিত, এবং ddpAbsআরও কিছুটা সামান্য দূরে। তবে, পারস্পরিক সম্পর্কগুলি এটি দেখায় না:

$Dim.1
$Dim.1$quanti
        correlation      p.value
jittAbs   0.9388158 1.166116e-11
rpvi      0.9388158 1.166116e-11
sd        0.9359214 1.912641e-11
ddpAbs    0.9327135 3.224252e-11
rapAbs    0.9327135 3.224252e-11
ppq5      0.9319101 3.660014e-11
ppq5Abs   0.9247266 1.066303e-10
cov       0.9150209 3.865897e-10
npvi      0.8853941 9.005243e-09
ddp       0.8554260 1.002460e-07
rap       0.8554260 1.002460e-07
jitt      0.8181207 1.042053e-06
cov5_x    0.6596751 4.533596e-04
ps13_20  -0.4593369 2.394361e-02
ps5_12   -0.5237125 8.625918e-03

তারপরে sin2পরিমাণ আছে, যা উচ্চতার rpvi(উদাহরণস্বরূপ), তবে সেই পরিমাপটি ভেরিয়েবল নয় যা একেবারে প্রথম উপাদানটির নিকটতম।

Variables
           Dim.1    ctr   cos2    Dim.2    ctr   cos2  
rpvi    |  0.939  8.126  0.881 |  0.147  1.020  0.022 |
npvi    |  0.885  7.227  0.784 |  0.075  0.267  0.006 |
cov     |  0.915  7.719  0.837 | -0.006  0.001  0.000 |
jittAbs |  0.939  8.126  0.881 |  0.147  1.020  0.022 |
jitt    |  0.818  6.171  0.669 |  0.090  0.380  0.008 |
rapAbs  |  0.933  8.020  0.870 |  0.126  0.746  0.016 |
rap     |  0.855  6.746  0.732 |  0.040  0.076  0.002 |
ppq5Abs |  0.925  7.884  0.855 |  0.091  0.392  0.008 |
ppq5    |  0.932  8.007  0.868 | -0.035  0.057  0.001 |
ddpAbs  |  0.933  8.020  0.870 |  0.126  0.746  0.016 |
ddp     |  0.855  6.746  0.732 |  0.040  0.076  0.002 |
pa      |  0.265  0.646  0.070 | -0.857 34.614  0.735 |
ps5_12  | -0.524  2.529  0.274 |  0.664 20.759  0.441 |
ps13_20 | -0.459  1.945  0.211 |  0.885 36.867  0.783 |
cov5_x  |  0.660  4.012  0.435 |  0.245  2.831  0.060 |
sd      |  0.936  8.076  0.876 |  0.056  0.150  0.003 |

সুতরাং, যখন এটি পরিবর্তনশীল এবং প্রথম উপাদানটির মধ্যে সংযোগ আসে তখন আমার কী দেখার উচিত?


1
আপনার মানচিত্রে আলথোগ্ট পয়েন্টগুলি (যা লোডিং প্লট হিসাবে দেখায়) বিশৃঙ্খলা, আমি বলব যে প্লটটি "পারস্পরিক সম্পর্ক" আউটপুটটির সাথে সুসংগত। সেই "পরস্পর সম্পর্ক" হ'ল ডিএম 1 এর স্থানাঙ্ক। এগুলি, লোডিংগুলি হ'ল একটি ফ্যাক্টর এবং ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক (
ttnphns

দয়া করে নীচের উত্তর (সমূহ) ছাড়াও পরীক্ষা এই এক সেখানে আরও লিঙ্ক সহ।
ttnphns

উত্তর:


25

পিসিএ বা ফ্যাক্টর বিশ্লেষণের লোডিং প্লটের ব্যাখ্যা।

প্লট লোড হচ্ছে মূল উপাদানগুলির (বা উপাদানগুলির) স্থানগুলিতে পয়েন্ট হিসাবে চলকগুলি দেখায়। ভেরিয়েবলের স্থানাঙ্কগুলি সাধারণত লোডিং হয়। (যদি আপনি একই উপাদানগুলির স্থানের ডেটা কেসের সম্পর্কিত স্ক্রেটারপ্লটের সাথে লোডিং প্লটকে সঠিকভাবে একত্রিত করেন তবে তা বাইপ্লট হবে))

আমাদের 3 একরকম সম্পর্কিত ভেরিয়েবল আছে, যাক , ডব্লিউ , ইউ । আমরা সেগুলি কেন্দ্র করে এবং পিসিএ সঞ্চালন করি , তিনটির মধ্যে দুটি প্রথম প্রধান উপাদান বের করে: এফ 1 এবং এফ 2 । আমরা লোডিংগুলি নীচের লোডিং প্লটটি স্থানাঙ্ক হিসাবে ব্যবহার করি । লোডিং হ'ল আনস্ট্যান্ডার্ড আইজেনভেেক্টরগুলির উপাদান, অর্থাত্ ইগেনভেেক্টরগুলি সংশ্লিষ্ট উপাদানগুলির বৈকল্পিক বা ইগেনভ্যালু দ্বারা সমৃদ্ধ।VWUF1F2

enter image description here

লোড হচ্ছে প্লট ছবিতে বিমান। আসুন শুধুমাত্র ভেরিয়েবল । তীর অভ্যাসগত ভাবেই একটি লোড চক্রান্ত টানা কি লেবেল হয় ' এখানে; স্থানাঙ্ক একটি 1 , একটি 2 এর loadings হয় ভী সঙ্গে এফ 1এফ 2 যথাক্রমে (অনুগ্রহ করে জানি যে পারিভাষিক বলতে "কম্পোনেন্ট লোড একটি পরিবর্তনশীল", তদ্বিপরীত বেশী না সঠিক)।Vha1a2VF1F2

তীর অভিক্ষেপ হয়, কম্পোনেন্ট প্লেনে, ভেক্টরের যা সত্য ভেরিয়েবলের অবস্থান ভী ভেরিয়েবলের মধ্যে' দ্বারা দৃশ্যও স্থান ভী , ডব্লিউ , ইউ । ভেক্টরের স্কোয়ারড দৈর্ঘ্য, 2 হয় ভ্যারিয়েন্স একটি এর ভী । যদিও h 2 হ'ল দুটি উপাদান দ্বারা ব্যাখ্যা করা বৈকল্পিকের অংশhhVVWUh2aVh2

লোডিং, পারস্পরিক সম্পর্ক, অনুমানযুক্ত পারস্পরিক সম্পর্ক । যেহেতু ভেরিয়েবল, উপাদান পূর্বে নিষ্কাশন কেন্দ্রিক ছিল হয় পিয়ারসন পারস্পরিক সম্পর্ক মধ্যে ভী এবং কম্পোনেন্ট এফ 1 । যে বিভ্রান্ত করা উচিত নয় সঙ্গে কোসাইন্ α লোড চক্রান্ত, যা অন্য পরিমাণ: এটা উপাদান মধ্যে পিয়ারসন কোরিলেশন এফ 1 এবং পরিবর্তনশীল এখানে vectored ' । একটি পরিবর্তনশীল হিসাবে, ' এর ভবিষ্যদ্বাণী ভী রৈখিক রিগ্রেশনে (প্রচলিত) উপাদান দ্বারা (রৈখিক রিগ্রেশনের জ্যামিতি আঁকার সঙ্গে তুলনা এখানেcosϕVF1cosαF1hhV) যেখানে loadings 'র রিগ্রেশন কোফিসিয়েন্টস (যেমন নিষ্কাশিত যখন উপাদান লম্ব রাখা হয়,) হয়।a

আরও। আমরা স্মরণ করতে পারি (ত্রিকোণমিতি) যে । এটা তোলে যেমন বোঝা যাবে স্কালে পণ্যের ভেক্টর মধ্যে ভী এবং ইউনিট দৈর্ঘ্যের ভেক্টর এফ 1 : 1 কোসাইন্ φএফ 1 যে ইউনিট-ভ্যারিয়েন্স ভেক্টর সেট করা হয় কারণ এটির কোনো তার রয়েছে নিজস্ব যে ভ্যারিয়েন্স ছাড়া ভ্যারিয়েন্স ভী যা ব্যাখ্যা করে (পরিমাণ দ্বারা ' ): অর্থাত এফ 1a1=hcosϕVF1h1cosϕF1VhF1ভি, ইউ, ইউ থেকে উত্তোলিত এবং আমন্ত্রিত-থেকে-বাহিরের সত্তা নয়। তারপরে, পরিষ্কারভাবে, হয়সহভেদাংকমধ্যেভীএবংমান, ইউনিট-স্কেলসেটে (গুলি1=a1=varVvarF1r=h1cosϕVb) উপাদানF1। এই সমবায় সরাসরি ইনপুট ভেরিয়েবলের মধ্যে সমবায়ুগুলির সাথে তুলনীয়; উদাহরণস্বরূপ,ভিএবংডাব্লু এরমধ্যকার সামঞ্জস্যতাতাদের ভেক্টরের দৈর্ঘ্যের ফলক হবে যা তাদের মধ্যে কোসাইন দ্বারা বহুগুণ বৃদ্ধি পেয়েছে।s1=varF1=1F1VW

যোগফল করতে: লোড আদর্শায়িত কম্পোনেন্ট এবং পর্যবেক্ষিত পরিবর্তনশীল মধ্যে সহভেদাংক হিসেবে দেখা যেতে পারে 1 কোসাইন্ φ , অথবা equivalently আদর্শায়িত কম্পোনেন্ট এবং ব্যাখ্যা (সমস্ত উপাদান চক্রান্ত সংজ্ঞা দ্বারা) মধ্যে ভাবমূর্তি পরিবর্তনশীল, '1 কোসাইন্ α । যে কোসাইন্ α বলা যেতে পারে ভি-এফ 1 পারস্পরিক সম্পর্ক অভিক্ষিপ্ত এফ 1-F2 চেপে উপাদান subspace উপর।a1h1cosϕh1cosαcosα

ভেরিয়েবল এবং উপাদান, , এর মধ্যে পূর্বোক্ত সম্পর্ককে স্ট্যান্ডার্ড বা পুনরুদ্ধারকৃত লোডিংও বলা হয় । এটি উপাদানগুলির ব্যাখ্যায় সুবিধাজনক কারণ এটি [-1,1] এর মধ্যে রয়েছে।cosϕ=a1/h

আইজেনভেেক্টরগুলির সাথে সম্পর্কিত । Rescaled লোড উচিত না নিবন্ধের সাথে বিভ্রান্ত হবেন eigenvector উপাদান যা - হিসাবে আমরা জানি - একটি পরিবর্তনশীল এবং একটি প্রধান উপাদান মধ্যে কোণের কোসাইন হয়। মনে রাখবেন যে লোডিংটি ইগেনভেেক্টর উপাদানটি উপাদানটির একক মান (ইগেনুয়ালুয়ের বর্গমূল) দ্বারা মাপানো। যেমন আমাদের প্লটের ভেরিয়েবল ভি এর জন্য : একটি 1 = 1 এস 1 , যেখানে এস 1 হ'ল স্ট্যান্ড। বিচ্যুতি ( 1 নয় তবে মূল, অর্থ একক মান) এফ 1 এরcosϕVa1=e1s1s11F1সুপ্ত পরিবর্তনশীল। তারপরে এটি আসে যে ইগেনভেেক্টর উপাদান নাকোসাইন্φনিজেই। দুটি শব্দ "কোসাইন" dissolves প্রায় বিভ্রান্তির যখন আমরা স্মরণ কি স্থান প্রতিনিধিত্বের ধরনের রয়েছে। Eigenvector মানহয়কোসাইনআবর্তনের কোণেরজনসংযোগ মধ্যে অক্ষ হিসেবে ভেরিয়েবলের। অক্ষর হিসাবে ভেরিয়েবল স্পেসের মধ্যে উপাদান (ওরফে স্ক্রেটারপ্লট ভিউ),যেমন এখানে। যদিওআমাদের লোডিং প্লটটিতেকোসveভেক্টর এবং জনসংযোগ হিসাবে একটি ভেরিয়েবলের মধ্যেকোসাইন মিলের পরিমাপ। উপাদান হিসাবে ... ভাল .. ভেক্টর হিসাবেও, যদি আপনি চান (যদিও এটি প্লটের অক্ষ হিসাবে আঁকা), - কারণ আমরা বর্তমানেবিষয়বস্তুতেআছিe1=a1s1=hs1cosϕcosϕcosϕ (যা লোডিং প্লটটি হ'ল) ​​যেখানে পারস্পরিক সম্পর্কযুক্ত ভেরিয়েবলগুলি ভেক্টরগুলির অনুরাগী - অর্থোথোনাল অক্ষগুলি নয় - এবং ভেক্টর কোণগুলি সংশ্লেষের পরিমাপ - এবং স্থান স্থান ঘূর্ণনের নয়।

যেখানে লোডিংটি একটি ভেরিয়েবল এবং ইউনিট-স্কেলড উপাদানগুলির মধ্যে কৌণিক (অর্থাত্ স্কেলার পণ্য ধরণের) সমিতি পরিমাপ, এবং উদ্ধারকৃত লোডিং একটি মানক লোডিং যেখানে ভেরিয়েবলের স্কেল একককে কমিয়ে আনা হয় তবে ইগেনভেেক্টর সহগ হচ্ছে লোডিং যেখানে উপাদানটি "অত্যধিক মানসম্পন্ন", অর্থাত্ ( 1 এর চেয়ে 1) স্কেলে আনা হয়েছিল ; বিকল্প হিসাবে, এটি পুনরুদ্ধারকৃত লোডিং হিসাবে ভাবা যেতে পারে যেখানে ভেরিয়েবলের স্কেলটি এইচ / এস (1 এর পরিবর্তে) এ আনা হয়েছিল ।1/sh/s

সুতরাং, একটি পরিবর্তনশীল এবং একটি উপাদান মধ্যে সংযুক্তি কি ? আপনি যা পছন্দ করতে পারেন তা বেছে নিতে পারেন। এটি হতে পারে লোডিং (ইউনিট স্কেলড উপাদান সহ সমবায়) ; rescaled লোড কোসাইন্ φ (= পরিবর্তনশীল-কম্পোনেন্ট পারস্পরিক সম্পর্ক); মধ্যে পারস্পরিক চিত্র (ভবিষ্যদ্বাণী) এবং কম্পোনেন্ট (= পারস্পরিক সম্পর্ক অভিক্ষিপ্ত কোসাইন্ α )। আপনি প্রয়োজনে এমনকি ইগেনভেেক্টর সহগ e = a / s চয়ন করতে পারেন (যদিও আমি ভাবছি যে কারণটি কী হতে পারে)। অথবা আপনার নিজস্ব পরিমাপ আবিষ্কার করুন।a cosϕcosαe=a/s

ইগেনভেেক্টর মান স্কোয়ারের একটি জনসংযোগ হিসাবে একটি ভেরিয়েবলের অবদানের অর্থ রয়েছে। উপাদান. পুনরুদ্ধারকৃত লোডিং স্কোয়ারে জনসংযোগের অবদানের অর্থ রয়েছে। একটি পরিবর্তনশীল মধ্যে উপাদান।

পারস্পরিক সম্পর্কের উপর ভিত্তি করে পিসিএ সম্পর্কিত সম্পর্ক। আমরা যদি পিসিএ-বিশ্লেষণ না করে কেবল কেন্দ্রিক না তবে মানকযুক্ত (কেন্দ্রিক তখন ইউনিট-ভেরিয়েন্স স্কেলড) ভেরিয়েবলগুলি ব্যবহার করি, তবে তিনটি ভেরিয়েবল ভেক্টর (বিমানে তাদের অনুমান নয়) একই, এককের দৈর্ঘ্যের হবে। তারপরে এটি স্বয়ংক্রিয়ভাবে অনুসরণ করে যে কোনও ভেরিয়েবল এবং উপাদানগুলির মধ্যে একটি লোডিং পারস্পরিক সম্পর্ক , কিন্তু যে পারস্পরিক সম্পর্ক থাকবে না "আদর্শায়িত লোড" সমান এর , উপরের ছবিটিতে (ঠিক কেন্দ্রিক ভেরিয়েবল বিশ্লেষণ উপর ভিত্তি করে) কারণ মান ভেরিয়েবল পিসিএ (সম্পর্কযুক্তরূপে ভিত্তিক পিসিএ) উৎপাদ বিভিন্ন কেন্দ্রিক ভেরিয়েবল পিসিএ (তুলনায় উপাদান কোভেরিয়েন্স ভিত্তিক পিসিএ)। পারস্পরিক সম্পর্ক ভিত্তিক পিসিএ 1cosϕ কারণ এইচ = 1 , তবে মূল উপাদানগুলিসেই একইমূল উপাদানগুলি নয় যা আমরা কোভেরিয়েন্স-ভিত্তিক পিসিএ (পড়ুন,পড়ুন) থেকে পান।a1=cosϕh=1

ইন ফ্যাক্টর বিশ্লেষণ , লোড চক্রান্ত মূলত একই ধারণা এবং পিসিএ হিসেবে ব্যাখ্যা করেছেন। শুধুমাত্র (কিন্তু গুরুত্বপূর্ণ ) পার্থক্য পদার্থ । ফ্যাক্টর বিশ্লেষণে, এইচ - তারপরে পরিবর্তকের "সাম্প্রদায়িকতা" নামে পরিচিত - এটির পরিবর্তনের অংশ যা সাধারণ কারণগুলির দ্বারা ব্যাখ্যা করা হয় যা ভেরিয়েবলগুলির মধ্যে পারস্পরিক সম্পর্কের জন্য বিশেষত দায়ী । পিসিএ থাকাকালীন বর্ণিত অংশ এইচ hh hএটি স্থূল "মিশ্রণ" - এটি আংশিকভাবে চলকগুলির মধ্যে পারস্পরিক সম্পর্ক এবং আংশিক সম্পর্কহীনতার প্রতিনিধিত্ব করে। ফ্যাক্টর বিশ্লেষণের সাথে, আমাদের ছবিতে লোডিংয়ের বিমানটি ভিন্নভাবে আলোকিত করা হবে (আসলে, এটি আমাদের 3 ডি ভেরিয়েবলের স্পেসের বাইরেও 4 র্থ মাত্রায় প্রসারিত করবে, যা আমরা আঁকতে পারি না; লোডিংস প্লেনটি আমাদের একটি উপসর্গ হবে না 3d স্থান দ্বারা দৃশ্যও এবং অন্য দুটি ভেরিয়েবল), এবং অভিক্ষেপ ' অন্য দৈর্ঘ্যের এবং অন্য কোণ হবে α । (পিসিএ এবং ফ্যাক্টর বিশ্লেষণের মধ্যে তাত্ত্বিক পার্থক্যটি জ্যামিতিকভাবে এখানে সাবজেক্ট স্পেস উপস্থাপনার মাধ্যমে এবং এখানে পরিবর্তনশীল স্থানের প্রতিনিধিত্বের মাধ্যমে ব্যাখ্যা করা হয়েছে ।)Vhα


মন্তব্যে @ আন্টনি পরেল্লাদার অনুরোধের জবাব। আপনিবৈকল্পিকতার ক্ষেত্রেবাস্ক্যাটারের ক্ষেত্রে(বিচ্যুততার এসএস) হিসাবেকথা বলতে পছন্দ করেন কিনা তা সমান: ভেরিয়েন্স = স্ক্যাটার / (এন-1), যেখানেএননমুনার আকার। যেহেতু আমরা একইএনদিয়ে একটি ডেটাসেট নিয়ে কাজ করছি, ধ্রুবক সূত্রগুলিতে কিছুই পরিবর্তন করে না। যদিএক্সডেটা (ভেরিয়েবল ভ, ডাব্লু, ইউ কেন্দ্রিক) হয়, তবে এর (এ) কোভারিয়েন্স ম্যাট্রিক্সের ইজেনডিকম্পোজিশনটি (বি) স্ক্রেটার ম্যাট্রিক্স এক্স এক্সএর ইজেনডিকম্পোজেশন হিসাবে একই ইজেনভ্যালু (উপাদান উপাদানগুলি) এবং আইজেনভেেক্টরকে ফল দেয়a,b/(n1)nnXXXপ্রাথমিক বিভাজন পর প্রাপ্ত দ্বারা X ফ্যাক্টর। এর পর, একটি লোড সূত্রে (উত্তর এর মধ্যবর্তী অংশটি দেখুন),একটি1=গুলি1কোসাইন্φশব্দটিহয়ম। বিচ্যুতিn1a1=hs1cosϕh in (A) তবে মূল বিচ্ছুরক (যেমন আদর্শ)Vin (B)। টার্মগুলি1, যা সমান1,হয়মানএফ1উপাদান এর ম। বিচ্যুতিvarVVs11F1 in (A) তবে রুট স্ক্র্যাটারF1in (B)। অবশেষে,কোসϕ=আরপারস্পরিক সম্পর্ক যাতার গণনায়n-1এর ব্যবহারেরপ্রতি সংবেদনশীল। সুতরাং, আমরা কেবলরূপগুলি (এ) বা বিচ্ছুরক (বি) এর ধারণাগতভাবেকথা বলি, যখন উভয় ক্ষেত্রেই মূল্যবোধগুলি সূত্রে একই থাকে।varF1F1cosϕ=rn1


এই উত্তরটি মহান ও তথ্য অনেক আছে, কিন্তু আমি মনে করি প্রশ্নের প্রকৃত উত্তর মিথ্যা বলব "কি করে মানে?" α
শ্যাডট্যালকার

@ এসএসডেকট্রোল, আমি এ সম্পর্কিত একটি লাইন যুক্ত করেছি।
ttnphns

আমি আপনার পোস্ট বিষয়ে পরিষ্কারভাবে পড়া হয়েছে, এবং আমি আপাতদৃষ্টিতে সবচেয়ে বড় পক্ষ থেকে আটকে আছি, যখন আপনি বলে ... " । যেহেতুr=cosϕএবং √ √a1=varVvarF1r=h1cosϕr=cosϕ, এটি অনুসরণ করেvarF1=1। তবে,h=V= √ √varV=h , যেখানেh=V=x2 । আমি কী মিস করছি? varV=x2n1
আন্তনি পরল্লদা

1
অ্যান্টোনিপ্রেল্লদা, দয়া করে পাদটীকা দেখুন check
ttnphns

1
আমি আপনার সংযোজনটি পড়েছি এবং এটি খুব আলোকিত। ধন্যবাদ! নির্দিষ্ট বাক্য খুঁজে অবচয় ছাড়া, একক আদর্শ স্কেলিং ইউনিট-ভ্যারিয়েন্স থেকে ট্রানজিশন কিছু ব্যাখ্যা করবে উত্তর বরাবর, যা পূর্বে (রা) আমাকে কিছু অসুবিধা উপস্থাপন করেছে। F1
আন্তনি পরল্লদা 9:24
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.