পিসিএ বা এফএতে স্কোর বা লোডিংয়ের চিহ্নটির কোনও অর্থ আছে? আমি কি সাইনটি উল্টাতে পারি?


37

আমি দুটি পৃথক ফাংশন ( prcompএবং princomp) ব্যবহার করে আর দিয়ে মূল উপাদান বিশ্লেষণ (পিসিএ) সম্পাদন করেছি এবং দেখেছি যে পিসিএর স্কোরগুলি স্বাক্ষরে পৃথক। এটা কিভাবে হতে পারে?

এই বিবেচনা:

set.seed(999)
prcomp(data.frame(1:10,rnorm(10)))$x

            PC1        PC2
 [1,] -4.508620 -0.2567655
 [2,] -3.373772 -1.1369417
 [3,] -2.679669  1.0903445
 [4,] -1.615837  0.7108631
 [5,] -0.548879  0.3093389
 [6,]  0.481756  0.1639112
 [7,]  1.656178 -0.9952875
 [8,]  2.560345 -0.2490548
 [9,]  3.508442  0.1874520
[10,]  4.520055  0.1761397

set.seed(999)
princomp(data.frame(1:10,rnorm(10)))$scores
         Comp.1     Comp.2
 [1,]  4.508620  0.2567655
 [2,]  3.373772  1.1369417
 [3,]  2.679669 -1.0903445
 [4,]  1.615837 -0.7108631
 [5,]  0.548879 -0.3093389
 [6,] -0.481756 -0.1639112
 [7,] -1.656178  0.9952875
 [8,] -2.560345  0.2490548
 [9,] -3.508442 -0.1874520
[10,] -4.520055 -0.1761397

+/-দুটি বিশ্লেষণের জন্য কেন লক্ষণগুলি পৃথক হয়? যদি আমি তখন প্রধান উপাদানগুলি PC1এবং PC2কোনও রিগ্রেশনটিতে ভবিষ্যদ্বাণীকারী হিসাবে ব্যবহার করছিলাম , অর্থাত্ lm(y ~ PC1 + PC2), yএটি কোন পদ্ধতিটি আমি ব্যবহার করেছি তার উপর নির্ভর করে দুটি ভেরিয়েবলের প্রভাব সম্পর্কে আমার ধারণাটি সম্পূর্ণরূপে বদলে দেবে ! তারপরে আমি কীভাবে বলতে পারি যে PC1এর উদাহরণস্বরূপ একটি ইতিবাচক প্রভাব রয়েছে yএবং PC2এর যেমন নেতিবাচক প্রভাব রয়েছে y?


এছাড়াও: পিসিএ উপাদানগুলির চিহ্নটি যদি অর্থহীন হয়, তবে এটিও ফ্যাক্টর বিশ্লেষণের জন্য সত্য (এফএ)? পৃথক পিসিএ / এফএ উপাদান উপাদান স্কোর (বা লোডিংয়ের, মেট্রিক্সের লোডিংয়ের কলাম হিসাবে) উল্টানো (বিপরীত) করা কি গ্রহণযোগ্য?


10
+1 টি। এই ফোরামে বিভিন্ন প্রকরণে (কখনও কখনও পিসিএ সম্পর্কে, কখনও কখনও ফ্যাক্টর বিশ্লেষণ সম্পর্কে) এই প্রশ্নটি অনেক জিজ্ঞাসা করা হয়। এইটি এই ইস্যুটি সর্বাধিক জনপ্রিয় থ্রেড (@ জানুয়ারীর সেরা উত্তরের জন্য ধন্যবাদ), সুতরাং এটি বিদ্যমান এবং ভবিষ্যতের অন্যান্য প্রশ্নের উত্তরটির সদৃশ হিসাবে চিহ্নিত করা সুবিধাজনক হবে। শিরোনাম পরিবর্তন করে এবং শেষে ফ্যাক্টর বিশ্লেষণ উল্লেখ করে আপনার প্রশ্নটিকে কিছুটা সাধারণ করার জন্য আমি স্বাধীনতা নিয়েছি। আমি আশা করি আপনি কিছু মনে করবেন না। আমি একটি অতিরিক্ত উত্তর প্রদান করেছি।
অ্যামিবা বলেছেন মনিকাকে

1
চিহ্নটি নির্বিচারে; মূল অর্থ যৌক্তিকভাবে চিহ্নের উপর নির্ভর করে। আপনি সর্বদা "এক্স" লেবেলযুক্ত যে কোনও ফ্যাক্টরের চিহ্নটিকে বিপরীত চিহ্নটিতে পরিবর্তন করতে পারেন এবং এটির পরে "বিপরীতে এক্স" লেবেল করতে পারেন। স্কোরের জন্য এটি লোডিংয়ের ক্ষেত্রে সত্য। কিছু বাস্তবায়ন - সুবিধার জন্য - কোনও ফ্যাক্টরের সাইন পরিবর্তন করে যাতে এতে থাকা ধনাত্মক মানগুলি (স্কোর বা লোডিংগুলিতে) এককভাবে প্রাধান্য পায়। অন্যান্য বাস্তবায়নগুলি কিছুই করে না এবং আপনার উপর সাইনটি উল্টে দেওয়ার সিদ্ধান্তটি ছেড়ে দেয় - যদি আপনি যত্ন নেন। পরিসংখ্যানগত অর্থ (যেমন প্রভাব শক্তি) এর "দিকনির্দেশ" বিপরীত হয় পরিবর্তিত হয় না।
ttnphns

উত্তর:


38

পিসিএ একটি সাধারণ গাণিতিক রূপান্তর। আপনি যদি উপাদান (গুলি) এর চিহ্নগুলি পরিবর্তন করেন তবে আপনি প্রথম উপাদানটিতে থাকা বৈকল্পিক পরিবর্তন করবেন না। তদুপরি, আপনি যখন লক্ষণগুলি পরিবর্তন করেন, ওজন ( prcomp( ... )$rotation) এছাড়াও চিহ্নটি পরিবর্তন করে, সুতরাং ব্যাখ্যাটি হুবহু একই থাকে:

set.seed( 999 )
a <- data.frame(1:10,rnorm(10))
pca1 <- prcomp( a )
pca2 <- princomp( a )
pca1$rotation

শো

                 PC1       PC2
X1.10      0.9900908 0.1404287
rnorm.10. -0.1404287 0.9900908

এবং pca2$loadingsপ্রদর্শন করুন

Loadings:
          Comp.1 Comp.2
X1.10     -0.99  -0.14 
rnorm.10.  0.14  -0.99 

               Comp.1 Comp.2
SS loadings       1.0    1.0
Proportion Var    0.5    0.5
Cumulative Var    0.5    1.0

তাহলে, কেন ব্যাখ্যা একই থাকে?

আপনি y1 উপাদানটির পিসিএ রিগ্রেশন করেন do প্রথম সংস্করণে ( prcomp), সহগটি ধনাত্মক বলে: 1 উপাদান 1 টি বড়, বড় y। আসল ভেরিয়েবলের কথা বলতে গেলে এর অর্থ কী? যেহেতু ভেরিয়েবল 1 ( 1:10এ) এর ওজন ইতিবাচক, এটি দেখায় যে ভেরিয়েবল 1 তত বড়, বড় y।

এখন দ্বিতীয় সংস্করণ ব্যবহার করুন ( princomp)। যেহেতু উপাদানটির চিহ্নটি পরিবর্তিত হয়েছে, বড় y, কম 1 উপাদান - পি <1 এর উপর y এর গুণফল এখন nowণাত্মক। তবে ভেরিয়েবল 1 লোড হচ্ছে; তার মানে, বৃহত্তর ভেরিয়েবল 1, ছোট 1 উপাদান 1, বৃহত্তর y - ব্যাখ্যাটি একই।

সম্ভবত, এটি দেখার সহজতম উপায় হ'ল বাইপ্লট ব্যবহার করা।

library( pca3d )
pca2d( pca1, biplot= TRUE, shape= 19, col= "black"  )

শো

এখানে চিত্র বর্ণনা লিখুন

দ্বিতীয় বৈকল্পিক শোগুলির জন্য একই বিপ্লট

pca2d( pca2$scores, biplot= pca2$loadings[,], shape= 19, col= "black" )

আপনি দেখতে হিসাবে, ছবি 180 by দ্বারা আবর্তিত হয়। তবে ওজন / লোডিংয়ের (লাল তীর) এবং ডেটা পয়েন্টগুলির (কালো বিন্দাগুলি) মধ্যে সম্পর্ক হুবহু এক; সুতরাং, উপাদান ব্যাখ্যা অপরিবর্তিত।

এখানে চিত্র বর্ণনা লিখুন


আমি এখনই ছবিগুলি জুড়েছি :-)
জানুয়ারী

1
এটি সত্য, তবে পিসিএ-তে অনুমানগুলি কী হবে? আমি নিজেই পিসিএ কোডিং করছি, এবং ম্যাটল্যাব অন্তর্নির্মিতের তুলনায় আমার কিছু আইজেনভেেক্টরগুলি উল্টানো হয়েছে princomp। সুতরাং অভিক্ষেপ চলাকালীন, আমার প্রস্তাবিত ডেটা কিছু মাত্রায় সাইন ইন উল্টানো হয়। আমার লক্ষ্য সহগের শ্রেণিবিন্যাস করা। সাইন এখানে এখনও কোন ব্যাপার না?
সিবস জুবিলিং

সুতরাং, যদি কেবলমাত্র আমার পিসিগুলি সহজভাবে বোঝার কারণে, আমি স্কোরগুলির লক্ষণগুলি অদলবদল করতে চাই, এটি কি বৈধ?

13

এই ফোরামটিতে এই প্রশ্নটি অনেক জিজ্ঞাসাবাদ পেয়েছে , তাই আমি @ আরও জানুয়ারির চমৎকার উত্তরটি আরও কিছু সাধারণ বিবেচনার সাথে পরিপূরক করতে চাই।

এক্স1,এক্স2,এক্সz- র1,z- র2,z- রএক্স1z- র1z- র2এক্স12z- র1+ +3z- র223

হেRআমিআমিএনএকটিবনামএকটিRআমিএকটিগুলিএসRগুলিএলএকটিআমিএনগুলি

z- র1

-1-1=1।

উপসংহারটি হ'ল প্রতিটি পিসিএ বা এফএ উপাদানগুলির জন্য, এর স্কোর এবং এর লোডিংয়ের চিহ্নটি নির্বিচারে এবং অর্থহীন। এটি উল্টানো যায় তবে কেবল একই সময়ে স্কোর এবং লোডিং উভয়েরই চিহ্নটি বিপরীত হয়।


এটি সত্য, তবে পিসিএ-তে অনুমানগুলি কী হবে? আমি নিজেই পিসিএ কোডিং করছি, এবং ম্যাটল্যাব অন্তর্নির্মিতের তুলনায় আমার কিছু আইজেনভেেক্টরগুলি উল্টানো হয়েছে princomp। সুতরাং অভিক্ষেপ চলাকালীন, আমার প্রস্তাবিত ডেটা কিছু মাত্রায় সাইন ইন উল্টানো হয়। আমার লক্ষ্য সহগের শ্রেণিবিন্যাস করা। সাইন এখানে এখনও কোন ব্যাপার না?
সিবস জুবিলিং

1
তবুও কিছু যায় আসে না। কেন হবে? উল্টানো ডেটা শ্রেণিবিন্যাস সহ সমস্ত উদ্দেশ্যে নন-ফ্লিপড ডেটার সমান।
অ্যামিবা

ভাল, সব উদ্দেশ্যে নয়। অ্যালগরিদমের মধ্যে ধারাবাহিকতার জন্য, আমিও সত্যিই লক্ষণগুলির সাথে মিল রাখতে চাই। যাইহোক, উপাদানগুলির দিকে তাকানোর সময় এটি সমস্ত ফ্লিপ হয় না। কীভাবে আর সাইনটি বেছে নিচ্ছেন যাতে আমি একই কাজ করতে পারি?
মায়োচ

1
@ মিওচ আমি আপনার নিজস্ব কনভেনশন উদ্ভাবন করার প্রস্তাব দিচ্ছি এবং আর কী করছে তা বের করার চেষ্টা করার বিপরীতে এটি সর্বত্র প্রয়োগ করার পরামর্শ দেব। আপনি প্রথম চিহ্নটি ইতিবাচক, বা মানগুলির অর্ধেকেরও বেশি ধনাত্মক ইত্যাদির মতো চিহ্নটি চয়ন করতে পারেন
অ্যামিবা বলেছেন রিনিস্টেট মনিকা

1
@ ব্যবহারকারীর_আনন কোনও বিপরীত নেই is
অ্যামিবা বলেছেন মনিকাকে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.