তাদের মধ্যে পারস্পরিক সম্পর্কের ভিত্তিতে ক্লাস্টারিং ভেরিয়েবল


23

প্রশ্নাবলী:

  1. আমার একটি বড় পারস্পরিক সম্পর্কের ম্যাট্রিক্স রয়েছে। পৃথক পারস্পরিক সম্পর্ককে ক্লাস্টারিংয়ের পরিবর্তে, আমি একে অপরের সাথে তাদের সম্পর্কের উপর ভিত্তি করে ক্লাস্টার ভেরিয়েবলগুলি করতে চাই, যেমন ভেরিয়েবল এ এবং ভেরিয়েবল বি এর সাথে ভেরিয়েবল সি থেকে জেড এর অনুরূপ সম্পর্ক থাকে তবে A এবং B একই ক্লাস্টারের অংশ হওয়া উচিত be এর একটি ভাল বাস্তব জীবনের উদাহরণ বিভিন্ন সম্পদ শ্রেণি - আন্তঃসম্পর্ক শ্রেণীর পারস্পরিক সম্পর্কের তুলনায় আন্তঃ সম্পদ-শ্রেণীর পারস্পরিক সম্পর্ক বেশি higher

  2. আমি তাদের মধ্যে বৃহত্তর সম্পর্কের পরিপ্রেক্ষিতে ক্লাস্টারিং ভেরিয়েবলগুলিও বিবেচনা করছি, উদাহরণস্বরূপ যখন ভেরিয়েবল A এবং B এর মধ্যে পারস্পরিক সম্পর্ক 0 এর কাছাকাছি থাকে, তখন তারা কমবেশি স্বাধীনভাবে কাজ করে। যদি হঠাৎ করে অন্তর্নিহিত কিছু শর্ত পরিবর্তিত হয় এবং একটি দৃ corre় সম্পর্ক স্থাপন হয় (ধনাত্মক বা নেতিবাচক), আমরা একই ক্লাস্টারের অন্তর্ভুক্ত হিসাবে এই দুটি পরিবর্তনশীল সম্পর্কে ভাবতে পারি। সুতরাং ইতিবাচক পারস্পরিক সম্পর্ক খোঁজার পরিবর্তে, কোনও সম্পর্ক বনাম সম্পর্কের সন্ধান করা হবে। আমি অনুমান করি যে একটি উপমাটি ইতিবাচক এবং নেতিবাচক চার্জযুক্ত কণার একটি গুচ্ছ হতে পারে। যদি চার্জটি 0 এ যায় তবে কণা গুচ্ছ থেকে দূরে চলে যায়। যাইহোক, ইতিবাচক এবং নেতিবাচক উভয় চার্জগুলি ক্লাস্টারগুলি প্রকাশ করতে কণাগুলি আকর্ষণ করে।

এগুলির কিছু খুব স্পষ্ট না হলে আমি ক্ষমা চাই। দয়া করে আমাকে জানান, আমি নির্দিষ্ট বিশদটি পরিষ্কার করব।


1
ফ্যাক্টর বিশ্লেষণ কি কিউএন 1 এর জন্য কাজ করবে না? প্রশ্ন 2 কিছুটা অস্পষ্ট। 'সম্পর্ক' 'পারস্পরিক সম্পর্কের' জন্য প্রতিশব্দ বলে মনে হয় বা সম্পর্কের অন্তত একটি ফর্ম লিনিয়ার সম্পর্ক এবং পারস্পরিক সম্পর্ক এটি ক্যাপচার করে। সম্ভবত, আপনাকে

আপনি যা করতে চান তা জানিয়ে দিয়েছেন। আপনার প্রশ্ন কি? এটি বাস্তবায়ন সম্পর্কে বা আপনার বিশ্লেষণ পদ্ধতির উপযুক্ত কিনা? অথবা অন্য কিছু?
জেরোমি অ্যাংলিম

উত্তর:


14

এখানে bfiডেটাসেট ব্যবহার করে আর-এর একটি সাধারণ উদাহরণ রয়েছে : বিএফআই হ'ল প্রায় 5 টি কারণের মধ্যে 25 টি ব্যক্তিত্বের পরীক্ষামূলক আইটেমের ডেটাসেট।

library(psych)
data(bfi)
x <- bfi 

ভেরিয়েবলের মধ্যে পরম সম্পর্কের উপর ভিত্তি করে ভেরিয়েবলের মধ্যে ইউক্যালিডান দূরত্ব ব্যবহার করে একটি হায়ারিকাল ক্লাস্টার বিশ্লেষণ যেমন পাওয়া যায়:

plot(hclust(dist(abs(cor(na.omit(x))))))

বিকল্প পাঠ ডেনড্রগ্রামটি দেখায় যে কীভাবে সাধারণত তাত্ত্বিকভাবে করা গ্রুপিংগুলি (যেমন, এন (নিউরোটিকিজম) আইটেমগুলি একসাথে করে) অন্যান্য আইটেমগুলির সাথে আইটেমগুলি ক্লাস্টার করে। এটি এটি দেখায় যে কীভাবে গোষ্ঠীর মধ্যে থাকা কিছু আইটেমগুলি আরও অনুরূপ হয় (উদাহরণস্বরূপ, সি 5 এবং সি 1 সি 3 এর সাথে সি 5 এর তুলনায় আরও সমান হতে পারে)। এটি আরও পরামর্শ দেয় যে এন ক্লাস্টার অন্যান্য ক্লাস্টারগুলির সাথে কম মিল।

বিকল্পভাবে আপনি এর মতো একটি স্ট্যান্ডার্ড ফ্যাক্টর বিশ্লেষণ করতে পারেন:

factanal(na.omit(x), 5, rotation = "Promax")


Uniquenesses:
   A1    A2    A3    A4    A5    C1    C2    C3    C4    C5    E1    E2    E3    E4    E5    N1 
0.848 0.630 0.642 0.829 0.442 0.566 0.635 0.572 0.504 0.603 0.541 0.457 0.541 0.420 0.549 0.272 
   N2    N3    N4    N5    O1    O2    O3    O4    O5 
0.321 0.526 0.514 0.675 0.625 0.804 0.544 0.630 0.814 

Loadings:
   Factor1 Factor2 Factor3 Factor4 Factor5
A1  0.242  -0.154          -0.253  -0.164 
A2                          0.570         
A3         -0.100           0.522   0.114 
A4                  0.137   0.351  -0.158 
A5         -0.145           0.691         
C1                  0.630           0.184 
C2  0.131   0.120   0.603                 
C3  0.154           0.638                 
C4  0.167          -0.656                 
C5  0.149          -0.571           0.125 
E1          0.618   0.125  -0.210  -0.120 
E2          0.665          -0.204         
E3         -0.404           0.332   0.289 
E4         -0.506           0.555  -0.155 
E5  0.175  -0.525   0.234           0.228 
N1  0.879  -0.150                         
N2  0.875  -0.152                         
N3  0.658                                 
N4  0.406   0.342  -0.148           0.196 
N5  0.471   0.253           0.140  -0.101 
O1         -0.108                   0.595 
O2 -0.145   0.421   0.125   0.199         
O3         -0.204                   0.605 
O4          0.244                   0.548 
O5  0.139                   0.177  -0.441 

               Factor1 Factor2 Factor3 Factor4 Factor5
SS loadings      2.610   2.138   2.075   1.899   1.570
Proportion Var   0.104   0.086   0.083   0.076   0.063
Cumulative Var   0.104   0.190   0.273   0.349   0.412

Test of the hypothesis that 5 factors are sufficient.
The chi square statistic is 767.57 on 185 degrees of freedom.
The p-value is 5.93e-72 

1
হাই জেরোমি প্রশ্ন: অ্যাবস (কর্ন (...)) এর দূরে নেওয়ার অর্থ কী? একটি কর ম্যাট্রিক্স কি এমন নয় যেখানে একটি বৃহত সংখ্যা একটি সম্পর্ককে আরও বেশি নির্দেশ করে, যখন একটি দূরত্বের ম্যাট্রিক্সে বিপরীতটি সত্য? (আমি সন্দেহ করি যে আমি কিছু অনুপস্থিত, আপনি দয়া করে ব্যাখ্যা করতে পারেন?)
তাল গ্যালি

@ টাল আমার বোধগম্যতা হল ডিস্ট ফাংশনটি ম্যাট্রিক্সের কাছে ইউক্যালিডিয়ান দূরত্ব নিয়েছে, যা এই ক্ষেত্রে একটি পরম সম্পর্কের ম্যাট্রিক্স ছিল। সম্ভবত, পারস্পরিক সম্পর্ক ম্যাট্রিক্স থেকে আরও আক্ষরিক রূপান্তরটি as.dist () ফাংশন হবে যা একটি বিদ্যমান দূরত্বের ম্যাট্রিক্স গ্রহণ করে: যেমন, as.dist (1-অ্যাবস (কর (na.omit (এক্স))))। দেখতে Dist?
Jeromy Anglim

1
1-অ্যাবস (কর ...) ব্যবহার করা আমার কাছে আরও
অর্থবোধ করবে

@ টাল হ্যাঁ আমি রাজী. আমি তাড়াতাড়ি করলাম। এই ক্ষেত্রে দূরত্বের ভেক্টর (1-অ্যাবস করর দিয়ে অ্যাবস করর ইউক্যালিডিয়ান) প্রায় .96 এর সাথে সম্পর্কযুক্ত, তাই এটি খুব বেশি পার্থক্য করে না।
জেরোমি অ্যাংলিম

1
@ টাল ডিস্ট বিকল্প: প্রতিটি ভেরিয়েবলের পরম সম্পর্কের ভেক্টর রয়েছে। আরও অনুরূপ ভেক্টরগুলির সাথে ভেরিয়েবলগুলির সাথে ইউক্লিডীয় দূরত্বের পরিমাণ কম হবে: en.wikedia.org/wiki/Euclidean_distance
জেরোমি অ্যাংলিম

2

যখন ক্লাস্টারিং সম্পর্কিত সম্পর্কগুলি দু'বার দূরত্ব গণনা না করা গুরুত্বপূর্ণ। যখন আপনি পারস্পরিক সম্পর্ক ম্যাট্রিক্স গ্রহণ করেন আপনি মূলত একটি দূরত্ব গণনা করেন। পরম মান 1 দিয়ে আপনি এটি একটি সত্য দূরত্বে রূপান্তর করতে চান।

1-abs(cor(x))

আপনি যখন এই ম্যাট্রিক্সকে একটি দূরত্বের অবজেক্টে রূপান্তর করতে যান, আপনি যদি ডিস্ট ফাংশনটি ব্যবহার করেন তবে আপনি আপনার সম্পর্কের মধ্যবর্তী দূরত্বগুলি গ্রহণ করবেন। পরিবর্তে আপনি সেই as.dist()ফাংশনটি ব্যবহার করতে চান যা আপনার প্রাক-গণনা করা দূরত্বগুলিকে কেবল কোনও "dist"বস্তুতে রূপান্তরিত করবে ।

অ্যালগ্লিম উদাহরণে এই পদ্ধতিটি প্রয়োগ করা

library(psych)
data(bfi)
x <- bfi 
plot(hclust(as.dist(1-abs(cor(na.omit(x))))))

একটি ভিন্ন ডেনড্রোগ্রামে ফলাফল ক্লাস্টার ডেনড্রোগ্রাম

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.