কে-মানে ক্লাস্টার বিশ্লেষণের ফলাফলগুলির একটি সুন্দর প্লট কীভাবে উত্পাদন করা যায়?


77

আমি আর-কে ক্লাস্টারিং-এর জন্য ব্যবহার করছি। আমি কে-মানে চালাতে 14 ভেরিয়েবল ব্যবহার করছি

  • কে-মানে ফলাফলগুলি প্লট করার একটি দুর্দান্ত উপায় কী?
  • কোন বাস্তবায়ন আছে কি?
  • 14 ভেরিয়েবল থাকা ফলাফল কীভাবে জটিল করে তোলে?

আমি জিজি ক্লাসটার নামে কিছু পেয়েছি যা দেখতে দুর্দান্ত দেখাচ্ছে তবে এটি এখনও বিকাশে রয়েছে। আমি সামন ম্যাপিং সম্পর্কে কিছু পড়েছি, তবে এটি খুব ভাল করে বুঝতে পারি নি। এটি একটি ভাল বিকল্প হবে?


1
যদি কোনও কারণে আপনি এই অত্যন্ত ব্যবহারিক সমস্যার জন্য বর্তমান সমাধানগুলি নিয়ে উদ্বিগ্ন হন তবে দয়া করে বিদ্যমান জবাবগুলিতে মন্তব্য যুক্ত করার বিষয়টি বিবেচনা করুন বা আরও প্রসঙ্গে আপনার পোস্ট আপডেট করুন। 40,000 কেসের সাথে কাজ করা এখানে একটি গুরুত্বপূর্ণ তথ্য।
chl

11 ক্লাস এবং 10 ভেরিয়েবলের সাথে আরেকটি উদাহরণ পরিসংখ্যান শিক্ষার উপাদানগুলির 118 পৃষ্ঠাতে ; ভয়ানক তথ্যবহুল নয়।
ড্যানিস

লাইব্রেরি (অ্যানিমেশন) kmeans.ani (আপনার ডেটা, কেন্দ্রগুলি = 2)
কার্তিক পালেপু

উত্তর:


27

আমি এর জন্য সিলুয়েট প্লটটি চাপ দেব, কারণ যখন মাত্রার সংখ্যা 14 হবে তখন আপনি জোড় প্লটগুলি থেকে অনেকগুলি কার্যকর তথ্য পাবেন unlikely

library(cluster)
library(HSAUR)
data(pottery)
km    <- kmeans(pottery,3)
dissE <- daisy(pottery) 
dE2   <- dissE^2
sk2   <- silhouette(km$cl, dE2)
plot(sk2)

এই পদ্ধতির অত্যন্ত উদ্ধৃত এবং সুপরিচিত ( ব্যাখ্যা জন্য এখানে দেখুন )।

রুসিউউ, পিজে (1987) সিলহয়েটস : ক্লাস্টার বিশ্লেষণের ব্যাখ্যা এবং বৈধতার জন্য একটি গ্রাফিকাল সহায়তাজে.কম্পট। Appl। ম্যাথ। , 20 , 53-65।


আমি এই পছন্দ। আমি এটি আরও তাকান। ধন্যবাদ.
জেকুইহুয়া

@ ইউজার 603: আপনি কি আপনার উত্তরের ব্যাখ্যাটির सार জানান? 2.5 বছর আগে আপনি যে লিঙ্কটি দিয়েছেন তা মরে গেছে। নিবন্ধটি এখনও আছে তবে এই কৌশলটির একটি সংক্ষিপ্ত পরিচয় ভাল লাগবে।
স্টেইন

লিঙ্কটি কাগজের দিকে ইশারা করছিল (এটি একটি অ-গেটেড অ্যাক্সেস পয়েন্ট ছিল, যা সত্যই অন্ধকার হয়ে গেছে)।
ব্যবহারকারী 60

আমি এই সিলোয়েট সহ একটি অদ্ভুত প্লট পেয়েছি (বামদিকে ক্লসপ্লট এবং ডানদিকে সিলোয়েট প্লট, এটি কি প্রত্যাশিত?) - i.imgur.com/ZIpPlhT.png
vipin8169

56

এখানে একটি উদাহরণ যা আপনাকে সহায়তা করতে পারে:

library(cluster)
library(fpc)

data(iris)
dat <- iris[, -5] # without known classification 
# Kmeans clustre analysis
clus <- kmeans(dat, centers=3)
# Fig 01
plotcluster(dat, clus$cluster)

# More complex
clusplot(dat, clus$cluster, color=TRUE, shade=TRUE, 
         labels=2, lines=0)

# Fig 03
with(iris, pairs(dat, col=c(1:3)[clus$cluster])) 

পরবর্তী প্লটের উপর ভিত্তি করে আপনি সিদ্ধান্ত নিতে পারেন যে আপনার প্রাথমিক ভেরিয়েবলগুলির মধ্যে কী প্লট করবেন। হতে পারে 14 ভেরিয়েবলগুলি বিশাল, তাই আপনি পূর্বে একটি প্রধান উপাদান বিশ্লেষণ (পিসিএ) চেষ্টা করতে পারেন এবং তারপরে ক্লাস্টার বিশ্লেষণ সম্পাদন করতে পিসিএ থেকে প্রথম দুটি বা তিনটি উপাদান ব্যবহার করতে পারেন।


1
আমি কীভাবে ডিসি 1 এবং ডিসি 2 ব্যাখ্যা করতে পারি তা বুঝতে অক্ষম? আপনি আমাকে সঠিক দিকে নির্দেশ করতে পারেন?
UD1989

1
@ উপসানা দত্ত: দুটি উপাদান হ'ল ডাটাতে নীতি উপাদান বিশ্লেষণ (পিসিএ, ফাংশন প্রিনম্পম্প) প্রয়োগ করার ফলাফল। এগুলি ইনপুট ভেরিয়েবলের লিনিয়ার সংমিশ্রণ যা পর্যবেক্ষণগুলির বেশিরভাগ পরিবর্তনশীলতার জন্য অ্যাকাউন্ট।
rakensi

হাই, আমি বিস্মিত হয়েছি কীভাবে দ্বিতীয় চক্রান্তে উপবৃত্তটি গণনা করা হচ্ছে? কীভাবে এটি নির্ধারণ করে "এই দুটি উপাদান পয়েন্টের পরিবর্তনশীলতার 95.81% ব্যাখ্যা করে"?
mynameisJEFF

@mynameisJEFF আমি ধরে নেব যে এটি সুপ্ত / ক্যানোনিকাল ভেরিয়েবল, ইগেনভ্যালু ইত্যাদি ব্যবহার করছে আপনি ডকুমেন্টেশন যাচাই করতে পারেন, তবে আপনি সাধারণত যখন বাইপলটকে এরূপ লেবেলযুক্ত দেখেন তখন এর অর্থ কী। এটি বলছে যে উপাত্তগুলির মধ্যে পরিবর্তনের 95.81% 2 সুস্পষ্ট ভেরিয়েবল দ্বারা ব্যাখ্যা করা হয়েছে যা ডেটা প্লট করা হয়েছিল। আপডেট - আমি কেবল এটি গুগল করেছি এবং প্রকৃতপক্ষে এটি প্রধান উপাদানগুলি ব্যবহার করে।
হ্যাক-আর

এখানে আপনার "কেন" দরকার? এটি কেবল pairsফাংশনটি ছেড়ে দেওয়া হাতা হবে ।
আনাতোলি স্টেপানিয়ুক

4

আমি এটি করতে সবচেয়ে সহজ উপায়টি নিম্নলিখিত:

X <- data.frame(c1=c(0,1,2,4,5,4,6,7),c2=c(0,1,2,3,3,4,5,5))
km <- kmeans(X, center=2)
plot(X,col=km$cluster)
points(km$center,col=1:2,pch=8,cex=1)

এইভাবে আপনি প্রতিটি ক্লাস্টারের পয়েন্টগুলি আলাদা রঙ এবং তাদের সেন্ট্রয়েড ব্যবহার করে আঁকতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.