টোটাল এসএস এবং এসএস এর মধ্যে কে-ক্লাস্টারিংয়ের অর্থ কী?


10

গুচ্ছ বিশ্লেষণে আমি খুব নতুন। আমি কে-মানে ক্লাস্টারিংয়ের জন্য আর ব্যবহার করছি এবং আমি আশ্চর্য হই যে এই জিনিসগুলি কী। এবং যদি তাদের অনুপাতটি ছোট বা বড় হয় তবে এর চেয়ে ভাল আর কী হতে পারে?

উত্তর:


12

এটি মূলত শ্রেণীবদ্ধের কে-মাধ্যমের সার্থকতার একটি পরিমাপ। এসএস স্পষ্টতই সমষ্টিগুলির স্কোয়ার হিসাবে দাঁড়ায়, সুতরাং এটি বিচ্যুতি "বিটিউন" এবং ডিভ্যান্সের "ইনসাইডের" মধ্যে বিচ্যুত হওয়ার স্বাভাবিক পচন। আদর্শভাবে আপনি এমন একটি ক্লাস্টারিং চান যাতে অভ্যন্তরীণ সংহতি এবং বাহ্যিক বিচ্ছিন্নতার বৈশিষ্ট্য রয়েছে, যেমন বিএসএস / টিএসএস অনুপাতটি 1 এর কাছে আসা উচিত।

উদাহরণস্বরূপ, আর এ:

data(iris)
km <- kmeans(iris[,1:4], 3)

একটি ভাল ফিট নির্দেশ করে 88.4% (0.884) এর একটি বিএসএস / টিএসএস অনুপাত দেয়। আপনার সাবধানে কঠোর হওয়া উচিত, এবং ক্লাস্টারের সংখ্যার বিরুদ্ধে ডাব্লুএসএস প্লট করা সাধারণত একটি ভাল ধারণা, যেহেতু এই সংখ্যাটি আগেই নির্দিষ্ট করা উচিত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.