k
ব্যাখ্যা এবং স্পষ্টতার স্বাচ্ছন্দ্যের জন্য আমি ক্লাস্টারিং বুটস্ট্র্যাপ করব।
সাধারণভাবে, আপনি আপনার সমাধানের স্থায়িত্ব পরিমাপ করতে এ জাতীয় পুনরায় মডেল ক্লাস্টারিংগুলি ব্যবহার করতে পারেন: এটি কি খুব কমই বদলে যায় বা এটি সম্পূর্ণরূপে পরিবর্তিত হয়?
যদিও আপনার কোনও গ্রাউন্ড সত্য নেই, আপনি অবশ্যই সেই ক্লাস্টারির তুলনা করতে পারেন যা একই পদ্ধতির বিভিন্ন রানের ফলাফল (পুনরায় মডেলিং) বা বিভিন্ন ক্লাস্টারিং অ্যালগরিদমের ফলাফলগুলি যেমন ট্যাবলেট দ্বারা:
km1 <- kmeans (iris [, 1:4], 3)
km2 <- kmeans (iris [, 1:4], 3)
table (km1$cluster, km2$cluster)
# 1 2 3
# 1 96 0 0
# 2 0 0 33
# 3 0 21 0
গুচ্ছগুলি নামমাত্র হওয়ায় তাদের ক্রম ইচ্ছামত পরিবর্তন হতে পারে। তবে এর অর্থ হ'ল আপনাকে আদেশটি পরিবর্তন করার অনুমতি দেওয়া হয়েছে যাতে ক্লাস্টারগুলি অনুরূপ হয়। তারপরে তির্যক * উপাদানগুলি একই ক্লাস্টারে নির্ধারিত কেসগুলি গণনা করে এবং অফ-ডায়াগোনাল উপাদানগুলি কীভাবে কার্যভার পরিবর্তন হয় তা দেখায়:
table (km1$cluster, km2$cluster)[c (1, 3, 2), ]
# 1 2 3
# 1 96 0 0
# 3 0 21 0
# 2 0 0 33
আমি বলব যে প্রতিটি পদ্ধতিতে আপনার ক্লাস্টারিং কতটা স্থিতিশীল তা প্রতিষ্ঠিত করতে পুনরায় মডেলিং ভাল। তা ছাড়া ফলাফলগুলি অন্যান্য পদ্ধতির সাথে তুলনা করতে খুব বেশি অর্থবোধ করে না।
i,i
আপনি কে-ফোল্ড ক্রস বৈধকরণ এবং কে-মানে ক্লাস্টারিং মিশ্রিত করছেন না, আপনি?