আমার কাছে একটি ক্লাস্টারিং অ্যালগরিদম আছে (কে-মানে নয়) ইনপুট প্যারামিটার (ক্লাস্টারের সংখ্যা)। ক্লাস্টারিংয়ের পরে আমি এই ক্লাস্টারিংয়ের মানের কিছু পরিমাণগত পরিমাপ পেতে চাই। ক্লাস্টারিং অ্যালগরিদমের একটি গুরুত্বপূর্ণ সম্পত্তি রয়েছে। জন্য ট = 2 যদি আমি খেতে এন ফলে এই অ্যালগরিদম তাদের মধ্যে কোনো উল্লেখযোগ্য পার্থক্য ছাড়া ডাটা পয়েন্টের আমি ধারণকারী এক থোকা পাবেন ডাটা পয়েন্টের সঙ্গে এক থোকা 1 ডাটা পয়েন্ট। অবশ্যই এটি আমি চাই না। সুতরাং আমি এই ক্লাস্টারিংয়ের যুক্তিসঙ্গততার অনুমান করতে এই গুণমানের পরিমাপটি গণনা করতে চাই। আদর্শভাবে আমি বিভিন্ন কে এর জন্য এই ব্যবস্থাগুলি তুলনা করতে সক্ষম হব। সুতরাং আমি এর পরিসরে ক্লাস্টারিং চালাব এবং সেরা মানের সাথে একটিটি বেছে নেব । আমি কীভাবে এই জাতীয় মান পরিমাপ করব?
হালনাগাদ:
এখানে খারাপ ক্লাস্টারিংয়ের উদাহরণ রয়েছে । আসুন ধরা যাক সমতলের ত্রিভুজ গঠনে একটি বিমানের 3 টি পয়েন্ট রয়েছে। এই পয়েন্টগুলিকে 2 টি ক্লাস্টারে বিভক্ত করা স্পষ্টতই তাদের 1 বা 3 ক্লাস্টারে বিভক্ত করার চেয়ে খারাপ।