কে-মিনসের লক্ষ্য হ'ল-ক্লাস্টারের বৈচিত্রটি হ্রাস করা এবং এটি সেন্ট্রয়েডগুলিকে একটি ক্লাস্টারের গড় বিন্দু হিসাবে গণনা করে, সঠিকভাবে রূপান্তর করতে ইউক্লিডিয়ান দূরত্ব ব্যবহার করা প্রয়োজন । অতএব, আপনি যদি কে-মিনগুলি একেবারে ব্যবহার করতে চান তবে আপনাকে অবশ্যই নিশ্চিত করতে হবে যে এটির সাথে আপনার ডেটা ভালভাবে কাজ করে।
প্রতিনিধিত্ব
কে-মিনস এবং সাধারণভাবে ক্লাস্টারিং একই ক্লাস্টারের উদাহরণগুলি একে অপরের সাথে সমান হয় তা নিশ্চিত করে অর্থবোধক গোষ্ঠীতে ডেটা বিভক্ত করার চেষ্টা করে। অতএব, আপনার ডেটা উপস্থাপন করার জন্য আপনার একটি ভাল উপায় প্রয়োজন যাতে আপনি সহজেই একটি অর্থবহ সাদৃশ্য পরিমাপটি গণনা করতে পারেন।
বিভাগগুলি একে অপরের থেকে সামঞ্জস্যপূর্ণ যখন শ্রেণীবদ্ধ ভেরিয়েবলগুলিতে এক-হট এনকোডিং ব্যবহার করা ভাল ধারণা। উদাহরণস্বরূপ, আপনার যদি হালকা নীল, গা dark় নীল এবং হলুদ রঙের হয় তবে ওয়ান-হট এনকোডিং ব্যবহার করা আপনাকে সেরা ফল দিতে পারে না, কারণ গা dark় নীল এবং হালকা নীল সম্ভবত হলদে বর্ণের পরিবর্তে একে অপরের আরও "ঘনিষ্ঠ" হতে পারে।
শ্রেণীবদ্ধ মান "সামঞ্জস্যপূর্ণ" না হলে এবং অর্ডার দেওয়া যেতে পারে, আপনি বিভাগগুলিকে একটি সংখ্যাগত মানও দিতে পারেন। উদাহরণস্বরূপ, ছাগলছানা, কিশোর, প্রাপ্তবয়স্ক, সম্ভবত 0, 1 এবং 2 হিসাবে প্রতিনিধিত্ব করতে পারে কারণ এটি বোধগম্য হবে কারণ একটি কিশোর বয়স্কের চেয়ে শিশু হওয়ার চেয়ে "নিকটতম" হয়।
কে-Medoids
কে-মিন্সের আরও সাধারণ পদ্ধতি হল কে-মেডয়েড। কে-মেডয়েডস কে-মিংস হিসাবে একইভাবে কাজ করে, তবে মূল পার্থক্য হ'ল প্রতিটি ক্লাস্টারের জন্য সেন্ট্রয়েড এমন বিন্দু হিসাবে সংজ্ঞায়িত করা হয় যা দূরত্বের মধ্যে-ক্লাস্টারের যোগফলকে হ্রাস করে। এটি প্রয়োগ করার ফলে আপনি যে কোনও দূরত্ব পরিমাপ করতে চান তা ব্যবহার করতে পারবেন এবং অতএব, আপনি আপনার নিজস্ব কাস্টম পরিমাপ তৈরি করতে পারেন যা কোন বিভাগগুলি নিকটবর্তী বা না হওয়া উচিত তা বিবেচনায় নেবে।