কে-মানে কোনও দূরত্ব ভিত্তিক ক্লাস্টারিং অ্যালগরিদম নয় ।
কে- এর অর্থ স্কোয়ার অ্যাসাইনমেন্টের ন্যূনতম যোগফলের জন্য অনুসন্ধান , অর্থাত্ এটি total_SS
ক্লাস্টার সেন্টারে পয়েন্ট নির্ধারিত করে অস্বাভাবিক বৈকল্পিক (= ) হ্রাস করে।
কে-মানে রূপান্তর করার জন্য, আপনার দুটি শর্ত প্রয়োজন:
- পুনর্নির্দিষ্ট পয়েন্টগুলি স্কোয়ারের যোগফল হ্রাস করে
- গড় পুনরায় গণনা করা স্কোয়ারের যোগফল হ্রাস করে
যেহেতু কেবলমাত্র সীমাবদ্ধ সংখ্যার সংমিশ্রণ রয়েছে, আপনি এই মানটি অসীমভাবে হ্রাস করতে পারবেন না এবং অ্যালগরিদমকে অবশ্যই কোনও একক স্থানে স্থানীয় সর্বোত্তম রূপান্তর করতে হবে ।
যখনই আপনি অ্যাসাইনমেন্ট ফাংশনগুলি পরিবর্তন করতে চান, আপনার নিজের কুকুরের মতো নিজের লেজ ধাওয়া করার মতো অ্যালগরিদমকে আর শেষ করে না দেওয়ার ঝুঁকি রয়েছে। মূলত উভয় পদক্ষেপের উদ্দেশ্যমূলক কার্যক্রমে একমত হতে হবে। আমরা জানি যে পাটিগণিত গড়টি বর্গক্ষেত্রের যোগফলের ক্ষেত্রে সর্বোত্তম পছন্দ । আর প্রথম পদক্ষেপ, আমরা শুধু কম্পিউট করতে প্রতিটি গড় জন্য এবং পছন্দ করে নিন যেটা সংক্ষিপ্ত। প্রযুক্তিগতভাবে, এখানে কোনও দূরত্বের গণনা নেই । গাণিতিকভাবে, স্কোয়ারের কমপক্ষে যোগফল নির্ধারণ করা স্কুয়ার্ড ইউক্লিডিয়ান দূরত্ব বন্ধ করে দেওয়ার সমান, যা (আপনি যদি কম্পিউটারের জন্য সিপিইউ চক্র নষ্ট করেন ) ন্যূনতম ইউক্লিডিয়ান দূরত্ব অ্যাসাইনমেন্ট সমান হয়। তাই অন্তর্দৃষ্টি জ∑i(xi−μji)2jsqrt
প্রতিটি পয়েন্টকে নিকটতম গড়তে নির্ধারণ করা সঠিক, তবে অপটিমাইজেশন সমস্যাটি কী তা নয়।
between_SS
ক্লাস্টার কেন্দ্রগুলি কতটা পৃথক করা হয়েছে তা পরিমাপ করার জন্য সম্ভবত দুটি উপায়ের মধ্যে বর্গাকার ওজনের যোগফল (দ্রষ্টব্য: ক্লাস্টার কেন্দ্রগুলি, এটি প্রকৃত ক্লাস্টারগুলির সাথে তুলনা করে না - প্রযুক্তিগতভাবে, ক্লাস্টার ভোরোনাই সেল প্রতিবেশী ক্লাস্টার ভোরোনাই সেলকে স্পর্শ করে)।
নোট করুন যে কে-এর সাহায্যে আপনি কে কে বাড়িয়ে নিখরচু ক্লাস্টারিং মান উন্নত করতে পারেন। এখানে পরিমাপ করা গুণমানটি একটি গাণিতিক মান, যা ব্যবহারকারীদের প্রয়োজনীয়তার সাথে মেলে না । আইরিস আসলে একটি বেশ ভাল উদাহরণ, যেখানে কে-মানে প্রায়শই সন্তোষজনক ফলাফলের চেয়ে কম রূপান্তরিত হয়, এমনকি বাহ্যিক তথ্যও দেয় যেখানে ঠিক 3 টি ক্লাস্টার থাকতে হবে।
আপনি যদি কে-মানেগুলির দূরত্ব-ভিত্তিক বৈকল্পিকতা চান তবে কে-মেডোইডগুলি দেখুন । এখানে মধ্যস্থতার সাথে প্রতিস্থাপনের মাধ্যমে কনভার্সেশনটি নিশ্চিত করা হয়েছে:
- প্রতিটি বস্তু নিকটতম ক্লাস্টারে নির্ধারিত হয় (একটি নির্বিচারে দূরত্ব পরিমাপের দ্বারা)
- ক্লাস্টার কেন্দ্রটি ক্লাস্টারের সবচেয়ে কেন্দ্রিয় অবজেক্টে আপডেট করা হয়েছে, অর্থাত্ অন্য সকলের মধ্যে সবচেয়ে ছোট গড় দূরত্বের সাথে।
প্রতিটি পদক্ষেপে, দূরত্বের যোগফল হ্রাস পায়; এখানে সীমাবদ্ধ সংখ্যার সংমিশ্রণ রয়েছে, সুতরাং অ্যালগরিদমটি অবশ্যই কিছু স্থানীয় নূন্যতমে শেষ করতে হবে।