কে-মানে রূপান্তরিত হওয়ার প্রমাণ


20

একটি কার্যভারের জন্য আমাকে একটি প্রমাণ প্রদান করতে বলা হয়েছে যে কে-মানে একটি সীমাবদ্ধ পদক্ষেপে রূপান্তর করে।

এটি আমি লিখেছি:

C

E(C)=xmini=1kxci2
E(C)

পদক্ষেপ 2 এমন পদক্ষেপকে নির্দেশ করে যা প্রতিটি নিকটবর্তী ক্লাস্টার কেন্দ্রের দ্বারা প্রতিটি ডেটা পয়েন্টকে লেবেল করে এবং পদক্ষেপ 3 হল এমন পদক্ষেপ যেখানে কেন্দ্রগুলি একটি গড় গ্রহণের মাধ্যমে আপডেট করা হয়।

সীমাবদ্ধ পদক্ষেপের একটি সংখ্যক পদক্ষেপে রূপান্তর প্রমাণ করার পক্ষে এটি যথেষ্ট নয়। শক্তি কমতে থাকে তবে কেন্দ্রের পয়েন্টগুলি এনার্জিটি খুব বেশি পরিবর্তন না করেই লাফিয়ে উঠতে পারে এমন সম্ভাবনাটি অস্বীকার করে না। অন্য কথায় একাধিক শক্তি মিনিমা থাকতে পারে এবং অ্যালগরিদম তাদের মধ্যে প্রায় লাফিয়ে উঠতে পারে, না?


5
ইঙ্গিত: সেন্টার পয়েন্টের কতগুলি সম্ভব সংগ্রহ হতে পারে?
হোবার

উত্তর:


35

প্রথমত, কে ক্লাস্টারে এন ডাটা পয়েন্টগুলি ভাগ করার জন্য সর্বাধিক উপায় রয়েছে ; এই জাতীয় প্রতিটি পার্টিশনকে "ক্লাস্টারিং" বলা যেতে পারে। এটি একটি বড় তবে সীমাবদ্ধ সংখ্যা। অ্যালগরিদমের প্রতিটি পুনরাবৃত্তির জন্য, আমরা কেবল পুরানো ক্লাস্টারিংয়ের উপর ভিত্তি করে একটি নতুন ক্লাস্টারিং উত্পাদন করি । লক্ষ্য করুনkNNk

  1. যদি পুরানো ক্লাস্টারিং নতুন হিসাবে একই হয়, তবে পরবর্তী ক্লাস্টারিং আবার একই হবে।
  2. নতুন ক্লাস্টারিং যদি পুরান থেকে আলাদা হয় তবে নতুনটির কম দাম হয়

যেহেতু অ্যালগরিদম কোনও ফাংশনকে পুনরায় করে যার ডোমেন সীমাবদ্ধ সেট, তাই পুনরাবৃত্তি অবশ্যই একটি চক্রের মধ্যে প্রবেশ করতে হবে। চক্রের দৈর্ঘ্য চেয়ে বেশি হতে পারে না কারণ অন্যথায় (2) আপনার কাছে এমন কিছু ক্লাস্টারিং থাকবে যার নিজের চেয়ে কম দাম রয়েছে যা অসম্ভব। সুতরাং চক্রটির দৈর্ঘ্য হুবহু 1 হতে হবে । অতএব কে-মানে একটি সীমাবদ্ধ পুনরাবৃত্তিতে রূপান্তর করে।11


Nk

{nk}{nk} kN

6

কিছু যুক্ত করতে: অ্যালগরিদম রূপান্তরিত হয় বা না তা আপনার স্টপ মাপদণ্ডের উপরও নির্ভর করে। যদি আপনি ক্লাস্টারের কার্যভারগুলি আর কোনও পরিবর্তন না করে একবার অ্যালগরিদম বন্ধ করে দেন, তবে আপনি আসলে প্রমাণ করতে পারবেন যে অ্যালগরিদম অগত্যা রূপান্তরিত হয় না (যদি একাধিক সেন্ট্রয়েডের একই দূরত্ব থাকে তবে ক্লাস্টারের অ্যাসাইনমেন্টের কোনও ডিস্ট্রিমেন্টিক টাই ব্রেকার না থাকে)।

এখানে চিত্র বর্ণনা লিখুন

এখানে আপনার কাছে 8 ডেটা-পয়েন্ট (বিন্দু) এবং দুটি সেন্ট্রয়েড (রেড ক্রস) রয়েছে। এখন সবুজ-ডেটা পয়েন্টগুলির বাম এবং ডান সেন্ট্রয়েড উভয়েরই সমান দূরত্ব রয়েছে। নীল তথ্য-পয়েন্টগুলির জন্য এটি একইরকম। আসুন ধরে নেওয়া যাক এই ক্ষেত্রে অ্যাসাইনমেন্ট ফাংশনটি নির্ধারিত নয়। আরও আমরা ধরে নিই যে পুনরাবৃত্তি 1 এ সবুজ বিন্দুগুলি বাম ক্লাস্টারে বরাদ্দ করা হয় এবং নীল বিন্দুগুলি ডান ক্লাস্টারে বরাদ্দ দেওয়া হয়। তারপরে আমরা সেন্ট্রয়েডগুলি আপডেট করি। দেখা যাচ্ছে যে তারা প্রকৃতপক্ষে একই জায়গায় রয়েছেন। (এটি একটি সহজ হিসাব।

তারপরে পুনরাবৃত্তি 2 এ পরিস্থিতি আবার একইরকম দেখায় তবে এখন আমরা ধরে নিই যে আমাদের (সম্পর্কের ক্ষেত্রে) অ-নিরস্তকরণ কার্য ক্রিয়াটি ডান ক্লাস্টারে সবুজ বিন্দু এবং বাম ক্লাস্টারে নীল বিন্দাগুলি নির্ধারণ করে। আবার সেন্ট্রয়েডগুলি পরিবর্তন হবে না।

Iteration 3 আবার পুনরাবৃত্তি 1 এর সমান Thus সুতরাং আমাদের কাছে একটি কেস রয়েছে যেখানে ক্লাস্টারের কার্যনির্বাহী ক্রমাগত পরিবর্তন হয় এবং অ্যালগরিদম (এই স্টপ মানদণ্ডের সাথে) রূপান্তর হয় না।

<

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.