আমি আপনাকে একটি অনুমান অনলাইন ক্লাস্টারিং অ্যাপ্লিকেশনটির একটি উদাহরণ দেখাব:
সময় n পয়েন্ট 1,2,3,4 নীল ক্লাস্টার এ বরাদ্দ করা হয় এবং পয়েন্ট খ, 5,6,7 রেড ক্লাস্টার বি বরাদ্দ করা হয়।
সময় n + 1 এ একটি নতুন পয়েন্ট a প্রবর্তিত হয় যা নীল ক্লাস্টার A এর জন্য নির্ধারিত হয় তবে এটি বিন্দু B কে নীল ক্লাস্টার A তেও নির্ধারিত করে।
শেষ পয়েন্টগুলিতে 1,2,3,4, a, b এ এর এবং পয়েন্ট 5,6,7 বি এর সাথে রয়েছে আমার কাছে এটি যুক্তিসঙ্গত বলে মনে হয়।
প্রথম নজরে যা সহজ বলে মনে হচ্ছে তা আসলে কিছুটা জটিল - সময়ের ধাপ জুড়ে শনাক্তকারীদের বজায় রাখতে। আমি আরও একটি সীমান্তরেখা উদাহরণ দিয়ে এই বিষয়টি পরিষ্কার করার চেষ্টা করি:
সবুজ বিন্দু দুটি নীল এবং দুটি লাল পয়েন্টকে একটি ক্লাস্টারে একীভূত করবে যা আমি নির্বিচারে নীল রঙিন করার সিদ্ধান্ত নিয়েছি - মনে মনে এটি ইতিমধ্যে আমার মানবিক হিউরিস্টিকাল চিন্তাভাবনা!
এই সিদ্ধান্ত নিতে কোনও কম্পিউটারকে নিয়ম ব্যবহার করতে হবে। উদাহরণস্বরূপ, যখন পয়েন্টগুলি একটি ক্লাস্টারে একীভূত হয় তখন ক্লাস্টারের পরিচয় সংখ্যাগরিষ্ঠ দ্বারা নির্ধারিত হয়। এই ক্ষেত্রে আমরা একটি ড্রয়ের মুখোমুখি হব - নীল এবং লাল উভয়ই নতুন (এখানে নীল রঙের) ক্লাস্টারের জন্য বৈধ পছন্দ হতে পারে।
সবুজ একটি কাছাকাছি পঞ্চম লাল পয়েন্ট কল্পনা করুন। তারপরে সংখ্যাগরিষ্ঠটি লাল হবে (3 লাল বনাম 2 নীল) তাই লাল নতুন ক্লাস্টারের জন্য ভাল পছন্দ হবে - তবে এটি ডানদিকের ক্লাস্টারের জন্য লাল রঙের এমনকি আরও পরিষ্কার পছন্দটির বিরোধিতা করবে কারণ এটি লাল হয়েছে এবং সম্ভবত সেভাবেই থাকতে হবে ।
আমি এই সম্পর্কে চিন্তা করা মাতাল মনে। দিনের শেষে আমি অনুমান করি যে এর জন্য কোনও নিখুঁত নিয়ম নেই - বরং কিছু স্থিতিশীলতা ক্রাইটেরিয়াকে অনুকূল করে তোলা হরিস্টিক্স।
এটি অবশেষে আমার প্রশ্নের দিকে নিয়ে যায়:
- এই "সমস্যা" এর কোনও নাম রয়েছে যা এটি উল্লেখ করা যেতে পারে?
- এটির জন্য "স্ট্যান্ডার্ড" সমাধান এবং ...
- ... এর জন্য কি আর প্যাকেজও থাকতে পারে?
পুনরাবৃত্তি ক্লাস্টারিং মধ্যে ক্লাস্টার পরিচয় যুক্তিসঙ্গত উত্তরাধিকার