আমার যদি একটি নির্দিষ্ট ডেটাসেট থাকে তবে dat ডেটাসেটের এলোমেলো নমুনার মাধ্যম ব্যবহার করে গুচ্ছ কেন্দ্রগুলি শুরু করা কতটা স্মার্ট হবে?
উদাহরণস্বরূপ, ধরুন আমি চাই 5 clusters
। আমি মূল ডেটাসেটের 5 random samples
বলি size=20%
। তাহলে আমি কি এই 5 টি এলোমেলো নমুনার প্রত্যেকটির গড় গ্রহণ করতে পারি এবং সেগুলি আমার 5 প্রাথমিক ক্লাস্টার কেন্দ্র হিসাবে ব্যবহার করতে পারি? আমি কোথায় এটি পড়েছি তা জানি না তবে আপনি ধারণা সম্পর্কে আপনারা কী ভাবছেন তা জানতে চাই।
আপডেট: দয়া করে এই থ্রেডটি কে-মানে ক্লাস্টারিংয়ের সূচনাটি দেখুন: বিদ্যমান পদ্ধতিগুলি কী কী? বিভিন্ন সূচনা পদ্ধতি সম্পর্কে সাধারণ আলোচনার জন্য।