আপনি আপনার দূরত্বের ম্যাট্রিক্সকে কাঁচা ডেটাতে পরিণত করতে পারেন এবং এগুলি কে-মিনস ক্লাস্টারিংয়ে ইনপুট করতে পারেন। পদক্ষেপগুলি নিম্নরূপ হবে:
1) আপনার এন পয়েন্টের মধ্যে দূরত্ব অবশ্যই ইউক্লিডিয়ান স্কোয়ারযুক্ত হওয়া উচিত। ম্যাট্রিক্সের " ডাবল সেন্টারিং " সম্পাদন করুন : প্রতিটি উপাদান থেকে সাবস্ট্রাক্ট সারি অর্থ; ফলস্বরূপ, প্রতিটি উপাদান থেকে স্তর কলাম মানে; ফলস্বরূপ, প্রতিটি উপাদান ম্যাট্রিক্স গড় যোগ; বিয়োগ বিভক্ত করে বিভক্ত করুন ২. আপনার এখন যে ম্যাট্রিক্স রয়েছে সেটি হল আপনার পয়েন্টগুলির মধ্যে এসএসসিপি (যোগফলের সমষ্টি এবং ক্রস-প্রোডাক্ট) ম্যাট্রিক্স যেখানে এন পয়েন্টগুলির মেঘের জ্যামিতিক কেন্দ্রে উত্পন্ন হয়। ( এখানে ডাবল সেন্টারিংয়ের ব্যাখ্যা পড়ুন ))
২) সেই ম্যাট্রিক্সে পিসিএ (প্রধান উপাদান বিশ্লেষণ) সম্পাদন করুন এবং এনএক্সএন উপাদান লোডিং ম্যাট্রিক্স পান। এর সর্বশেষ কলামগুলির কয়েকটি সম্ভবত 0 টি হতে পারে - তাই এগুলি কেটে দিন। আপনি এখন যা থাকছেন তা আসলে মূল উপাদান স্কোরগুলি, আপনার মেঘের মাধ্যমে অক্ষের মতো পাস হওয়া মূল উপাদানগুলির দিকে আপনার এন পয়েন্টগুলির স্থানাঙ্ক। এই ডেটা কে-ইনস ইনপুট জন্য উপযুক্ত কাঁচা ডেটা হিসাবে বিবেচনা করা যেতে পারে।
পিএস যদি আপনার দূরত্বগুলি জ্যামিতিকভাবে স্কোয়ারড ইউক্লিডিয়ানগুলি সঠিক না হয় তবে আপনি সমস্যার মুখোমুখি হতে পারেন: এসএসসিপি ম্যাট্রিক্স ইতিবাচক (আধা) নির্দিষ্ট নাও হতে পারে। এই সমস্যাটি বিভিন্ন উপায়ে মোকাবেলা করা যেতে পারে তবে নির্ভুলতার ক্ষতিতে।