আমার বেশ কয়েকটি বিতরণ রয়েছে (নীচের চিত্রে 10 টি বিতরণ)।
প্রকৃতপক্ষে এগুলি হিস্টোগ্রামগুলি: এক্স-অক্ষের উপর 70 টি মান রয়েছে যা একটি দ্রবণে কিছু কণার আকার এবং x এর প্রতিটি মানের জন্য y এর সাথে সম্পর্কিত মান হ'ল কণার অনুপাত যা এর আকার x এর মানের কাছাকাছি is
আমি এই বিতরণগুলি গুচ্ছ করতে চাই। বর্তমানে আমি উদাহরণস্বরূপ ইউক্লিডিয়ান দূরত্ব সহ একটি শ্রেণিবিন্যাসের ক্লাস্টারিং ব্যবহার করি। আমি দূরত্ব পছন্দ করে সন্তুষ্ট না। আমি তথ্য-তাত্ত্বিক দূরত্ব যেমন কুলব্যাক-লেবেলারের চেষ্টা করেছি তবে তথ্যগুলিতে অনেকগুলি শূন্য রয়েছে এবং এটি অসুবিধার কারণ হয়। আপনার কাছে কি কোনও উপযুক্ত দূরত্ব এবং / অথবা অন্য কোনও ক্লাস্টারিং পদ্ধতির প্রস্তাব রয়েছে?