আমি কয়েকটি সফ্টওয়্যার নিয়ে কাজ করছি যা বেশ কয়েকটি জিপিএস-ভিত্তিক প্রতিবেদন থেকে বাস্তব বিশ্বের অবস্থানগুলি (ফিড স্পিড ক্যামগুলি) নির্ধারণ করবে । কোনও অবস্থানের প্রতিবেদন করার সময় কোনও ব্যবহারকারী গাড়ি চালাবেন, এইভাবে রিপোর্টগুলি খুব সঠিক। এই সমস্যাটি সমাধান করার জন্য আমাকে একই অবস্থান সম্পর্কে ক্লাস্টার প্রতিবেদন করতে হবে এবং গড় হিসাবে গণনা করতে হয়।
আমার প্রশ্ন সম্পর্কে কিভাবে যারা রিপোর্ট ক্লাস্টারে । আমি প্রত্যাশা-ম্যাক্সিমেশন আলগোরিদিম এবং কে-মানে ক্লাস্টারিং সম্পর্কে পড়েছি , তবে আমি বুঝতে পেরেছিলাম যে আমার আগে থেকেই আসল অবস্থানের সংখ্যা নির্ধারণ করা দরকার।
অন্য কোনও অ্যালগোরিদম রয়েছে, যাদের সত্যিকারের অবস্থানের সঠিক সংখ্যা প্রয়োজন নেই, তবে পরিবর্তে কিছু প্রান্ত শর্ত ব্যবহার করুন (সর্বনিম্ন দূরত্ব)?
একটি প্রতিবেদনে দ্রাঘিমাংশ , অক্ষাংশ এবং নির্ভুলতা (মিটারে) থাকে। নাম বা অন্য কিছু নেই যা সদৃশ সনাক্ত করতে ব্যবহৃত হতে পারে।
আর একটি বাধা হতে পারে যে এটি সাধারণ হবে, সত্যিকারের বিশ্বের অবস্থানের জন্য কেবলমাত্র একটি প্রতিবেদন রয়েছে। এটি ভাল ডেটা থেকে বিদেশীদের আলাদা করতে অসুবিধা সৃষ্টি করে।