ভৌগলিক অ্যাপ্লিকেশনটিতে ক্লাস্টারের সংখ্যা নির্ধারণ করতে আমি "এল পদ্ধতি" ব্যবহার করতে সক্ষম হয়েছি (যেমন প্রযুক্তিগতভাবে ইউক্লিডিয়ান না হলেও তাত্পর্যপূর্ণভাবে 2 ডি সমস্যা)।
এল পদ্ধতিটি এখানে বর্ণিত হয়েছে:
হায়ারারিকাল ক্লাস্টারিং / বিভাগ বিভাগের অ্যালগোরিদম স্ট্যান সালভাদোর এবং ফিলিপ চ্যানে ক্লাস্টার / বিভাগের সংখ্যা নির্ধারণ
মূলত এটি কে এর বিভিন্ন মানের জন্য ফিটকে মূল্যায়ন করে। একটি "এল" আকৃতির গ্রাফটি গ্রাফের হাঁটু দ্বারা উপস্থাপিত সর্বোত্তম কে মানের সাথে দেখা যায়। হাঁটির পয়েন্টটি সন্ধান করতে একটি সাধারণ দ্বৈত-লাইন সর্বনিম্ন-স্কোয়ার ফিটিং গণনা ব্যবহৃত হয়।
আমি পদ্ধতিটি খুব ধীর পেয়েছি কারণ পুনরাবৃত্ত k-মানে কে এর প্রতিটি মানের জন্য গণনা করতে হয়। এছাড়াও আমি একাধিক রান এবং শেষের দিকে সেরাটি বেছে নিয়ে সবচেয়ে ভাল কাজ করেছে k যদিও প্রতিটি ডেটা পয়েন্টের মাত্র দুটি মাত্রা ছিল, একটি সাধারণ পাইথাগোরিয়ান দূরত্ব ব্যবহার করা যায়নি। সুতরাং এটি গণনা অনেক।
একটি ধারণা হ'ল কে (বলুন) এর অন্যান্য মানকে গণনার অর্ধেক এবং এড়িয়ে যাওয়া বা কে-মানে পুনরাবৃত্তির সংখ্যা হ্রাস করা এবং তারপরে আরও সঠিক ফিটের জন্য ফলাফলটি বক্ররে সামান্য মসৃণ করা। আমি স্ট্যাকওভারফ্লোতে এই সম্পর্কে জিজ্ঞাসা করেছি - আইএমএইচও, স্মুথিং প্রশ্নটি একটি মুক্ত গবেষণা প্রশ্ন হিসাবে রয়ে গেছে।