ক্লাস্টার বিশ্লেষণের সবচেয়ে বড় সমস্যাটি হ'ল আমরা যখন বিভিন্ন ক্লাস্টারিং পদ্ধতির ভিত্তিতে (শ্রেণিবদ্ধ ক্লাস্টারিংয়ের বিভিন্ন লিঙ্কেজ পদ্ধতি সহ) ব্যবহার করি তখন বিভিন্ন উপসংহার পেতে পারি ।
আমি এ সম্পর্কে আপনার মতামত জানতে চাই - আপনি কোন পদ্ধতিটি নির্বাচন করবেন এবং কীভাবে। কেউ বলতে পারে "ক্লাস্টারিংয়ের সেরা পদ্ধতিটি যা আপনাকে সঠিক উত্তর দেয়"; তবে আমি জবাবে প্রশ্ন তুলতে পারি যে ক্লাস্টার বিশ্লেষণটি একটি অপ্রচলিত কৌশল বলে মনে করা হচ্ছে - তবে আমি কীভাবে জানব যে কোন পদ্ধতি বা লিঙ্কেজটি সঠিক উত্তর?
সাধারণভাবে: একটি ক্লাস্টারিং কি নির্ভর করতে যথেষ্ট শক্তিশালী? অথবা আমাদের একটি দ্বিতীয় পদ্ধতি প্রয়োজন এবং উভয়ের উপর ভিত্তি করে একটি ভাগ ফলাফল পেতে পারি?
আমার প্রশ্নটি কেবল ক্লাস্টারিং পারফরম্যান্সকে বৈধতা / মূল্যায়ন করার সম্ভাব্য উপায়গুলি সম্পর্কে নয় , তবে এটি আরও বিস্তৃত - আমরা কোন ক্লাস্টারিং পদ্ধতি / অ্যালগোরিদমকে অন্য কোনওটির চেয়ে পছন্দ / পছন্দ করি । এছাড়াও, যখন আমরা আমাদের ডেটা ক্লাস্টার করার জন্য কোনও পদ্ধতি নির্বাচন করি তখন কি আমাদের সাধারণ সতর্কতা রয়েছে ?
আমি জানি যে এটি খুব সাধারণ প্রশ্ন এবং উত্তর দেওয়া খুব কঠিন। আমি কেবল এটি জানতে চাই যদি আপনার সম্পর্কে এই বিষয়ে আরও জানতে আমার কোনও মন্তব্য বা কোনও পরামর্শ বা কোনও পরামর্শ আছে কিনা।