শ্রেণিবিন্যাসের ক্লাস্টারিংয়ের জন্য বৈধ হওয়ার জন্য কি কোনও দূরত্বকে "মেট্রিক" হতে হবে?


9

আমাদের বলুন যে আমরা একটি আইটেমের মধ্যে একটি দূরত্ব, যা কোনও মেট্রিক নয় তা সংজ্ঞায়িত করি ।

এই দূরত্বের ভিত্তিতে আমরা এরপরে একটি Agglomerative হায়ারার্কিকাল ক্লাস্টারিং ব্যবহার করি ।

অর্থপূর্ণ ফলাফল পেতে আমরা কি প্রতিটি পরিচিত অ্যালগরিদম (একক / সর্বাধিক / অ্যাভেরেজ লিঙ্কেজ ইত্যাদি) ব্যবহার করতে পারি? বা অন্যভাবে বলতে গেলে, দূরত্বটি মেট্রিক না হলে এগুলি ব্যবহারে সমস্যা কী?


আপনার ক্ষেত্রে "আইটেম" কি? (আমি সাইকোমেট্রিক্সের সাথে এর কিছু আছে কিনা তা জিজ্ঞাসা করছি কারণ যদি এটি হয় তবে আমি আইটেম ক্লাস্টারিং বা ডাব্লু। হায়ারারিকিকাল ক্লাস্টার বিশ্লেষণ এবং টেস্টের অভ্যন্তরীণ কাঠামো , এমবিআর (1979) 14 এ একবার দেখার পরামর্শ দিচ্ছি : 57।)
chl

উত্তর:


7

দূরত্বের প্রয়োজনীয়তা হায়ারারিকাল ক্লাস্টারিংয়ের পদ্ধতির উপর নির্ভর করে। একক, সম্পূর্ণ, গড় পদ্ধতির নন-নেতিবাচক এবং প্রতিসাম্য হতে দূরত্ব প্রয়োজন। জ্যামিতিকভাবে অর্থবহ ফলাফল অর্জনের জন্য ওয়ার্ড, সেন্ট্রয়েড, মিডিয়ান পদ্ধতিগুলির ইউক্লিডিয়ান (যা মেট্রিকের চেয়েও সংকীর্ণ সংজ্ঞা) দূরত্ব প্রয়োজন।

(তার দূরত্বের ম্যাট্রিক্স দ্বিগুণভাবে কেন্দ্র করে [আমার জবাবটি এখানে দেখুন ] এবং এগেনভ্যালুগুলি দেখুন কিনা তা পরীক্ষা করতে পারে ; যদি কোনও নেতিবাচক ইগেনভ্যালু না পাওয়া যায় তবে দূরত্ব ইউক্যালিডিয়ান স্পেসে রূপান্তরিত করে))


ধন্যবাদ। আরও প্রশ্ন: ত্রিভুজ বৈষম্য কি একক, সম্পূর্ণ, গড় পদ্ধতির জন্য ধারণ করে? এবং যদি কিছু দূরত্ব (উদাহরণস্বরূপ) প্রতিসম নয়, তবে এই পদ্ধতিগুলিতে এটি কোন সমস্যা সৃষ্টি করে? (ধন্যবাদ!)
তাল গ্যালি

1
ধ্রুপদী শ্রেণিবদ্ধ ক্লাস্টারিং পদ্ধতিগুলি প্রতিসম ম্যাট্রিক্স ব্যতীত কিছুই গ্রহণ করতে পারে না : A থেকে B = B থেকে A পর্যন্ত একটি দুরত্ব (অপ্রতিদ্বন্দ্বী গুগল করতে পারেন) বিশেষ অন্যান্য পদ্ধতি বিদ্যমান। ত্রিভুজাকার বৈষম্য হিসাবে - আপনি যে পদ্ধতিগুলি উল্লেখ করেছেন এটির জন্য এটি প্রয়োজনীয় শর্ত নয়। (তবে, সাধারণ জ্ঞান "দূরত্ব "টিকে অসমতার সাথে স্মরণ করে বলে মনে করে, তাই এটি অনুপস্থিত থাকলে এটি চাপিয়ে দেওয়া বিবেচনা করা উচিত it এটি করার জন্য, পুনরাবৃত্তভাবে দূরত্বগুলিতে একটি ছোট ধ্রুবক যুক্ত করুন এবং পরীক্ষা করুন And এটি তাহলে আপনি শীঘ্রই ইউক্লিডিয়ান দূরত্বে পৌঁছে
যাবেন

5

না, দূরত্বটি কোনও মেট্রিক হতে হবে না। এটি উদাহরণস্বরূপ, একটি আল্ট্রামেট্রিক হতে পারে:

d(A,B)max(d(A,C),d(B,C))

ক্লাস্টারিং অ্যালগরিদমের ক্রমাগত পদক্ষেপগুলি থেকে প্রাপ্ত আলট্রাসেট্রিক দূরত্বগুলি ডেনড্রোগ্রামগুলি ব্যবহার করে উপস্থাপন করা যেতে পারে, যা আপনি এই প্রসঙ্গে দেখে থাকতে পারেন।


ধন্যবাদ হংক আমি মনে করি যে কিছু উপাদানকে ক্লকটি রূপান্তরিত করার পদ্ধতিগুলি ডেনড্রোগ্রাম আলটমেট্রিক হিসাবে দাবি করে - আমি আপনাকে ক্ষতিকারক হিসাবে লিখেছি যা এটি করা উচিত do যে কোনও ইভেন্টে, উত্তরের জন্য আপনাকে ধন্যবাদ।
তাল গালিলি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.