অসমমিতিক দূরত্বের ব্যবস্থাসমূহ নিয়ে ক্লাস্টারিং


9

আপনি কীভাবে একটি অসম্পূর্ণ দূরত্ব পরিমাপের একটি বৈশিষ্ট্য ক্লাস্টার করবেন?

উদাহরণস্বরূপ, ধরা যাক আপনি একটি বৈশিষ্ট্য হিসাবে সপ্তাহের দিনগুলির সাথে একটি ডেটাসেট ক্লাস্টার করছেন - সোমবার থেকে শুক্রবারের দূরত্ব শুক্রবার থেকে সোমবারের দূরত্বের মতো নয়।

ক্লাস্টারিং অ্যালগোরিদমের দূরত্ব পরিমাপের মধ্যে আপনি কীভাবে এটি সংযুক্ত করবেন?

উত্তর:


3

ভবিষ্যতের অতীত থেকে পৃথক হওয়ার কারণে যদি এমএফ দূরত্ব অসম্পূর্ণ হয়, তবে একটি খাঁটি অসম্পূর্ণ ক্লাস্টারিংয়ের জন্য বলা হয়। প্রথমত, একটি অসমমিতিক দূরত্বের ক্রিয়াটি সংজ্ঞায়িত করতে হবে।

একটি দূরত্ব ফাংশন প্রদত্ত অসম্পূর্ণ ক্লাস্টারিংয়ের একটি উপায় হ'ল আসল ডেটাটিকে নতুন স্থানাঙ্ক স্থানে এম্বেড করা। নওহিতো চিনো এবং কেনিচি শিরাইভা, বিহাইভের্মেট্রিকা, 1992 ( পিডিএফ ) দ্বারা "অসমমিতিক এমডিএসের জন্য কিছু অ-দূরত্বের মডেলের জ্যামিতিক কাঠামো" দেখুন । একে বলা হয় এইচসিএম (হার্মিটিয়ান ক্যানোনিকাল মডেল)।

একটি হার্মিটিয়ান ম্যাট্রিক্স খুঁজুন , যেখানে ইগেনভ্যালু এবং আইজেনভেেক্টরগুলি সন্ধান করুন, তারপরে প্রতিটি ইগেনভেেক্টরকে তার সম্পর্কিত ইগন্যাল্যুয়ের বর্গমূল দিয়ে স্কেল করুন।H

Hij=12[d(xi,xj)+d(xj,xi)]+i12[d(xi,xj)d(xj,xi)]

এটি তথ্যকে জটিল সংখ্যার স্পেসে রূপান্তরিত করে। ডেটা এম্বেড হয়ে গেলে, x এবং y অবজেক্টের মধ্যকার দূরত্বটি কেবল x * y, যেখানে * কনজুগেট ট্রান্সপোজ হয়। এই মুহুর্তে আপনি জটিল ভেক্টরগুলিতে কে-মানে চালাতে পারবেন।

স্পেকট্রাল অ্যাসিমেট্রিক ক্লাস্টারিংও করা হয়েছে, স্টেফান এমিলভ আতেভের থিসিসটি দেখুন, "স্পেকট্রাল ক্লাস্টারিং অফ ট্রাজেক্টোরিজ ইন এসিমেট্রি ব্যবহার করে," ইউনিভার্সিটি অফ মিনেসোটা, যা একটি বিশেষ অ্যালগরিদমের জন্য ম্যাটল্যাব কোড দেয়।


1

আপনি কিছুটা গড় (যেমন একটি গাণিতিক গড়ের মতো বা সম্ভাব্যতা বিতরণের জন্য, জেনসেন-শ্যানন ডাইভারজেনের বর্গমূল) নিতে পারেন)


1

বিজ্ঞপ্তি সংক্রান্ত পরিসংখ্যানগুলিতে আপনার নজর রাখা উচিত (আপনি যদি কোনও টিউনিং সপ্তাহের মধ্যে "কাজ করতে চান)


1

যদি আপনার দূরত্বের ফাংশনটি কোনও বৈধ Mercer কার্নেল না হয়, তবে , যেখানে গ্রাম ম্যাট্রিক্স। এক্ষেত্রে কো-ক্লাস্টারিং চাই, একে দ্বি-ক্লাস্টারিংও বলা হয়। এই শ্রেণীর অ্যালগরিদমগুলি সারি এবং কলামগুলির জন্য একই সাথে ক্লাস্টার সূচক তৈরি করে।XXTX

আপনি যে উদাহরণটি দিয়েছেন তা হ'ল ভালভাবে বেছে নেওয়া দূরত্বের মেট্রিকের ফলাফল। একটি আরও ভাল দূরত্বের মেট্রিক|days apart|

সাধারণত আপনার দূরত্ব ফাংশনটি একটি বৈধ Mercer কার্নেল হওয়া উচিত। একটি বৈধ Mercer কার্নেল হ'ল যে কোনও ক্রিয়াকলাপ দুটি পর্যবেক্ষণ গ্রহণ করে যা ধারাবাহিক, প্রতিসম হয় এবং ইতিবাচক নির্দিষ্ট কোভেরিয়েন্স ম্যাট্রিক্স has থাকে ।xD

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.