ডিবিএসসিএএন-এর জন্য eps এবং minPts চয়ন করার একটি রুটিন


14

কিছু সাহিত্যের অনুসারে ডিবিএসসিএএন বেশিরভাগ ক্লাস্টারিং অ্যালগরিদমকে উদ্ধৃত করা হয় এবং এটি ঘনত্বের ভিত্তিতে নির্বিচার আকারের ক্লাস্টারগুলি খুঁজে পেতে পারে। এটিতে দুটি প্যারামিটার ইপস রয়েছে (প্রতিবেশের ব্যাসার্ধ হিসাবে) এবং মিনিপটস (নূন্যতম প্রতিবেশী হিসাবে কোনও বিন্দুটিকে মূল বিষয় হিসাবে বিবেচনা করতে হবে) যা আমি বিশ্বাস করি এটি তাদের উপর নির্ভর করে।

এই পরামিতিগুলি বেছে নেওয়ার জন্য কি কোনও রুটিন বা সাধারণভাবে ব্যবহৃত পদ্ধতি আছে?


উত্তর:


11

প্রচুর প্রকাশনা রয়েছে যা এই পরামিতিগুলি চয়ন করার জন্য পদ্ধতিগুলির প্রস্তাব দেয়।

সর্বাধিক উল্লেখযোগ্য হ'ল অপটিক্স, একটি ডিবিএসসিএএন প্রকরণ যা এপসিলন প্যারামিটারটি সরিয়ে দেয়; এটি একটি শ্রেণিবিন্যাসের ফলাফল উত্থাপন করে যা মোটামুটি "প্রতিটি সম্ভাব্য অ্যাপসিলনের সাথে ডিবিএসসিএন চালানো" হিসাবে দেখা যায়।

MinPts জন্য, আমি সুপারিশ না না একটি স্বয়ংক্রিয় পদ্ধতির উপর নির্ভর করে, কিন্তু আপনার উপর ডোমেইন জ্ঞান

একটি ভাল ক্লাস্টারিং অ্যালগরিদম হয়েছে পরামিতি, আপনি আপনার প্রয়োজন কাস্টমাইজ করার অনুমতি দেয়।

আপনি যে পরামিতিটিকে অগ্রাহ্য করেছেন তা হ'ল দূরত্ব ফাংশন। ডিবিএসসিএন-এর জন্য প্রথম কাজটি হ'ল আপনার আবেদনের জন্য একটি ভাল দূরত্বের কার্যকারিতা খুঁজে পাওয়া । প্রতিটি অ্যাপ্লিকেশনের জন্য সেরা ইউক্লিডিয়ান দূরত্বের উপর নির্ভর করবেন না!


যদিও ব্যবহারকারী দূরত্বের ফাংশনটি চয়ন করতে পারে তবে আমি সন্দেহ করি এটি একটি পরামিতি।
মেহরবান

1
অবশ্যই এটা. এটি অন্য কার্নেলাইজড পদ্ধতির জন্য কার্নেল ফাংশনের মতোই প্যারামিটার (আপনি আসলে ডিবিএসসিএএনকে তুচ্ছভাবে এইভাবে কার্নেলাইজ করতে পারেন), এবং আমার অভিজ্ঞতায় অন্যান্য দূরত্ব যেমন ক্যানবেরা বা ক্লার্ক উল্লেখযোগ্যভাবে ফলাফলগুলি উন্নত করতে পারে
কিট আছে - অ্যানি-মৌসে

আমি ক্লাস্টারিংয়ের উপর দূরত্বের কার্যকারিতাটির প্রভাবকে হ্রাস করি না, তবে আমি মনে করি এটি কোনওভাবেই সাধারণ, ডাবসক্যান বা অন্য প্রতিটি ক্লাস্টারিং অ্যালগরিদমের সাথে নির্দিষ্ট নয়; যখন ইপিএস এবং মিনিপটস স্পষ্টভাবে ডাবসস্ক্যান পরামিতি।
মেহরবান

1
প্রচুর অ-দূরত্ব ভিত্তিক অ্যালগরিদমও রয়েছে। এবং আপনি যখন মিনিপটসকে kনিকটতম প্রতিবেশী শ্রেণিবিন্যাসের জন্য যেমন হিসাবে বিবেচনা করেন , তখন আপনি মিনিপটস প্যারামিটারের জন্য একই কথা বলতে পারেন। আমার ধারণা মূল পার্থক্যটি হ'ল দূরত্বের জন্য, "প্রায়শই" বোধগম্য ডিফল্ট থাকে: ইউক্লিডিয়ান দূরত্ব; যদিও মিনিপটসের জন্য মান নির্দিষ্ট করে নির্দিষ্ট হবে।
কিট আছে - অ্যানি-মৌসে

1
অপটিক্স নিজেই আপনাকে পার্টিশন দেয় না, তবে একটি ক্লাস্টার অর্ডার দেয়। পার্টিশনগুলি পেতে, অপটিক্স পেপারে বর্ণিত এক্স এক্সট্রাকশন ব্যবহার করুন। পার্থক্যগুলি বুঝতে প্রতিটি ভেরিয়েন্টের কাগজ দেখুন।
কিট আছে - অ্যানি-মৌসে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.