পৃথকযোগ্য ডেটার জন্য কে-মানে ব্যতীত ক্লাস্টারিং আনুষ্ঠানিককরণ


11

রিয়েল ওয়ার্ল্ডের ডেটাতে কখনও কখনও প্রাকৃতিক সংখ্যক ক্লাস্টার থাকে (কিছু জাদু কে-এর চেয়ে কম ক্লাস্টারটিতে এটি ক্লাস্টার করার চেষ্টা করলে নাটকীয়ভাবে ক্লাস্টারিং ব্যয় ঘটাতে পারে)। আজ আমি ডাঃ অ্যাডাম মায়ারসনের একটি বক্তৃতায় অংশ নিয়েছি এবং তিনি এই ধরণের ডেটা "পৃথকযোগ্য ডেটা" হিসাবে উল্লেখ করেছিলেন।

কে-মানে ব্যতীত কিছু ক্লাস্টারিং আনুষ্ঠানিকতা কী কী, এটি আলগোরিদিমগুলি (আনুমানিক বা হিউরিস্টিক্স) ক্লাস্টারিংয়ের পক্ষে উপযোগী হতে পারে যা ডেটাতে প্রাকৃতিক পৃথকীকরণকে কাজে লাগায়?

উত্তর:


11

সাম্প্রতিক এক মডেলটি এমন ধারণাটি ধারণ করার চেষ্টা করছেন বালকান, ব্লুম এবং গুপ্ত'৯৯। তারা বিভিন্ন ক্লাস্টারিং উদ্দেশ্য জন্য আলগোরিদিম দিতে ডেটা সন্তুষ্ট একটি নির্দিষ্ট ধৃষ্টতা: যথা যে যদি ডাটা যেমন যে কোনো হয় ক্লাস্টারিং উদ্দেশ্য জন্য -approximation হয় ε অনুকূল ক্লাস্টারিং করার -close, তারপর তারা দক্ষ আলগোরিদিম একটি প্রায় খোঁজার জন্য দিতে পারেন -পস্টিমাল ক্লাস্টারিং, এমনকি মানগুলির জন্য যা অ্যাপপ্রক্সিমেশন সন্ধান করা হয় এনপি-হার্ড। এটি ডেটাটি কোনওভাবে "দুর্দান্ত" বা "পৃথকযোগ্য" হওয়া সম্পর্কে ধারণা। লিপটনের এ সম্পর্কে একটি দুর্দান্ত ব্লগ পোস্ট রয়েছে।ε

বিলু এবং লিনিয়াল '10 দ্বারা একটি কাগজে প্রদত্ত ডেটা সম্পর্কিত একই ধরণের শর্ত হ'ল পার্টলুথ-স্ট্যাবিলিটি। মূলত, তারা যে যদি ডাটা যেমন যে অনুকূল ক্লাস্টারিং ডেটা (কিছু প্যারামিটার দ্বারা বিচলিত হয় না বদলায় দেন বৃহৎ যথেষ্ট মান জন্য) , এক দক্ষতার অনুকূল ক্লাস্টারিং মূল ডেটার জন্য খুঁজে পেতে পারেন, এমনকি সমস্যাটি সাধারণভাবে এনপি-হার্ড হলেও। এটি স্থিতিশীলতা বা ডেটা পৃথককরণের অন্য ধারণা।αα

আমি নিশ্চিত যে এখানে পূর্ববর্তী কাজ এবং প্রাসঙ্গিক ধারণা রয়েছে তবে এটি আপনার প্রশ্নের সাথে সম্পর্কিত কিছু সাম্প্রতিক তাত্ত্বিক ফলাফল।


8

ওস্ট্রোভস্কি এট আল এবং আর- আর্থার এবং ভ্যাসিলভিটস্কি দ্বারা কে- মানেগুলির আচরণ সম্পর্কিত কাজগুলি ছাড়াও ইউক্যালিডিয়ান কে-মিডিয়ান এবং কে- মানেগুলির উপর একটি তাত্ত্বিক কাজ রয়েছে যা "লিনিয়ার" সময়ের আলগোরিদিমগুলিকে ক্লাস্টারিংয়ের অধীনে নিয়ে আসে এই সূত্র। এই পরবর্তীকর্মগুলির সম্পর্কে আকর্ষণীয় বিষয় হ'ল তারা বিশ্লেষণের একটি সরঞ্জাম হিসাবে পৃথকীকরণকে ব্যবহার করে, তবে তথ্যগুলিতে এটির প্রয়োজন হয় না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.