কেন আমরা অন্যান্য অ্যালগরিদমের পরিবর্তে কে-মাধ্যম ব্যবহার করব?


14

আমি কে-মাধ্যম সম্পর্কে গবেষণা করেছি এবং এগুলি আমি পেয়েছি: কে-মেনস হ'ল একটি সহজ অ্যালগরিদম যা জ্ঞাত ক্লাস্টারিং সমস্যাগুলি সমাধান করার জন্য নিরীক্ষণযোগ্য শেখার পদ্ধতি ব্যবহার করে। এটি বড় ডেটাসেটের সাথে সত্যই ভাল কাজ করে।

তবে কে-মিনের অপূর্ণতা রয়েছে যা হ'ল:

  • আউটলিয়ার এবং গোলমালগুলির প্রতি দৃ St় সংবেদনশীলতা
  • অ-বৃত্তাকার ক্লাস্টার আকৃতির সাথে ভাল কাজ করে না - ক্লাস্টারের সংখ্যা এবং প্রাথমিক বীজের মান আগেই নির্দিষ্ট করা দরকার
  • স্থানীয় সর্বোত্তম পাস করার জন্য কম ক্ষমতা।

কে-মানে সম্পর্কে দুর্দান্ত কিছু আছে, কারণ মনে হয় যে কমতিগুলি কে-মাধ্যম সম্পর্কে ভাল জিনিসের বাইরে।

আমাকে শেখান করুন.


3
কোনও ভাল পদ্ধতি বা ভাল অ্যালগরিদম হিসাবে এটি ব্যবহার করা সমস্যার প্রসঙ্গ ছাড়াই কোনও জিনিস নেই Thus সুতরাং আমরা কে-উপায় ব্যবহার করি কারণ এমন সমস্যা রয়েছে যার জন্য কে-মানে একটি অনুকূল সমাধান (;

উত্তর:


8

আরও ভাল বৈশিষ্ট্যযুক্ত অন্যান্য ক্লাস্টারিং অ্যালগরিদমগুলি আরও ব্যয়বহুল হয়ে থাকে। এই ক্ষেত্রে, কে-মানে প্রাক-ক্লাস্টারিংয়ের জন্য দুর্দান্ত সমাধান হয়ে যায়, স্থানটিকে ছোট ছোট সাব-স্পেসগুলিতে বিচ্ছিন্ন করে যেখানে অন্যান্য ক্লাস্টারিং অ্যালগরিদম প্রয়োগ করা যেতে পারে reducing


প্রোগ্রাম ব্যয় হিসাবে আরও ব্যয়বহুল? বা?
প্যাটার্ন সহ সোনার খুলি

5
ধীর এবং স্মৃতি-নিবিড় হিসাবে আরও ব্যয়বহুল।
মার্টিন ও'লিয়ারি

আচ্ছা বুঝলাম. দ্রুত, মজবুত এবং সহজে বোঝা ছাড়া কি অন্য কোনও সুবিধা রয়েছে? এবং যাইহোক @ মার্টিনও'লারি এবং @ জেফারিনো
প্যাটার্ন সহ সোনার খুলি

6

কে-মানে সহজতম। বাস্তবায়ন এবং চালানো। আপনাকে কেবল "কে" বেছে নেওয়া এবং এটি বেশ কয়েকবার চালানো দরকার।

সর্বাধিক চৌকস অ্যালগরিদম (বিশেষত ভালগুলি) দক্ষতার সাথে প্রয়োগ করা (আপনি রানটাইম পার্থক্যে 100x এর উপাদানগুলি দেখতে পাবেন) এবং সেট করার জন্য আরও অনেকগুলি পরামিতি রয়েছে।

অধিকন্তু, বেশিরভাগ লোকের মানের ক্লাস্টার প্রয়োজন হয় না । তারা বাস্তবে তাদের জন্য দূর থেকে কাজ করে খুশি। এছাড়াও, যখন তাদের আরও জটিল ক্লাস্টার ছিল তখন তারা কী করতে পারে তা সত্যই জানে না। কে-মেনস, কোন মডেলগুলি সবচেয়ে সহজ মডেল - একটি সেন্ট্রয়েড - ব্যবহার করে ক্লাস্টারগুলি হ'ল তাদের প্রয়োজন ঠিক এটি: সেন্ট্রয়েডে বিশাল ডেটা হ্রাস ।


0

কে-মানে এক্সচেঞ্জ সাজ্ট অ্যালগরিদমের মতো m সহজেই বোঝা যায়, বিষয়টিতে আসতে সহায়তা করে, তবে কখনও বাস্তবের জন্য কখনও ব্যবহার করা উচিত নয়। এক্সচেঞ্জ বাছাইয়ের ক্ষেত্রে, এমনকি বুদ্বুদ বাছাই করা আরও ভাল কারণ অ্যারে আংশিকভাবে বাছাই করা থাকলে এটি তাড়াতাড়ি থামতে পারে। কে-মানেগুলির ক্ষেত্রে, ইএম অ্যালগরিদম একই অ্যালগরিদম তবে কে-মানেগুলির অভিন্ন বিতরণ অনুমানের পরিবর্তে ক্লাস্টারগুলির জন্য গাউসীয় বিতরণগুলি গ্রহণ করে। যখন সমস্ত ক্লাস্টারে তির্যক কোভেরিয়েন্স ম্যাট্রিক থাকে তখন কে-মানে ইএম এর একটি প্রান্তের কেস। গাউসিয়ান কাঠামোর অর্থ ক্লাস্টারগুলি খুব সুন্দর উপায়ে ডেটাতে নিজেকে সঙ্কুচিত করে দেয়। আপনি সঠিকভাবে প্রশ্নটিতে উত্থাপিত গুরুতর আপত্তিগুলির আশেপাশে এটি পেয়ে যায়। এবং কেএম-এর চেয়ে EM বেশি ব্যয়বহুল নয়, সত্যই। (আমি উভয়ই এক্সেল স্প্রেডশিটে প্রয়োগ করতে পারি)) তবে গুরুতর ক্লাস্টারিং অ্যাপ্লিকেশনগুলির জন্য,

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.