একটি সেট থেকে অনুরূপ আইটেম মিলছে


10

আমি আইটেম মেলে চেষ্টা করছি। আইটেমগুলির একটি সেট দেওয়া আমি একে অপরের সাথে কতটা সমান হয় তার 0 থেকে 100 পর্যন্ত একটি স্কেলে র‌্যাঙ্ক করতে পারি। উদাহরণস্বরূপ, আইটেম এন 1 যদি দুধ এবং আইটেম এন 2 এছাড়াও দুধ হয়, তবে এন 1 এবং এন 2 এর মধ্যে মিল 100% হবে। যদি এন 3 সোডা হয়, তবে n 1 এবং n 3 এর মধ্যে সাদৃশ্যটি হতে পারে, সম্ভবত, 80%, ইত্যাদি।এনএন1এন2এন1এন2এন3এন1এন3

আমি আইটেমগুলিকে কীভাবে অনুরূপ আইটেমের গোষ্ঠীতে বিভক্ত করব তা জানার চেষ্টা করছি , তবে এটি একটি চ্যালেঞ্জিং সমস্যা। আমি নিম্নলিখিত ইস্যুতে চলেছি: একটি ঘোড়া গরুর মতো, যা ছাগলের সাথে সমান, যা অংশে ছাগলের পনির সমান, যা পনিরের সাথে সমান, যা ক্র্যাকারগুলির সাথে সম্পর্কযুক্ত। তবে, আমি আশা করব না যে কোনও ঘোড়া ক্র্যাকারদের মতো একই গ্রুপে থাকবে। প্রতিটি আইটেম জুটি ভিত্তিক পারস্পরিক সম্পর্কযুক্ত হতে পারে, তবে শুরু এবং শেষটি নাও হতে পারে।এন

কোন ধারনা?


বিবর্তনীয় জীববিজ্ঞানে এই জাতীয় যুগল ক্লাস্টারিংয়ের ফলাফলগুলিকে বলা হয় ফাইলেজেন্টিক ট্রি , যাতে আপনি এটি আপনার দরকারী অনুসন্ধানের পদগুলিতে সেট করতে পারেন।
হার্ডম্যাথ

উত্তর:


7

আপনি এখানে যা করতে চান তা হ'ল কে ক্লাস্টারে পার্টিশন এন পর্যবেক্ষণ যারা একই ধরণের বৈশিষ্ট্য প্রদর্শন করে। এটিকে ক্লাস্টারিং বলা হয় এবং আপনি এখানে আরও তথ্য পেতে পারেন ।

আপনার ইতিমধ্যে একটি সংখ্যার মিলের পরিমাপ রয়েছে তাই এটি আপনাকে কে-মীনস অ্যালগরিদম ব্যবহার করার বিষয়ে ভাবতে বাধ্য করে , যাতে আপনি বেশ কয়েকটি পদক্ষেপে পরিচালনা করেন:

  • ক্লাস্টার সেন্ট্রয়েড এলোমেলোভাবে শুরু করুন
  • নিকটতম সেন্ট্রয়েডের সাথে সম্পর্কিত ক্লাস্টারে প্রতিটি পর্যবেক্ষণ বরাদ্দ করুন।
  • ক্লাস্টারের উপাদানগুলির নতুন গড় হিসাবে সেন্ট্রয়েডগুলি আপডেট করুন।

সেন্ট্রয়েডগুলি যখন সরে যাওয়া বা একটি নির্দিষ্ট প্রান্তিকের মধ্যে বন্ধ হয়ে যায় তখন আপনি কনভার্জেন্সের জন্য পরীক্ষা করতে পারেন।

এটি নিশ্চিত করবে যে প্রতিটি ক্লাস্টারের আইটেমগুলি কিছুটা সম্পর্কযুক্ত এবং অ্যালগরিদম ("কে") এর ক্লাস্টারের সংখ্যা বাড়িয়ে আপনি আরও সূক্ষ্ম ধরণের ক্লাস্টার পেতে পারেন। ক্লাস্টারের সংখ্যা খুঁজে পাওয়া প্রতিটি সমস্যার উপর নির্ভর করে এবং আমি আপনাকে পরামর্শ দিয়েছি যে আপনার সমস্যার জন্য একগুচ্ছ মূল্যবোধ চেষ্টা করে দেখুন, কীভাবে একসাথে দলবদ্ধ হয়েছে তা দেখুন এবং কী বোঝায় তা দেখুন।

আশা করি এইটি কাজ করবে.


5

আমি মনে করি আপনি যা খুঁজছেন তাকে "গুচ্ছ বিশ্লেষণ" বা "ক্লাস্টারিং" বলা হয়। অনেক বিভিন্ন অ্যালগরিদম বিদ্যমান। আপনার ক্ষেত্রে, আপনি কিছু "কানেক্টিভিটি ক্লাস্টারিং" চাইবেন, অর্থাত্ প্রতিটি দুটির সাথে সংযুক্ত এমন কোনও সংস্থার উপর ভিত্তি করে গ্রুপ উপাদানগুলি।

সাইকিটস.লার্ন (পাইথন কোড) এর ক্লাস্টারিং অ্যালগরিদম এবং সেখানে উল্লিখিত উল্লেখগুলি দেখুন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.