অ্যাডজাস্টেড র্যান্ড ইনডেক্স বনাম অ্যাডজাস্টেড মিউচুয়াল ইনফরমেশন


10

আমি ক্লাস্টারিং কর্মক্ষমতা মূল্যায়ন করার চেষ্টা করছি। আমি মেট্রিকগুলিতে স্কিসিট-লার ডকুমেন্টেশন পড়ছিলাম । আমি এআরআই এবং এএমআইয়ের মধ্যে পার্থক্য বুঝতে পারি না। আমার কাছে মনে হয় তারা একই কাজ দুটি ভিন্ন উপায়ে করে।

ডকুমেন্টেশন থেকে উদ্ধৃত:

গ্রাউন্ড ট্রুথ ক্লাস অ্যাসাইনমেন্ট লেবেল_ট্রু এবং একই নমুনার লেবেল_প্রেডের আমাদের ক্লাস্টারিং অ্যালগরিদম অ্যাসাইনমেন্টের জ্ঞান দেওয়া, অ্যাডজাস্ট করা র‌্যান্ড সূচক এমন একটি ফাংশন যা দুটি কার্যের মিলকে পরিমিতি উপেক্ষা করে এবং সুযোগকে সাধারণীকরণের সাথে পরিমাপ করে

বনাম

গ্রাউন্ড ট্রুথ ক্লাস অ্যাসাইনমেন্ট লেবেল_ট্রু এবং একই নমুনার লেবেল_প্রেডের আমাদের ক্লাস্টারিং অ্যালগরিদম অ্যাসাইনমেন্টের জ্ঞান দেওয়া, মিউচুয়াল ইনফরমেশন এমন একটি ফাংশন যা আদেশের উপেক্ষা করে দুটি কার্য সম্পাদনের চুক্তিকে পরিমাপ করে ... এএমআই আরও সম্প্রতি প্রস্তাব করা হয়েছিল এবং এর বিরুদ্ধে স্বাভাবিক করা হয়েছে সুযোগ।

আমার ক্লাস্টারিং মূল্যায়নে তাদের দু'জনকেই ব্যবহার করা উচিত বা এটি কি অপ্রয়োজনীয় হবে?


মিঃ র্যান্ড এলোমেলো নয়।
কিট আছে - অ্যানি-মৌসে

উত্তর:


2

তারা এক ডজন এর মধ্যে দু'জন যা ক্লাস্টারিংগুলির তুলনা করার চেষ্টা করে।

তবে তারা সমতুল্য নয়। তারা বিভিন্ন তত্ত্ব ব্যবহার করে।

কখনও কখনও, এআরআই একটি ফলাফল পছন্দ করতে পারে এবং এএমআই অন্যটি। তবে প্রায়শই তারা পছন্দগুলিতে সম্মত হন (সংখ্যায় নয়)।


আপনি এর অর্থ কী: "তারা অগ্রাধিকারে সম্মত হন (সংখ্যায় নয়)?"
al27091

আপনি একাধিক ফলাফল তুলনা যখন।
কিউইট আছে - অ্যানি-মউসে

10

থাম্বের নিয়মটি হ'ল:

  • যখন গ্রাউন্ড ট্রুথ ক্লাস্টারে বড় সমান আকারের ক্লাস্টার থাকে তখন এআরআই ব্যবহার করুন
  • ইউএসএ এএমআই যখন গ্রাউন্ড ট্রুথ ক্লাস্টারিং ভারসাম্যহীন থাকে এবং সেখানে ছোট ক্লাস্টার থাকে

আমি এই বিষয় নিয়ে কাজ করেছি। তথ্যসূত্র: চান্স ক্লাস্টারিং তুলনা ব্যবস্থা জন্য সামঞ্জস্য


আমি কেএমিয়ান্সের জন্য সঠিক সংখ্যক ক্লাস্টার এবং এইচডিবিএসসিএন-র সঠিক ন্যূনতম ক্লাস্টার আকারের সাথে আমার কিছু ডেটাসেটগুলিতে এইচডিবিএসসিএন এবং কে মিন প্রয়োগ করেছি। আমার সমস্যাটি হ'ল এএমআইতে অগ্রগতি এআরআইতে অগ্রগতির সাথে সম্পর্কিত নয়। আমি এএমআইতে 0.3 এবং 0.35 এর গড় পাই যা কম। আমি যথাক্রমে 0: 0.07 এবং 0.01 গড়ের কাছাকাছি এআরআই ফলাফল পাই। এমনকি যেসব ক্ষেত্রে আমি এইচডিবিএসসিএন দিয়ে আরও ভাল এএমআই পেয়েছি, সেখানেও আমার এআরআই স্কোরগুলি খুব কাছাকাছি ছিল অর্থাৎ এইচডিবিএসসিএন কেএমিয়ানদের চেয়ে কম এআরআই উত্পাদন করে এমনকি এএমআই উচ্চতর ক্ষেত্রেও।
রাইজাকিনহো

এএমআই এর জন্য 0.3 এবং 0.35 এর সাথে কি ধরণের ক্লাস্টারিং ফলাফলের সাথে মিল রয়েছে?
সিমোন

1
পেস্টবিন.com/raw/WHvTxbLm এটি এমন একটি ক্ষেত্রে যা আমি বুঝতে পারি না: ভাল এএমআই এর অর্থ আরও ভাল এআরআই এবং তদ্বিপরীত নয়। আমি এক বা অন্যটির তুলনামূলক উন্নতিতে বিশ্বাস করব এমন কোনও কারণ আছে কি? আমার ফলাফলগুলি উন্নত করার জন্য কোন মেট্রিকটি দেখতে হবে তা নিশ্চিত নই (আপনি যে কাগজটি সংযুক্ত করেছেন, আমার বোধ হয় এটি আমার শ্রেণির বিতরণ এএমআই হওয়া উচিত তবে আমি এখনও বিভ্রান্ত)।
ryuzakinho

1
আপনার ক্ষেত্রে, এইচডিবিএসসিএএন ফলাফলটি একটি খুব বড় ক্লাস্টার এবং অনেকগুলি ছোট চিত্র দেখায় যা সংজ্ঞায়িতভাবে ভারসাম্যহীন সমাধান। তাই ডিবিএসসিএএন নিয়ে এএমআই আরও বড়। আপনার মূল সত্যটি সমাধানের চেয়ে আরও সুষম। সুতরাং, আমি সমাধানটি বেছে নিতে এখানে এআরআই ব্যবহার করব। এটি বলেছিল, দেখে মনে হচ্ছে আপনি যে ক্লাস্টারিং সমাধানগুলি পেয়েছেন তা খুব ভাল নয়। আপনার অনেক ক্লাস্টার থাকার কারণে এটি হতে পারে। আপনি যে ক্লাস্টারগুলি চান তা কমিয়ে দিতে পারবেন? বা বিশুদ্ধ দূরত্ব ভিত্তিক ক্লাস্টারিং ব্যবহার না করে অ্যাকাউন্টে নেওয়ার মতো বৈশিষ্ট্যগুলি কী আপনার আছে?
সিমোন

1
আরও গুণগত পরীক্ষার পরে দেখা গেছে যে আমার ব্যবহারের ক্ষেত্রে এএমআই আরও নির্ভরযোগ্য ছিল। প্রকৃতপক্ষে, এএমআই বলেছিল যে এইচডিবিএসসিএন আরও ভাল ছিল এবং আমি এটি সত্যই ভাল পেয়েছি। যদিও আমার একটি বড় শোনার ক্লাস্টার ছিল, অন্য ক্লাস্টারগুলি কেএমইএনএস ক্লাস্টারের চেয়ে খাঁটি ছিল।
রিজাকিনহো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.