বিশুদ্ধতা গণনা কিভাবে?


16

গুচ্ছ বিশ্লেষণে আমরা কীভাবে বিশুদ্ধতা গণনা করব? সমীকরণ কি?

আমার জন্য এটি করার জন্য আমি কোনও কোড খুঁজছি না।

এখানে চিত্র বর্ণনা লিখুন

আসুন ক্লাস্টার কে, এবং সি জে ক্লাস জে থাকুক।ωkcj

তাহলে কি বিশুদ্ধতা কার্যত নির্ভুল হয়? দেখে মনে হচ্ছে নমুনা আকারের তুলনায় ক্লাস্টারে সত্যিকার অর্থে শ্রেণিবদ্ধ শ্রেণির পরিমাণের যোগফল দেওয়া হচ্ছে।

সমীকরণ উত্স

প্রশ্ন আউটপুট এবং ইনপুট মধ্যে সম্পর্ক কি?

যদি সত্যিই ইতিবাচক (টিপি), সত্যিকারের নেতিবাচক (টিএন), মিথ্যা পজিটিভ (এফপি), মিথ্যা নেতিবাচক (এফএন) থাকে। এটি কি ?Purity=TPK(TP+TN+FP+FN)


3
আপনার যদি কেবলমাত্র একটি দ্রুত সংজ্ঞা প্রয়োজন: ক্লাস্টারিং বিশুদ্ধতার উপরে শীর্ষ Google অনুসন্ধান ** লিঙ্কগুলি এখানে একটি গাণিতিক সংজ্ঞা দেয়। (** আমার জন্য, কমপক্ষে - আপনার স্বতন্ত্র ফলাফলগুলি পৃথক হতে পারে)
গ্লেন_বি -রিনস্টেট মনিকা

'বিশুদ্ধতা' বলতে আপনার অর্থ কী তা আমার কোনও ধারণা নেই তবে ডেভিড কলকোউন তাঁর 'বায়োস্টাটিক্স (১৯ on১)' শীর্ষক পাঠ্যপুস্তক বক্তৃতা (১৯ 1971১) -এর ১১.১-১১১৪ বইয়ের পিপিতে দ্বিপদী নমুনার উদাহরণ হিসাবে "হৃদয়ের বিশুদ্ধতার কালো জাদুকরী উপসাগর" ব্যবহার করেছেন যা লেখকের ওয়েবসাইট থেকে বিনামূল্যে পিডিএফ হিসাবে উপলভ্য: dcscience.net এমনকি এটি যদি আপনার প্রশ্নের সাথে অপ্রাসঙ্গিক হয় তবে এটি দুর্দান্ত গল্প।
মাইকেল লিউ

শ্রেণিবদ্ধ গাছগুলিতে অপরিষ্কার পরিমাপের জন্য কয়েকটি কার্যকারিতা হ'ল: পুনরায় প্রতিষ্ঠানের ত্রুটি, জিনি-সূচক এবং এনট্রপি। (শ্রেণিবিন্যাস গাছগুলি একটি নির্দিষ্ট আকারের ক্লাস্টারিং সম্পাদন করে, তাই আমি মনে করি এটি প্রাসঙ্গিক হওয়া উচিত)) আশা করি এটি সহায়তা করে!
অ্যাঞ্জেলফ 10

উত্তর:


26

গুচ্ছ বিশ্লেষণের প্রসঙ্গে শুদ্ধি হ'ল গুচ্ছ মানের একটি বাহ্যিক মূল্যায়ন মাপদণ্ড। এটি ইউনিটের পরিসীমা [০.১.১] তে সঠিকভাবে শ্রেণিবদ্ধ করা সামগ্রীর (ডাটা পয়েন্ট) সংখ্যার শতাংশ।

Purity=1Ni=1kmaxj|citj|

যেখানে N = বস্তু সংখ্যা (ডাটা পয়েন্টের), k = ক্লাস্টার সংখ্যা, ci একটি ক্লাস্টার হয় C , এবং tj শ্রেণীবিন্যাস যা ক্লাস্টার, সর্বোচ্চ গণনা হয়েছে ci

যখন আমরা "সঠিকভাবে" বলি যা এর দ্বারা বোঝা যায় যে প্রতিটি ক্লাস্টার ci একরকম অবজেক্টের একটি গ্রুপকে একই বর্গ হিসাবে চিহ্নিত করেছে যা স্থল সত্য নির্দেশ করেছে। আমরা একেবারে সত্য শ্রেণীবিন্যাস ব্যবহার ti নিয়োগ শুদ্ধি পরিমাপ হিসাবে যারা বস্তুর অবশ্য করতে যাতে আমরা জানতে পারি আবশ্যক যা ক্লাস্টার ci যা স্থল সত্য শ্রেণীবিন্যাস মানচিত্র ti । যদি 100% নির্ভুল ছিল তারপর প্রতিটি ci ঠিক 1 ম্যাপ হবে ti , কিন্তু বাস্তবে আমাদের ciciticitimax সমীকরণের থেকে আসে।

citi

   |  T1 |  T2  |  T3
---------------------
C1 |  0  |  53  |  10
C2 |  0  |  1   |  60
C3 |  0  |  16  |  0

তারপরে প্রতিটি ক্লাস্টারের জন্য আমি, এর সারি থেকে সর্বাধিক মান নির্বাচন করুন, তাদের একত্রে যোগ করুন এবং শেষ পর্যন্ত ডেটা পয়েন্টের মোট সংখ্যার দ্বারা ভাগ করুন।

Purity = (53 + 60 + 16) / 140 = 0.92142

আপনি কি দয়া করে এন্ট্রপির জন্য উত্তর দিতে পারেন?
মনস্টার এমএমওরপিজি


আমি মনে করি আপনি "যুক্তিটি উপেক্ষা" যখন বলবেন "টি শ্রেণিবদ্ধকরণ ... সর্বোচ্চ গণনা "। এর দরকার নেই maxj then. By the way, high purity does not shows the correctness of classification, does it?
LRDPRDX
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.