ক্লাস লেবেলকে কে-মানে ক্লাস্টারে অর্পণ করা


10

ক্লাস্টারিং সম্পর্কে আমার খুব প্রাথমিক প্রশ্ন আছে। আমি তাদের সেন্ট্রয়েডগুলি সহ কে ক্লাস্টারগুলি সন্ধান করার পরে, আমি কীভাবে ক্লাস্টার করেছি তথ্য পয়েন্টগুলির ক্লাসগুলি ব্যাখ্যা করতে যাব (প্রতিটি ক্লাস্টারে অর্থবোধক শ্রেণীর লেবেল নির্ধারণ করে)। আমি পাওয়া ক্লাস্টারগুলির বৈধতা সম্পর্কে কথা বলছি না।

এটি কি ডেটা পয়েন্টগুলির একটি ছোট লেবেলযুক্ত সেট দেওয়া যেতে পারে, যে কোনও ক্লাস্টারের সাথে এই ক্লাবের লেবেলযুক্ত পয়েন্টগুলি অন্তর্ভুক্ত এবং প্রকারের এবং প্রতিটি ক্লাস্টারের পয়েন্টের সংখ্যার ভিত্তিতে, লেবেলটি স্থির করে তা গণনা করুন? এটি বেশ সুস্পষ্ট বলে মনে হচ্ছে তবে এইভাবে ক্লাস্টারে লেবেলগুলি নির্ধারণ করা কতটা মানদণ্ড তা আমি জানি না।

স্পষ্টতই, আমি নিরীক্ষণযুক্ত ক্লাস্টারিং করতে চাই যা আমার ক্লাস্টারগুলি খুঁজতে প্রথমে কোনও লেবেল ব্যবহার করে না। তারপরে ক্লাস্টারগুলি খুঁজে পেয়ে, আমি কয়েকটি উদাহরণ ডেটাপয়েন্টের বৈশিষ্ট্যের ভিত্তিতে ক্লাস্টারে অর্থবর্গ শ্রেণীর লেবেল নির্ধারণ করতে চাই।


আমি আপনার প্রশ্নটি বোঝার ব্যাপারে নিশ্চিত নই: সাধারণত, কোনও কে-মানে অ্যালগরিদম প্রতিটি ডাটা পয়েন্টের জন্য শ্রেণি সদস্যতার বিষয়ে তথ্য ফিরিয়ে দেয়। আপনি কি প্রকৃত ডেটা পয়েন্ট বা নতুন পর্যবেক্ষণ সম্পর্কে কথা বলছেন?
chl

@chi আমি সন্দেহ রিয়াজ খুঁজে নেওয়ার বিষয়ে সংশ্লিষ্ট হয় নাম , যা দিয়ে ক্লাস্টার লেবেল এবং কোন বিষয়ে কথা বলছে অবরোহমার্গী পয়েন্ট কিছু নামকরণ এবং তারপর কিছু অ্যালগরিদম যা পরে ঐ ক্লাস্টার নাম ক্লাস্টার নাম পয়েন্ট অধিকতর ভারী বিবেচনায় ব্যবহার করে।
গ্লেন_বি

2
@ রিয়াজ, আমরা কি আপনার প্রশ্নটি বুঝতে ফ্যাক্টর বিশ্লেষণের জন্য নিম্নলিখিত উপমা ব্যবহার করতে পারি? প্রায়শই কেউ ভেরিয়েবলগুলির একটি সেটকে বিশ্লেষণ করে সেগুলি ভেরিয়েবলের গ্রুপগুলিতে ক্লাস্টার করে যেগুলি 'একসাথে ঝুলন্ত' বলে মনে হয়, তবে বিশ্লেষককে তার পরিবর্তনগুলির প্রকৃতি সম্পর্কে চিন্তা করতে হবে যা প্রতিটি ক্লাস্টারকে ডাব্লু / নাম লেখার জন্য আসে / প্রতিটি ক্লাস্টার (ফ্যাক্টর) সম্পর্কে চিন্তাশৈলী হয় । আপনি এখানে যা পাচ্ছেন তা কি মূলত?
গুং - মনিকা পুনরায়

উত্তর:


4

হ্যাঁ. আপনি যা প্রস্তাব করেন তা পুরোপুরি মানসম্পন্ন এবং স্ট্যান্ডার্ড কে-মানে সফ্টওয়্যারটি স্বয়ংক্রিয়ভাবে কাজ করে। কে-এর ক্ষেত্রে আপনি প্রতিটি পর্যবেক্ষণ (ডেটা পয়েন্ট) এবং প্রতিটি ক্লাস্টারের গড় (সেন্ট্রয়েড) এর মধ্যে ইউক্যালিডিয়ান দূরত্বটি গণনা করুন এবং পর্যবেক্ষণগুলি সর্বাধিক অনুরূপ ক্লাস্টারে নির্ধারণ করুন। তারপরে, ক্লাস্টারের লেবেলটি অন্যান্য ক্লাস্টারের তুলনায় গড়ের তুলনায় ক্লাস্টারের সাথে শ্রেণিবদ্ধ পর্যবেক্ষণগুলির গড় বৈশিষ্ট্যগুলি পরীক্ষা করে নির্ধারিত হয়।


3

আপনি যদি আপনার কম্মানস অবজেক্টের নামগুলি দেখেন তবে আপনি লক্ষ্য করবেন যে একটি "ক্লাস্টার" অবজেক্ট রয়েছে। এতে শ্রেণীর লেবেলগুলি আপনার ইনপুট ডেটার মতোই অর্ডার করেছে। এখানে একটি সাধারণ উদাহরণ যা ক্লাস্টার লেবেলগুলিকে আপনার ডেটাতে আবদ্ধ করে।

x <- data.frame(X=rnorm(100, sd=0.3), Y=rnorm(100, mean=1, sd=0.3))

k <- kmeans(x, 2) 
names(k)
x <- data.frame(x, K=k$cluster)

# You can also directly return the clusters
x <- data.frame(x, K=kmeans(x, 2)$cluster)

0

ক্লাস্টারে লেবেলগুলি একটি ক্লাস্টারের মধ্যে সংখ্যাগরিষ্ঠ নমুনার শ্রেণির উপর ভিত্তি করে থাকতে পারে। ক্লাস্টারের সংখ্যা ক্লাসের সংখ্যার সমান হলেই এটি সত্য।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.