দৃশ্যত বহু মাত্রিক ক্লাস্টার ডেটা প্লট করা


17

আমার কাছে 16 টি ভেরিয়েবলের সাথে একটি ডেটা সেট রয়েছে এবং কামেন দ্বারা ক্লাস্টার করার পরে, আমি দুটি গ্রুপ প্লট করতে চাই।

দুটি প্লাস্টারটি দৃশ্যত উপস্থাপন করার জন্য আপনি কোন প্লটকে পরামর্শ দিচ্ছেন?

উত্তর:


23

কোনও একক অধিকার ভিজ্যুয়ালাইজেশন নেই। এটি আপনি যে ক্লাস্টারগুলি দেখতে চান বা জোর দিতে চান তার উপর নির্ভর করে।

প্রতিটি পরিবর্তনশীল কীভাবে অবদান রাখে তা দেখতে চান? একটি সমান্তরাল স্থানাঙ্ক প্লট বিবেচনা করুন।

দুটি ক্লাস্টার এবং ক্লাস্টারের অর্থের জন্য সমান্তরাল স্থানাঙ্ক

আপনি কি দেখতে চান যে কীভাবে মূল উপাদানগুলির সাথে ক্লাস্টারগুলি বিতরণ করা হয়? একটি বাইপ্লট বিবেচনা করুন (2D বা 3 ডি তে):

গুচ্ছ বিপ্লট

আপনি কি সমস্ত মাত্রায় ক্লাস্টার আউটিলারদের সন্ধান করতে চান? ক্লাস্টারের কেন্দ্র 2 থেকে দূরত্বের বিপরীতে ক্লাস্টার 1 এর কেন্দ্র থেকে দূরত্বের একটি স্ক্র্যাপপ্লট বিবেচনা করুন (কে এর সংজ্ঞা অনুসারে প্রতিটি ক্লাস্টারটি তির্যক রেখার একপাশে পড়বে))

এখানে চিত্র বর্ণনা লিখুন

ক্লাস্টারিংয়ের সাথে তুলনা করে আপনি কি জুটিযুক্ত সম্পর্কগুলি দেখতে চান? ক্লাস্টার দ্বারা বর্ণিত একটি স্ক্যাটারপ্ল্লট ম্যাট্রিক্স বিবেচনা করুন।

এখানে চিত্র বর্ণনা লিখুন

আপনি কি গুচ্ছ দূরত্বের সংক্ষিপ্তসার দেখতে চান? হিস্টোগ্রাম, বেহালা প্লট, বা বাক্স প্লটগুলির মতো যেকোন বিতরণ ভিজ্যুয়ালাইজেশনের তুলনা বিবেচনা করুন।

এখানে চিত্র বর্ণনা লিখুন


2

মাল্টিভারিয়েট প্রদর্শনগুলি তাত্পর্যপূর্ণ, বিশেষত ভেরিয়েবলের সংখ্যার সাথে। আমার দুটি পরামর্শ আছে।

যদি কিছু নির্দিষ্ট ভেরিয়েবল থাকে যা ক্লাস্টারিংয়ের জন্য বিশেষভাবে গুরুত্বপূর্ণ, বা উল্লেখযোগ্যভাবে আকর্ষণীয় হয় তবে আপনি একটি স্ক্র্যাটারপ্লট ম্যাট্রিক্স ব্যবহার করতে পারেন এবং আপনার আকর্ষণীয় ভেরিয়েবলের মধ্যে দ্বিখণ্ডিত সম্পর্ক প্রদর্শন করতে পারেন। আপনি আরও কিছু মাত্রিকতা যুক্ত করতে বর্ধিত স্ক্রেটারপ্লটগুলি ব্যবহার করতে পারেন (যেমন কোনও তৃতীয় ভেরিয়েবলের সাথে আনুপাতিক আকারের আকারগুলি ব্যবহার করুন)

বিকল্পভাবে, আপনি একটি স্প্রিংপ্লট ব্যবহার করতে পারেন যা ক্লাস্টারিংয়ের প্রদর্শন করে এমন উচ্চ মাত্রিক ডেটা প্রদর্শনের জন্য তৈরি করা হয়েছিল। দ্রষ্টব্য, আমি যে সাহিত্যের সাথে পরিচিত সেগুলিতে এটি আমি কখনও দেখিনি, তবে আমি মনে করি এটি মাল্টিভারিয়েট ডেটা প্রদর্শনের একটি খুব আকর্ষণীয় উপায়। নিম্নলিখিত উদ্ধৃতিটি হ'ল যেখানে প্লটটি মূলত প্রস্তাব করা হয়েছিল।

হফম্যান, পিই এবং অন্যান্য। (1997) ডিএনএ ভিজ্যুয়াল এবং বিশ্লেষণী ডেটা মাইনিং। আইইইই ভিজ্যুয়ালাইজেশনের কার্যক্রমে। ফিনিক্স, এজেড, পৃষ্ঠা 437-441।

আমি এখানে এটির মূলত উল্লেখ খুঁজে পেয়েছি।

এখন, সুস্পষ্ট সতর্কতা, আমি কমলার বাইরে স্প্রিংপ্লটগুলির কোনও প্রয়োগ খুঁজে পাইনি। তারপরে আবার, আমি এত কঠিন অনুসন্ধান করিনি!

আমি ধরে নিচ্ছি যে আপনার ডেটাটি সত্যিকারের মূল্যবান এবং অবিচ্ছিন্ন, যদি এটি পৃথক বা অবিরাম হয় তবে এরপরেও আমি মনে করি না যে প্লটগুলি সহায়ক হবে।


1
আর এর জন্য একটি রেডভিজ বাস্তবায়ন রয়েছে: cran.r-project.org/web/packages/Radviz/vignettes/…
pmav99

1

আপনি আর-তে ফ্যাকোসেক্সট্রা প্যাকেজ থেকে fviz_cluster ফাংশনটি ব্যবহার করতে পারেন It এটি আপনার ডেটার বিচ্ছুরক প্লট দেখায় এবং পয়েন্টের বিভিন্ন রঙের ক্লাস্টার হবে।

আমার বোঝার সেরা হিসাবে, এই ফাংশনটি পিসিএ সম্পাদন করে এবং তারপরে শীর্ষ দুটি পিসি চয়ন করে এবং 2 ডি তে প্লট করে।

আমার উত্তরের যে কোনও পরামর্শ / উন্নতি সর্বাধিক স্বাগত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.