স্ক্রেটারপ্লট তৈরির জন্য আর ব্যবহারের একটি ভাল উপায় যা চিকিত্সার মাধ্যমে ডেটা পৃথক করে?


30

আমি আর এবং পরিসংখ্যানগুলির সাথে খুব সাধারণভাবেই নতুন, তবে আমার একটি স্ক্র্যাপপ্লট তৈরি করা দরকার যা আমি মনে করি এটি তার স্থানীয় সামর্থ্যের বাইরে।

আমার কাছে পর্যবেক্ষণগুলির বেশ কয়েকটি ভেক্টর রয়েছে এবং আমি তাদের সাথে একটি স্ক্র্যাপপ্লট তৈরি করতে চাই এবং প্রতিটি জুটি তিনটি বিভাগের মধ্যে একটিতে পড়ে। আমি একটি স্ক্রেটারপ্লট তৈরি করতে চাই যা রঙ বা প্রতীক দ্বারা প্রতিটি বিভাগকে আলাদা করে দেয়। আমি মনে করি এটি তিনটি ভিন্ন স্ক্র্যাপপ্লট উত্পন্ন করার চেয়ে ভাল be

আমার আরও একটি সমস্যা আছে যে প্রতিটি বিভাগে, এক পর্যায়ে বড় ক্লাস্টার থাকে তবে ক্লাস্টারগুলি অন্য দুটি দলের তুলনায় একটি গ্রুপে বড় হয়।

কেউ কি এটি করার জন্য একটি ভাল উপায় জানেন? প্যাকেজগুলি আমার ইনস্টল করা উচিত এবং কীভাবে ব্যবহার করতে হয় তা শিখতে হবে? কেউ কি এরকম কিছু করেছেন?

ধন্যবাদ

উত্তর:


53

বৃহত গুচ্ছ : ওভারপ্রিন্টিং যদি সমস্যা হয় তবে আপনি হয় নীচের আলফাটি ব্যবহার করতে পারেন, তাই একক পয়েন্টগুলি ম্লান হয়ে যায়, তবে ওভারপ্রিনিং আরও তীব্র রঙ তৈরি করে। অথবা আপনি 2 ডি হিস্টোগ্রাম বা ঘনত্বের প্রাক্কলনে স্যুইচ করুন।

require ("ggplot2")
  • ggplot (iris, aes (x = Sepal.Length, y = Sepal.Width, colour = Species)) + stat_density2d ()
    ঘনত্ব
    আপনি সম্ভবত এর মুখোমুখি হতে চান ...

  • ggplot (iris, aes (x = Sepal.Length, y = Sepal.Width, fill = Species)) + stat_binhex (bins=5, aes (alpha = ..count..)) + facet_grid (. ~ Species)
    hexbin
    আপনি কোনও পরিকল্পনা ছাড়াই এই প্লটটি সংগ্রহ করতে পারেন, তবে প্রজাতির মূল ক্রমটি চূড়ান্ত চিত্রকে অগ্রাহ্য করে।

  • আপনি যদি এটিকে আপনার হাতকে কিছুটা নোংরা করতে চান (= ব্যাখ্যা ও কোডের লিঙ্ক) এবং হেক্সাগনগুলির জন্য মিশ্র রঙগুলি গণনা করতে চান তবে আপনি এড়াতে পারেন : এখানে চিত্র বর্ণনা লিখুন

  • আর একটি দরকারী জিনিস হ'ল উচ্চ ঘনত্ব অঞ্চলের জন্য (হেক্স) বিনগুলি ব্যবহার করা এবং অন্যান্য অংশগুলির জন্য একক পয়েন্ট প্লট করা:

    ggplot (df, aes (x = date, y = t5)) + 
      stat_binhex (data = df [df$t5 <= 0.5,], bins = nrow (df) / 250) +
          geom_point (data = df [df$t5 > 0.5,], aes (col = type), shape = 3) +
      scale_fill_gradient (low = "#AAAAFF", high = "#000080") +
      scale_colour_manual ("response type", 
        values = c (normal = "black", timeout = "red")) + 
      ylab ("t / s")

    এখানে চিত্র বর্ণনা লিখুন


প্লটিং প্যাকেজগুলির সম্পূর্ণতার স্বার্থে, আমি আরও উল্লেখ করতে পারি lattice:

require ("lattice")
  • xyplot(Sepal.Width ~ Sepal.Length | Species, iris, pch= 20)
    <কোড> xyplot (Sepal.Width al Sepal.Length | প্রজাতি, আইরিস, pch = 20) </code>

  • xyplot(Sepal.Width ~ Sepal.Length, iris, groups = iris$Species, pch= 20)
    <কোড> xyplot (সেপাল। প্রস্থ ~ সেপাল। দৈর্ঘ্য, আইরিস, গোষ্ঠীগুলি = আইরিস $ প্রজাতি, pch = 20) </code>

  • xyplot(Sepal.Width ~ Sepal.Length | Species, iris, groups = iris$Species, pch= 20)
    <কোড> xyplot (Sepal.Width al Sepal.Length | প্রজাতি, আইরিস, গ্রুপ = আইরিস $ প্রজাতি, pch = 20) </code>


বাহ! আপনাকে অনেক ধন্যবাদ, হেক্সস বিনগুলি কৌশলটি নিখুঁতভাবে করেছে!
crf

22

এটি 'আইরিস' ডেটা সেটের জন্য সর্বোত্তম সমস্যাগুলির মধ্যে একটি। এটি আর কোডের সাথে সেট ডেটার ভিত্তিতে প্লট করা প্রকল্পগুলির পুরো সেটটির লিঙ্ক , যা আপনি আপনার সমস্যার সাথে মানিয়ে নিতে সক্ষম হতে পারেন।

এখানে অ্যাড-অন প্যাকেজের পরিবর্তে বেস আর ব্যবহার করে এমন একটি অ্যাপ্রোচ দেওয়া আছে।

plot(iris$Petal.Length, iris$Petal.Width, pch=21, 
     bg=c("red","green3","blue")[unclass(iris$Species)], 
     main="Edgar Anderson's Iris Data")

যা এই চিত্রটি উত্পাদন করে:

এখানে চিত্র বর্ণনা লিখুন

সেখান থেকে, আপনার চক্রান্তের উপর নির্ভর করে, আপনি অতিরিক্ত-উত্সাহিতকরণ ইত্যাদির জন্য আলফা / স্বচ্ছতার স্তরগুলি নিয়ে গন্ডগোল শুরু করতে পারেন তবে আমি প্রথমে খুব বেসিক গ্রাফটি তৈরি করব।

বেস আর এর সাথে লেগে থাকার অনেক কারণ রয়েছে, অন্য প্যাকেজগুলি প্লট করা সহজ করে দেয়। একটি পৃথক বৈশিষ্ট্য দ্বারা ডেটা পৃথক করা ggplot2 এবং জাল প্যাকেজগুলির অন্যতম শক্তি । ggplot2 বিশেষত দৃষ্টি আকর্ষণীয় প্লট তৈরি করে। উভয় প্যাকেজই @cbeleites দ্বারা উত্তরে প্রদর্শিত হয়


4
কিছুটা বিভ্রান্তিকর কারণ আপনি ggplot2 এর প্রস্তাব দিলেও আপনি এটি নিজের উদাহরণে ব্যবহার করেন না? একটি ggplot2 সমতুল্য ওয়াডল লাইব্রেরি (ggplot2); qplot (পেটাল.লেন্থ, পেটাল। প্রস্থ, রঙ = প্রজাতি, ডেটা = আইরিস, প্রধান = "এডগার অ্যান্ডারসনের আইরিস ডেটা")। এটি স্বয়ংক্রিয়ভাবে একটি কিংবদন্তি তৈরির সুবিধাও রয়েছে।
পিটার এলিস

@ পিটারএলিস এটি কারণ কারণ আমি এমন কিছুকে স্বীকৃতি দিতে পারি যা নিজেকে জিপিপ্লাট 2-তে ভাল .ণ দেয়, আমি কেবল বেস গ্রাফিক্সের সাথে এমনকি পার্সোনিকভাবে পারদর্শী।
ফোমাইট

1
বেস গ্রাফিকস বিটিডব্লিউতে আনক্লাস () সহ দুর্দান্ত কৌশল
পিটার এলিস

16

বা ggplot2 সহ:

ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width, colour = Species)) + geom_point()
ggplot(iris, aes(x = Sepal.Length, y = Sepal.Width)) + geom_point() + facet_grid(~Species)

যা উত্পাদন করে

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.