গ্রাফিকাল ডেটা ওভারভিউ (সংক্ষিপ্তসার) ফাংশন আর


39

আমি নিশ্চিত যে আমি এর আগে কোনও আর প্যাকেজে এই জাতীয় কোনও ফাংশনটি পেরিয়ে এসেছি, তবে ব্যাপক গুগলিংয়ের পরে আমি এটি কোথাও খুঁজে পাচ্ছি না বলে মনে হয়। আমি যে ফাংশনটির কথা ভাবছি তার দেওয়া ভেরিয়েবলের জন্য একটি গ্রাফিকাল সংক্ষিপ্তসার তৈরি করেছি, কিছু গ্রাফ (একটি হিস্টগ্রাম এবং সম্ভবত একটি বাক্স এবং হুইস্কার প্লট) এবং কিছু পাঠ্য যেমন গড়, এসডি ইত্যাদির সাথে বিশদ প্রদান করে আউটপুট তৈরি করে producing

আমি পুরোপুরি নিশ্চিত যে এই ফাংশনটি বেস আর তে অন্তর্ভুক্ত ছিল না, তবে আমি ব্যবহৃত প্যাকেজটি খুঁজে পেতে পারি না।

কেউ কি এর মতো কোনও ফাংশন সম্পর্কে জানেন এবং যদি তাই হয় তবে এটি কোন প্যাকেজে রয়েছে?

উত্তর:


25

ফ্র্যাঙ্ক হ্যারেলের এইচমিস্ক প্যাকেজে টীকা দেওয়ার বিকল্পগুলির সাথে কয়েকটি বেসিক গ্রাফিক্স রয়েছে: summary.formula()এবং সম্পর্কিত plotর‌্যাপের কার্যগুলি পরীক্ষা করে দেখুন । আমিও describe()ফাংশন পছন্দ করি ।

অতিরিক্ত তথ্যের জন্য, দ্য হ্মিস্ক লাইব্রেরি বা এস-প্লাসের একটি ভূমিকা এবং এইচএমস্ক এবং ডিজাইন গ্রন্থাগারগুলি দেখুন

এখানে কিছু অন লাইন সাহায্য থেকে গৃহীত ছবি (হয় bpplt, describeএবং plot(summary(...))): বিকল্প পাঠ বিকল্প পাঠ বিকল্প পাঠ

অন্য অনেক উদাহরণ অন লাইন উপর ব্রাউজ করা যাবে আর গ্রাফিকাল ম্যানুয়াল দেখুন Hmisc (এবং মিস করবেন না RMS )।


এই ফাংশনগুলি হিমস্ক প্যাকেজটিতে রয়েছে, ডিজাইনের নয়। এই পোস্ট করার জন্য ধন্যবাদ।
ফ্রাঙ্ক হ্যারেল

তিনটির মধ্যে দুটি লিঙ্ক ডাউন রয়েছে।
50

15

আমি অত্যন্ত ফাংশন সুপারিশ chart.Correlations প্যাকেজের মধ্যে PerformanceAnalytics । এটি একক চার্টে এক বিস্ময়কর তথ্য প্যাক করে: প্রতিটি ভেরিয়েবলের জন্য কার্নেল-ঘনত্বের প্লট এবং হিস্টোগ্রাম এবং স্ক্র্যাটারপ্লটস, লোয়েস স্মুথার এবং প্রতিটি ভেরিয়েবল জোড়ের জন্য সম্পর্কিত। এটি আমার প্রিয় গ্রাফিকাল ডেটা সংক্ষিপ্ত ক্রিয়াগুলির মধ্যে একটি:

library(PerformanceAnalytics)
chart.Correlation(iris[,1:4],col=iris$Species)

আমি এই চার্টটি ভালবাসি!


2
+1 টি, FWIW, ? Scatterplot.matrix মধ্যে গাড়ী প্যাকেজ (W / কিছু পার্থক্য, যেমন, / O R এর & তারার W) আপনি যদি অনুরূপ চক্রান্ত দেব।
গুং - মনিকা পুনরায়

@ গুং এটি একটি দুর্দান্ত ফাংশন, টিপটির জন্য ধন্যবাদ।
জ্যাচ

5

আমি এই ফাংশনটি সহায়ক হিসাবে পেয়েছি ... মূল লেখকের হ্যান্ডেলটি শ্বাসতন্ত্রের ক্লাব

এখানে আউটপুট উদাহরণ

f_summary <- function(data_to_plot)
{
## univariate data summary
require(nortest)
#data <- as.numeric(scan ("data.txt")) #commenting out by mike
data <- na.omit(as.numeric(as.character(data_to_plot))) #added by mike
dataFull <- as.numeric(as.character(data_to_plot))

# first job is to save the graphics parameters currently used
def.par <- par(no.readonly = TRUE)
par("plt" = c(.2,.95,.2,.8))
layout( matrix(c(1,1,2,2,1,1,2,2,4,5,8,8,6,7,9,10,3,3,9,10), 5, 4, byrow = TRUE))

#histogram on the top left
h <- hist(data, breaks = "Sturges", plot = FALSE)
xfit<-seq(min(data),max(data),length=100)
yfit<-yfit<-dnorm(xfit,mean=mean(data),sd=sd(data))
yfit <- yfit*diff(h$mids[1:2])*length(data)
plot (h, axes = TRUE, main = paste(deparse(substitute(data_to_plot))), cex.main=2, xlab=NA)
lines(xfit, yfit, col="blue", lwd=2)
leg1 <- paste("mean = ", round(mean(data), digits = 4))
leg2 <- paste("sd = ", round(sd(data),digits = 4))
count <- paste("count = ", sum(!is.na(dataFull)))
missing <- paste("missing = ", sum(is.na(dataFull)))
legend(x = "topright", c(leg1,leg2,count,missing), bty = "n")

## normal qq plot
qqnorm(data, bty = "n", pch = 20)
qqline(data)
p <- ad.test(data)
leg <- paste("Anderson-Darling p = ", round(as.numeric(p[2]), digits = 4))
legend(x = "topleft", leg, bty = "n")

## boxplot (bottom left)
boxplot(data, horizontal = TRUE)
leg1 <- paste("median = ", round(median(data), digits = 4))
lq <- quantile(data, 0.25)
leg2 <- paste("25th percentile =  ", round(lq,digits = 4))
uq <- quantile(data, 0.75)
leg3 <- paste("75th percentile = ", round(uq,digits = 4))
legend(x = "top", leg1, bty = "n")
legend(x = "bottom", paste(leg2, leg3, sep = "; "), bty = "n")

## the various histograms with different bins
h2 <- hist(data,  breaks = (0:20 * (max(data) - min (data))/20)+min(data), plot = FALSE)
plot (h2, axes = TRUE, main = "20 bins")

h3 <- hist(data,  breaks = (0:10 * (max(data) - min (data))/10)+min(data), plot = FALSE)
plot (h3, axes = TRUE, main = "10 bins")

h4 <- hist(data,  breaks = (0:8 * (max(data) - min (data))/8)+min(data), plot = FALSE)
plot (h4, axes = TRUE, main = "8 bins")

h5 <- hist(data,  breaks = (0:6 * (max(data) - min (data))/6)+min(data), plot = FALSE)
plot (h5, axes = TRUE,main = "6 bins")

## the time series, ACF and PACF
plot (data, main = "Time series", pch = 20, ylab = paste(deparse(substitute(data_to_plot))))
acf(data, lag.max = 20)
pacf(data, lag.max = 20)

## reset the graphics display to default
par(def.par)

#original code for f_summary by respiratoryclub

}

2
আমি সবেমাত্র কোডটি আপডেট করেছি যাতে এটি বৈধ / নিখোঁজ এন রিপোর্ট করে এবং তারপরে অনুপস্থিত মানগুলি দ্বারা ভেঙে ফাংশনগুলির জন্য অনুপস্থিত মানগুলি বাদ দেয়।
মাইকেল বিশপ 21

4

আমি নিশ্চিত নই যে আপনি এটিই ভাবছিলেন কিনা তবে আপনি ফিটডিসট্রপ্লাস প্যাকেজটি পরীক্ষা করতে চাইতে পারেন । এটিতে অনেকগুলি সুন্দর ফাংশন রয়েছে যা স্বয়ংক্রিয়ভাবে আপনার বিতরণ সম্পর্কে দরকারী সংক্ষিপ্তসার তথ্য তৈরি করে এবং সেই তথ্যগুলির কয়েকটি প্লট তৈরি করে। ভিগনেট থেকে এখানে কিছু উদাহরণ দেওয়া হয়েছে :

library(fitdistrplus)
data(groundbeef)
windows()              # or quartz() for mac
  plotdist(groundbeef$serving)  

এখানে চিত্র বর্ণনা লিখুন

windows()
> descdist(groundbeef$serving, boot=1000)
summary statistics
------
min:  10   max:  200 
median:  79 
mean:  73.64567 
estimated sd:  35.88487 
estimated skewness:  0.7352745 
estimated kurtosis:  3.551384 

এখানে চিত্র বর্ণনা লিখুন

fw = fitdist(groundbeef$serving, "weibull")

>summary(fw)
Fitting of the distribution ' weibull ' by maximum likelihood 
Parameters : 
       estimate Std. Error
shape  2.185885  0.1045755
scale 83.347679  2.5268626
Loglikelihood:  -1255.225   AIC:  2514.449   BIC:  2521.524 
Correlation matrix:
         shape    scale
shape 1.000000 0.321821
scale 0.321821 1.000000

fg  = fitdist(groundbeef$serving, "gamma")
fln = fitdist(groundbeef$serving, "lnorm")
windows()
  plot(fw)

এখানে চিত্র বর্ণনা লিখুন

windows()
  cdfcomp(list(fw,fln,fg), legendtext=c("Weibull","logNormal","gamma"), lwd=2,
          xlab="serving sizes (g)")

এখানে চিত্র বর্ণনা লিখুন

>gofstat(fw)
Kolmogorov-Smirnov statistic:  0.1396646 
Cramer-von Mises statistic:  0.6840994 
Anderson-Darling statistic:  3.573646 

1

ডেটাসেট অন্বেষণ করতে আমি সত্যিই পছন্দ করি rattle। প্যাকেজটি ইনস্টল করুন এবং কেবল কল করুন rattle()। ইন্টারফেসটি বেশ স্ব ব্যাখ্যাযোগ্য।


খনখন শব্দ (ক উইন্ডোজ বাইনারি এবং অনুপলব্ধ) এক্সএমএল যা Windows এর জন্য সমর্থিত নয় প্রয়োজন :-(। cran.r-project.org/web/packages/XML/index.html
whuber

@ শুভ: খুব খারাপ! এটি বেশ ঝরঝরে প্যাকেজ
নিকো

2
@ ভুবার @nico এক্সএমএলের জন্য একটি জিপ ফাইল stats.ox.ac.uk/pub/RWin/bin/windows/contrib/2.13 (এবং একইভাবে কিছু অন্যান্য সংস্করণের জন্য) পাওয়া যাবে। এটি নিয়ে অন্যান্য সমস্যা রয়েছে, তবে শেষ পর্যন্ত এটি কাজ করে বলে মনে হচ্ছে
হেনরি

0

সম্ভবত আপনি গ্রন্থাগারটি ggplot2 সন্ধান করছেন যা আপনাকে সুন্দর উপায়ে জিনিসগুলি প্লট করতে দেয়। অথবা আপনি এই ওয়েবসাইটটি চেক করতে পারেন যা মনে হয় প্রচুর আর গ্রাফিক ইউটিলিটিগুলি রয়েছে: http://addicttor.free.fr/graphiques/


0

এটি সম্ভবত আপনি যা খুঁজছেন ঠিক তা নয়, তবে আর এর জন্য মনস্তাত্ত্বিক প্যাকেজে জোড়া.প্যানেলস () ফাংশনটি কার্যকর প্রমাণিত হতে পারে। এটি আপনাকে উপরের তির্যক, কম রেখায় এবং নীচের ত্রিভুজের বিন্দুতে পারস্পরিক সম্পর্কের মান দেয় এবং ম্যাট্রিক্সের তির্যক রেখায় প্রতিটি ভেরিয়েবলের স্কোরের একটি হিস্টগ্রাম দেখায়। আমি ব্যক্তিগতভাবে এর চারপাশের ডেটাগুলির সর্বোত্তম গ্রাফিকাল সংক্ষিপ্তসারগুলি মনে করি।


0

আমার প্রিয় ডেস্কটুলস

library(DescTools)
data("iris")
Desc(iris, plotit = T)

যা এর মতো প্লটগুলির একটি সিরিজ উত্পাদন করে:

এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন এবং বর্ণনামূলক মানগুলির একটি সিরিজ প্রদর্শন করে (যার সাথে গড়, গড়, মিডিয়ান, পার্সেন্টাইলস, রেঞ্জ, এসডি, আইকিউআর, স্কিউনেসের মান এবং কুর্তোসিস সহ): এখানে চিত্র বর্ণনা লিখুন

বিকল্পভাবে, ট্যাবপ্লট গ্রাফিকাল ওভারভিউয়ের জন্য খুব ভাল।

এটি দিয়ে অভিনব প্লট উত্পাদন করে tableplot(iris, sortCol=Species)

এখানে চিত্র বর্ণনা লিখুন

এমনকি সেখানে একটি থেকে D3 সংস্করণ tabplot, অর্থাত্ tabplotd3

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.