সর্বাধিক নিগ্রহের ডেটা ভিজ্যুয়ালাইজেশন [বন্ধ]


178

হিস্টোগ্রাম এবং স্ক্রেটারপ্লটগুলি ভিজ্যুয়ালাইজেশন ডেটা এবং ভেরিয়েবলের মধ্যে সম্পর্কের দুর্দান্ত পদ্ধতি, তবে সম্প্রতি আমি কী ভিজ্যুয়ালাইজেশন কৌশলগুলি অনুপস্থিত তা নিয়ে ভাবছিলাম। আপনি কী ভাবেন যে সর্বাধিক নিখুঁত ধরনের প্লট?

উত্তরগুলি দেওয়া উচিত:

  1. অনুশীলনে খুব বেশি ব্যবহার হয় না।
  2. অনেক বড় পটভূমি আলোচনা ছাড়াই বোধগম্য হন।
  3. অনেক সাধারণ পরিস্থিতিতে প্রযোজ্য।
  4. একটি উদাহরণ তৈরি করতে পুনরুত্পাদনযোগ্য কোড অন্তর্ভুক্ত করুন (পছন্দমতো আর তে)। একটি লিঙ্কযুক্ত চিত্রটি চমৎকার হবে।

13
আমি মনে করি এটি একটি খুব দরকারী আলোচনা, এবং দুঃখিত যে এটি বন্ধ রয়েছে।
অ্যালেক্স ব্রাউন

2
@ অ্যালেক্সব্রাউন: তাহলে কেন আবার ভোট দেওয়ার জন্য ভোট দিচ্ছেন না? আমি দেখতে পাচ্ছি কেন এই প্রশ্নের শব্দটির বাক্যটি "গঠনমূলক নয়" হিসাবে মনে হতে পারে তবে এই প্রশ্নের ফলে ওয়েবে যে কোনও জায়গায় এই বিষয়ে কিছুটা চিন্তাশীল এবং অন্তর্দৃষ্টিপূর্ণ উত্তর এসেছে। আমি এই উত্তরগুলি আপডেট এবং প্রসারিত দেখতে পছন্দ করব।
সর্বোচ্চ

2
এটি সম্ভবত stats.stackoverflow.com এ সরানো উচিত। এটি সেই সাইটের পক্ষে অনেক বেশি উপযুক্ত।
nnot101

4
এটি বন্ধ হওয়ার আগে করুণাময় কেউ এখানে কিউকিউ-প্লট উল্লেখ করেনি । তারা এত জঘন্য দরকারী!
nnot101

এটি পুনরায় খোলা উচিত।
পিটার ফ্লুম

উত্তর:


89

আমি অন্যান্য পোস্টারগুলির সাথে সত্যিই একমত: টুফ্টের বইগুলি দুর্দান্ত এবং পড়া ভাল।

প্রথমত, আমি আপনাকে এই বছরের শুরুর দিকে জিপিপ্লট 2 এবং জিজিবি-র একটি খুব সুন্দর টিউটোরিয়ালটি দেখিয়েছি । এর বাইরে আমি কেবল আর থেকে একটি ভিজ্যুয়ালাইজেশন এবং দুটি গ্রাফিক্স প্যাকেজ হাইলাইট করব (যা বেস গ্রাফিক্স, ল্যাটিস বা জিজিপ্লট হিসাবে ব্যাপকভাবে ব্যবহৃত হয় না):

তাপ মানচিত্র

আমি সত্যিই ভিজ্যুয়ালাইজেশন পছন্দ করি যা মাল্টিভিয়ারেট ডেটা, বিশেষত সময় সিরিজের ডেটা পরিচালনা করতে পারে। উত্তাপের মানচিত্র এটির জন্য কার্যকর হতে পারে। সত্যই ঝরঝরে একটি ডেভিড স্মিথ রিভলিউশন ব্লগে ফিচার করেছিলেন । এখানে হ্যাডলির জিপিপ্লট কোড সৌজন্যে:

stock <- "MSFT"
start.date <- "2006-01-12"
end.date <- Sys.Date()
quote <- paste("http://ichart.finance.yahoo.com/table.csv?s=",
                stock, "&a=", substr(start.date,6,7),
                "&b=", substr(start.date, 9, 10),
                "&c=", substr(start.date, 1,4), 
                "&d=", substr(end.date,6,7),
                "&e=", substr(end.date, 9, 10),
                "&f=", substr(end.date, 1,4),
                "&g=d&ignore=.csv", sep="")    
stock.data <- read.csv(quote, as.is=TRUE)
stock.data <- transform(stock.data,
  week = as.POSIXlt(Date)$yday %/% 7 + 1,
  wday = as.POSIXlt(Date)$wday,
  year = as.POSIXlt(Date)$year + 1900)

library(ggplot2)
ggplot(stock.data, aes(week, wday, fill = Adj.Close)) + 
  geom_tile(colour = "white") + 
  scale_fill_gradientn(colours = c("#D61818","#FFAE63","#FFFFBD","#B5E384")) + 
  facet_wrap(~ year, ncol = 1)

যা কিছুটা দেখতে এরকমভাবে শেষ হয়:

বিকল্প পাঠ

আরজিএল: ইন্টারেক্টিভ 3 ডি গ্রাফিক্স

আর একটি প্যাকেজ যা শেখার প্রচেষ্টার পক্ষে মূল্যবান তা হ'ল আরজিএল , যা সহজেই ইন্টারেক্টিভ 3 ডি গ্রাফিক্স তৈরি করার ক্ষমতা সরবরাহ করে। অনলাইনে এর জন্য অনেকগুলি উদাহরণ রয়েছে (আরজিএল ডকুমেন্টেশন সহ)।

আরজিএল ব্যবহার করে কীভাবে 3 ডি স্ক্যাটার প্লট প্লট করা যায় তার একটি দুর্দান্ত উদাহরণ আর-উইকির রয়েছে

GGobi

আরগিজোবি হ'ল জেনে রাখার মতো আরও একটি প্যাকেজ । নেই বিষয়ের উপর একটি স্প্রিঙ্গের বই বিষয়গুলির সঙ্গে অনলাইনে, এবং মহান ডকুমেন্টেশন প্রচুর / উদাহরণ, "ডাটা এ খুঁজছি" অবশ্যই।


সুন্দর। কোড / চিত্র অন্তর্ভুক্ত করার জন্য ধন্যবাদ।
ইয়ান ফেলো

'জেড' এর উল্লম্ব অবস্থান বা প্রতিটি শক্ত কালো উল্লম্ব লাইনে বাঁক দিয়ে কী বোঝানো হয়?
ডগ

এগুলি মাসের সীমানা (মাসগুলি একই দিনে শেষ হয় না)।
শেন

3
ঐটা সুন্দর. আপনি কিভাবে মাসের সীমাটি ঘটতে পেলেন?
অ্যালেক্স ব্রাউন


58

আমি সত্যিই ডটপ্লটগুলি পছন্দ করি এবং যখন আমি অন্যদের কাছে যথাযথ ডেটা সমস্যার জন্য তাদের সুপারিশ করি তখন তারা অবিচ্ছিন্নভাবে এবং আনন্দিত হয়। তাদের খুব বেশি ব্যবহার হবে বলে মনে হয় না এবং কেন তা আমি বুঝতে পারি না।

কুইক-আর এর একটি উদাহরণ এখানে: গাড়ির ডেটাতে ডটপ্লট

আমি বিশ্বাস করি যে এগুলির বিকাশ ও প্রসারের জন্য ক্লেভল্যান্ড সবচেয়ে বেশি দায়ী এবং তাঁর বইয়ের উদাহরণ (যেখানে একটি ডটপ্লট দিয়ে ত্রুটিযুক্ত ডেটা সহজেই সনাক্ত করা হয়েছিল) তাদের ব্যবহারের একটি শক্তিশালী যুক্তি। মনে রাখবেন যে উপরের উদাহরণটিতে প্রতি লাইনে একটি করে বিন্দু রাখে, যখন তাদের আসল শক্তিটি আসে আপনার সাথে প্রতিটি লাইনে একাধিক বিন্দু থাকে এবং একটি কিংবদন্তি ব্যাখ্যা করে কোনটি। উদাহরণস্বরূপ, আপনি তিনটি পৃথক সময় পয়েন্টের জন্য বিভিন্ন চিহ্ন বা রঙ ব্যবহার করতে পারেন এবং সেখান থেকে সহজেই বিভিন্ন বিভাগে সময়ের নিদর্শনগুলির ধারণা পাওয়া যায়।

নিম্নলিখিত উদাহরণে (সমস্ত কিছুতে এক্সেল করা!), আপনি পরিষ্কারভাবে দেখতে পারেন কোন বিভাগটি কোনও লেবেল অদলবদলের কারণে ভুগতে পারে।

2 টি গ্রুপ সহ ডটপ্লট


1
একটি ডটপ্লট কীভাবে একটি স্ক্র্যাটারপ্ল্লট থেকে আলাদা যার সাথে সুইচড অক্ষ রয়েছে যার মধ্যে একটি শ্রেণিবদ্ধ?
DrSAR

4
@ ডিআএসএসএআর কীভাবে একটি হিস্টগ্রাম বারচার্টের চেয়ে আলাদা বা ঘনত্বের প্লট লাইন প্লটের চেয়ে আলাদা? আপনি আরও অনেক মৌলিক জ্যামিতির (সিএফ বার্টিনের সেমিলিওজি গ্রাফিক ) এর ক্ষেত্রে অনেকগুলি মানচিত্রের চার্ট প্রকারের বর্ণনা দিতে পারেন , তবে এটি কোনও নির্দিষ্ট উপায়ে কোনও কম অনন্যতার প্লট করার অন্তর্দৃষ্টি তৈরি করে না। এক্ষেত্রে আপনি একটানা তথ্যের এক টুকরো বিপরীতে শ্রেণিবদ্ধ তথ্য দুটি টুকরো (একটি উল্লম্বভাবে, এক চক্রান্তের চরিত্রের আকৃতি অনুসারে) প্লট করছেন। বেশিরভাগ সফ্টওয়্যার প্যাকেজগুলিতে আপনি এটি তৈরির জন্য একটি স্ক্যাটারপ্ল্লট হ্যাক করে থাকতেন, তবে এটি বেশ জোড়ালোভাবে স্ক্রেটারপ্লট নয়।
এরি বি ফ্রেডম্যান

2
@ gsk3 এর অর্থ স্পর্শকাতর শব্দ নয়। প্রকৃতপক্ষে, আমি এখন (গ্রাফিক্স এবং অনুরূপ রচনাগুলির ব্যাকরণ সম্পর্কে আরও পড়ার পরে) বুঝতে পারি যে উচ্চ-স্তরের এই পার্থক্য উপস্থাপনের জন্য বেশ গুরুত্বপূর্ণ হতে পারে। এটি দেখানোর জন্য ধন্যবাদ।
DrSAR

@ DRSAR এবং আমার অর্থ প্রতিরক্ষামূলক শোনার অর্থ নয়। এসও মন্তব্যের প্রকৃতি আমার অনুমান ;-)
এরি বি ফ্রিডম্যান

56

পোলার স্থানাঙ্কগুলি ব্যবহার করে প্লটগুলি অবশ্যই নিরস্ত থাকে - কেউ কেউ যুক্তিসঙ্গত কারণ বলে। আমি মনে করি যে পরিস্থিতিগুলি তাদের ব্যবহারকে ন্যায়সঙ্গত করে তোলে তা সাধারণ নয়; আমি আরও মনে করি যে যখন এই পরিস্থিতিগুলি দেখা দেয় তখন মেরু প্লটগুলি ডেটাগুলিতে এমন নিদর্শনগুলি প্রকাশ করতে পারে যা লিনিয়ার প্লটগুলি পারে না।

আমি মনে করি কারণ কখনও কখনও আপনার ডেটা লিনিয়ারের চেয়ে সহজাতভাবে মেরু থাকে - যেমন, এটি চক্রাকার (একাধিক দিনের ২৪ ঘন্টা দিনের সময় প্রতিনিধিত্বকারী এক্স-কোঅর্ডিনেটস), বা ডেটাটি পূর্বে একটি মেরু বৈশিষ্ট্যের জায়গাতে ম্যাপ করা হয়েছিল।

এখানে একটি উদাহরণ। এই প্লটটি ঘন্টার মধ্যে একটি ওয়েবসাইটের গড় ট্রাফিক পরিমাণ দেখায়। দুটি স্পাইকটি রাত ১০ টা এবং সকাল 1 টায় লক্ষ্য করুন। সাইটের নেটওয়ার্ক ইঞ্জিনিয়ারদের জন্য, সেগুলি উল্লেখযোগ্য; এটি একে অপরের কাছাকাছি ঘটবে তাও তাৎপর্যপূর্ণ (কেবল দুই ঘন্টা দূরে)। তবে আপনি যদি dataতিহ্যবাহী স্থানাঙ্ক সিস্টেমে একই ডেটা প্লট করেন তবে এই প্যাটার্নটি সম্পূর্ণ গোপন করা হবে - রৈখিকভাবে প্লট করা হয়েছে, এই দুটি স্পাইকটি 20 ঘন্টার ব্যবধানে থাকতে পারে , যা এগুলি, যদিও এগুলি একটানা দিনে মাত্র দু'ঘন্টা অবধি রয়েছে। উপরের পোলার চার্ট এটিকে পার্সোমোনিয়াস এবং স্বজ্ঞাত উপায়ে দেখায় (কিংবদন্তির প্রয়োজন নেই)।

পোলার চার্ট 1 এবং 22 ঘন্টা শৃঙ্গ সহ সাইট ট্র্যাফিক দেখায়

আর এর সাহায্যে প্লট তৈরির জন্য দুটি উপায় (যা আমি সচেতন) রয়েছে (আমি প্লটটি ডাব্লু / আর এর উপরে তৈরি করেছি)। একটি হ'ল বেস বা গ্রিড গ্রাফিক সিস্টেমে আপনার নিজের ফাংশনটি কোড করা। তারা অন্য উপায়, যা সহজ, এটি বিজ্ঞপ্তি প্যাকেজ ব্যবহার করা হয় । আপনি যে ফাংশনটি ব্যবহার করবেন তা হ'ল ' গোলাপ.ডিয়াগ ':

data = c(35, 78, 34, 25, 21, 17, 22, 19, 25, 18, 25, 21, 16, 20, 26, 
                 19, 24, 18, 23, 25, 24, 25, 71, 27)
three_palettes = c(brewer.pal(12, "Set3"), brewer.pal(8, "Accent"), 
                   brewer.pal(9, "Set1"))
rose.diag(data, bins=24, main="Daily Site Traffic by Hour", col=three_palettes)

4
আপনার কোডটি অনুলিপি করে আমি একটি খুব আলাদা প্লট পেয়েছি (এটি বেশ কুৎসিত); কোন ধারণা কেন? আমি এই সতর্কতাটি পেয়েছি: 1: অ্যাসক্রিয়ারুলার (xx [, 1]) এ: একটি উপাদান নিম্নোক্ত উপাদানগুলির জন্য ডিফল্ট মান ব্যবহার করে 'বিজ্ঞপ্তি' শ্রেণিতে বাধ্য হয়: টাইপ: 'কোণ' ইউনিট: 'রেডিয়ানস' টেম্পলেট: ' কোনও 'মডুলো:' এএসিস 'শূন্য: 0 আবর্তন:' কাউন্টার 'গোলাপ.ডায়াগডাটা 24 দৈনিক সাইট ট্র্যাফিক আওয়ারথ্রি_প্লেটস দ্বারা
ডেটাওডা

আমি একই সমস্যা আছে।
ক্রাইওলা

আপনি লাইন-প্লট দিয়েও এটি করতে পারেন। পড়তে কিছুটা কঠিন হতে পারে তবে এটি আরও দানাদার ডেটা বা একাধিক চক্রের (যেমন, দশটি চক্রের প্লট করুন, তারপরে তাদের গড়ের প্লট করুন) এমন ডেটাগুলির জন্য এটি সত্যিই দুর্দান্তও হতে পারে।
nnot101

1
প্লটটি প্রতিরূপ করতে আমারও সমস্যা হয়েছিল। অবশেষে আমি স্থির করেছিলাম ggplot2 ব্যবহার করা সহজ। আমি কোড এবং ফলাফলগুলি সহ আরপবগুলিতে একটি ছোট ডেমো রেখেছি: rpubs.com/mattbagg/circular
ম্যাটব্যাগ

1
ggplot2 সমতুল্য:qplot(y=data, x=1:length(data), fill=factor(1:length(data)), stat='identity', geom='bar') + coord_polar()
নট 101

54

যদি আপনার স্ক্যাটার প্লটটির এতগুলি পয়েন্ট থাকে যে এটি একটি সম্পূর্ণ জগাখিচুড়ি হয়ে যায়, একটি ধীরে ধীরে স্ক্রেটার প্লট চেষ্টা করুন try এখানে একটি উদাহরণ:

library(mlbench) ## this package has a smiley function
n <- 1e5 ## number of points
p <- mlbench.smiley(n,sd1 = 0.4, sd2 = 0.4) ## make a smiley :-)
x <- p$x[,1]; y <- p$x[,2]
par(mfrow = c(1,2)) ## plot side by side
plot(x,y) ## left plot, regular scatter plot
smoothScatter(x,y) ## right plot, smoothed scatter plot

hexbinপ্যাকেজ (@Dirk Eddelbuettel দ্বারা প্রস্তাবিত) একই উদ্দেশ্যে ব্যবহার করা হয়, কিন্তু smoothScatter()সুবিধা হলো এটা জন্যে রয়েছে graphicsপ্যাকেজ, এবং এইভাবে মান আর ইনস্টলেশন অংশ।

নিয়মিত বা স্মুথ স্ক্র্যাটার প্লট হিসাবে স্মাইলি


6
সম্পূর্ণতার জন্য, আপনি জিওপ প্লেটের সাথে স্বচ্ছতা (আলফা)) ব্যবহার করে স্বচ্ছতা (আলফা) ব্যবহার করে এই প্রভাবটি অর্জন করতে পারেন।
পল হিমস্ট্র্রা

1
এটি কি কার্নেল ঘনত্বের প্রাক্কলন হিসাবে একই বা ঠিক একইরকম?
এন্ডোলিথ

30

স্পার্কলাইন এবং অন্যান্য Tufte ধারণা সম্বন্ধে YaleToolkit উপর প্যাকেজ Cran ফাংশন প্রদান করে sparklineএবং sparklines

বৃহত্তর ডেটাসেটের জন্য দরকারী আরেকটি প্যাকেজ হেক্সবিন কারণ এটি চালাকিভাবে ডেটাসেটগুলির সাথে ডিল করার জন্য বাকেটে ডেটা 'বিন' করে থাকে যা নিষ্পাপ স্ক্রেটারপ্লটসের জন্য খুব বড় হতে পারে।


4
স্পার্কলাইনগুলিতে +1। আমি বর্তমানে এমন একটি প্যাকেজ নিয়ে কাজ করছি যা আর স্পার্কলাইন তৈরিতে ফোকাস করছে - তারা সোয়েভ রিপোর্টে টেবিলগুলিতে দুর্দান্ত সংযোজন করে।
শার্পি

1
শান্ত! জেলের ইয়েলটুলকিটে যা আছে তাতে আমি খুব বেশি খুশি নই এবং টেবিলগুলিতে স্পার্কলাইন রাখতে চাই!
ডার্ক এডেলবুয়েটেল 23'10

এই টিউফট ফোরামের পোস্টের কিছু সহায়তায় plotআমি আমার প্রশ্নের আপডেটে কেবলমাত্র স্পার্কলাইন তৈরির একটি উপায় নথিভুক্ত করেছি
বেন

1
Hmisc::latex()থেকে আউটপুট সংস্করণ Hmisc::describeএকটি মিনি হিস্টোগ্রাম টেবিলের মধ্যে অন্তর্ভুক্ত পরার অন্তর্ভুক্ত করা হয়েছে।
IRTFM

28

ভায়োলিন প্লট (যা কার্নেলের ঘনত্বের সাথে বাক্স প্লটগুলিকে একত্রিত করে) তুলনামূলকভাবে বহিরাগত এবং সুন্দর। আর-তে ভাইপ্লট প্যাকেজ আপনাকে এগুলি খুব সহজেই তৈরি করতে দেয়।

এখানে একটি উদাহরণ (উইকিপিডিয়া লিঙ্কটিও একটি উদাহরণ দেখায়):

এখানে চিত্র বর্ণনা লিখুন


3
জাল প্যাকেজের মাধ্যমে ভায়োলিন প্লটগুলিও পাওয়া যায়:bwplot(... panel = panel.violin)
ডেভিড জে

3
ভায়োলিন প্লটগুলির ggplot2 সংস্করণ শীঘ্রই আসছে। github.com/wch/ggplot2/wiki/geom_violin
রোমান লুস্ট্রিক

আমি পাতলা বেহালা প্লটগুলি এত দরকারী না, তার পরিবর্তে একটি ঘিটারের সাথে সমস্ত বিন্দু দেখানো পছন্দ করি।
নাকেক্স

25

আরেকটি সুন্দর সময় সিরিজের ভিজ্যুয়ালাইজেশন যা আমি কেবল পর্যালোচনা করেছিলাম তা হ'ল "বাম্প চার্ট" ( "লার্নিং আর" ব্লগের এই পোস্টে প্রদর্শিত হয়েছে )। সময়ের সাথে সাথে অবস্থানের পরিবর্তনগুলি দেখার জন্য এটি খুব দরকারী।

আপনি এটি http://learnr.wordpress.com/ এ কীভাবে তৈরি করবেন সে সম্পর্কে পড়তে পারেন , তবে এটি এর মতো দেখতে শেষ হয়:

বিকল্প পাঠ


আমি এই নির্দিষ্ট ডেটাটির জন্য বাম্প চার্টটি পছন্দ করি তবে আরও সাধারণ পরিস্থিতি যেখানে এটি কার্যকর হবে সে সম্পর্কে চিন্তাভাবনা করা খুব কঠিন। এটি বলেছিল, আমি মনে করি যে আমরা সকলেই একমত হতে পারি যে লার্নিং আর ব্লগ মোজা দুলছে।
ইয়ান ফেলো

7
একটি বাম্প চার্টটি র‌্যাঙ্কড ডেটার সমান্তরাল স্থানাঙ্ক প্লট।
হ্যাডলি

1
এটি আমাকে স্লুপগ্রাফের কথা মনে করিয়ে দেয় যা সময়ের সাথে সাথে র‌্যাঙ্কিং পরিবর্তন বা র‌্যাঙ্কিংয়ের মধ্যে সম্পর্কের প্রতিনিধিত্ব করার জন্য ভাল: Charliepark.org/slopeographics
topchef

21

আমি টুফ্টে বক্সপ্লটগুলির পরিবর্তনগুলিও পছন্দ করি যা আপনাকে আরও সহজেই ছোট গুণগুলি তুলনা করতে দেয় কারণ এগুলি অনুভূমিকভাবে খুব "পাতলা" এবং অপ্রয়োজনীয় কালি দিয়ে প্লটটি আঁকড়ে ধরে না। তবে এটি মোটামুটি বৃহত সংখ্যক বিভাগগুলির সাথে সেরা কাজ করে; যদি আপনি কেবল কোনও প্লটে কয়েকটি পেয়ে থাকেন তবে নিয়মিত (টুকি) বক্সপ্লটগুলি আরও ভাল দেখায় যেহেতু তাদের কাছে কিছুটা বেশি .ালু রয়েছে।

library(lattice)
library(taRifx)
compareplot(~weight | Diet * Time * Chick, 
  data.frame=cw , 
  main = "Chick Weights",
  box.show.mean=FALSE,
  box.show.whiskers=FALSE,
  box.show.box=FALSE
  )

compareplot

এগুলি তৈরির অন্যান্য উপায়গুলি (অন্য ধরণের টুফ্টে বক্সপ্লট সহ) এই প্রশ্নে আলোচনা করা হয়েছে


ধন্যবাদ @दरোকজিগ এই দিনগুলির একটির মধ্যে আমি এটির পুনরায় লিখন করব গ্রুপিংয়ের বিভিন্ন কনফিগারেশন নিতে। সেই ফাংশনটি লেখার পর থেকে আমি অনেক কিছু শিখেছি!
এরি বি ফ্রেডম্যান

1
আমি আপনার প্লটগুলি টুফ্টের চেয়ে অনেক ভাল পছন্দ করি, যা হাস্যকরভাবে পড়া শক্ত। আমি এখনও মনে করি যে টুকি-স্টাইলের বক্সপ্লটগুলি আরও ভাল, যদিও একটি ভাল সমঝোতা আপনার এখানে যেমন রয়েছে তেমন কিছু হতে পারে তবে বক্সের জন্য 3px প্রশস্ত লাইনের সাথে অফসেটের পরিবর্তে। এবং আমি মনে করি মাঝারিদের জন্য 1px প্রশস্ত হরিঞ্জন্ত লাইন সম্ভবত আরও কম এবং আরও সঠিক।
nnot101

19

আমাদের সুন্দর এবং (icallyতিহাসিকভাবে) গুরুত্বপূর্ণ স্টেম-ও পাতার প্লট (যে টুফ্টেও খুব পছন্দ করে) সম্পর্কে ভুলে যাওয়া উচিত নয়। আপনি ডেটা ঘনত্ব এবং আকারের একটি সরাসরি সংখ্যাসমূহ পর্যালোচনা পাবেন (অবশ্যই যদি আপনার ডেটা সেটটি প্রায় 200 পয়েন্টের চেয়ে বড় না হয়)। আর-তে, ফাংশনটি stemআপনার স্টেম এবং পাতার ডিসলে (কর্মক্ষেত্রে) উত্পাদন করে। আমি সরাসরি গ্রাফিক ডিভাইসে আঁকতে gstemপ্যাকেজ এফএমএসবি থেকে ফাংশনটি ব্যবহার করতে পছন্দ করি । নীচে স্টেম-বাই-পাত প্রদর্শনে বিভারের দেহের তাপমাত্রার বৈকল্পিকতা (ডেটাটি আপনার ডিফল্ট ডেটাসেটে থাকা উচিত) রয়েছে:

  require(fmsb)
  gstem(beaver1$temp)

এখানে চিত্র বর্ণনা লিখুন


18

একসাথে অনেকগুলি সময় সিরিজ দেখার জন্য হরিজন গ্রাফ (পিডিএফ)।

মাল্টিভারিয়েট বিশ্লেষণের জন্য সমান্তরাল স্থানাঙ্ক প্লট (পিডিএফ)।

অবিচ্ছিন্ন টেবিলগুলি দেখার জন্য সমিতি এবং মোজাইক প্লটগুলি ( ভিসিডি প্যাকেজ দেখুন)


15

টুফ্টের দুর্দান্ত কাজের পাশাপাশি আমি উইলিয়াম এস ক্লিভল্যান্ডের বইগুলি ভিজ্যুয়ালাইজিং ডেটা এবং গ্রাফিংয়ের উপাত্তগুলির উপাদানগুলি সুপারিশ করছি । কেবল তারা দুর্দান্তই নয়, তারা সমস্ত কিছুই আর-তে সম্পন্ন হয়েছিল এবং আমি বিশ্বাস করি কোডটি সর্বজনীনভাবে উপলভ্য।


14

Boxplots! আর সাহায্যের উদাহরণ:

boxplot(count ~ spray, data = InsectSprays, col = "lightgray")

আমার মতে ডেটাতে তাত্ক্ষণিকভাবে নজর দেওয়া বা বিতরণগুলির তুলনা করা সবচেয়ে সহজ উপায়। আরও জটিল বিতরণের জন্য একটি এক্সটেনশন বলা হয় vioplot


2
বিনপ্লট এখানেও উল্লেখ করা যেতে পারে jstatsoft.org/v28/c01/paper এবং cran.r-project.org/web/packages/beanplot/index.html
radek

বক্সপ্লটগুলি কি এলোমেলো নয়, তাই না? আমি নিশ্চিত বলতে চাই যে অনেকগুলি কাগজে বারের চার্ট এমন ডেটার জন্য ব্যবহৃত হয় যা বক্সপ্লিট করা উচিত, তবে সেগুলি এখনও বেশ সাধারণ।
nnot101

11

মোজাইক প্লটগুলি আমার কাছে উল্লিখিত চারটি মাপদণ্ড পূরণ করার মতো বলে মনে হচ্ছে। মোজেইকপ্লটের অধীনে আর এর উদাহরণ রয়েছে।


3
মোজাইক প্লটের আরও ভাল বাস্তবায়ন হল ভিসিডি লাইব্রেরিতে (ফাংশনটির নাম 'মোজাইক')। এটিতে অনেক বেশি নমনীয় পদ্ধতিতে স্বাক্ষর রয়েছে এবং এটি গ্রিডে প্রয়োগ করা হয় ('বেস' গ্রাফিক্স সিস্টেমের চেয়ে)।
18:55

10

এডওয়ার্ড টুফ্টের কাজ এবং বিশেষত এই বইটি দেখুন

আপনি চেষ্টা করতে পারেন এবং তার ভ্রমণ উপস্থাপনাটি ধরতে পারেন । এটি বেশ ভাল এবং তার চারটি বইয়ের একটি বান্ডিল রয়েছে। (আমি দিব্যি আমি তার প্রকাশকের স্টকটির মালিক নই!)

যাইহোক, আমি তার স্পার্কলাইন ডেটা ভিজ্যুয়ালাইজেশন কৌশলটি পছন্দ করি। আশ্চর্য! গুগল এরই মধ্যে এটি লিখে ফেলেছে এবং গুগল কোডে রেখে দিয়েছে


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.