গড়, এসডি, মিনিট এবং সর্বাধিক দিয়ে সংক্ষিপ্ত পরিসংখ্যান প্লট করছেন?


10

আমি একটি অর্থনীতির পটভূমি থেকে এসেছি এবং সাধারণত নিয়মানুবর্তীতে ভেরিয়েবলগুলির সংক্ষিপ্ত পরিসংখ্যানগুলি একটি সারণীতে রিপোর্ট করা হয়। তবে, আমি তাদের চক্রান্ত করতে ইচ্ছুক।

আমি কোনও বক্স প্লটটিকে গড়, মানক বিচ্যুতি, সর্বনিম্ন এবং সর্বাধিক প্রদর্শনের অনুমতি দেওয়ার জন্য পরিবর্তন করতে পারলাম তবে বক্স প্লটগুলি traditionতিহ্যগতভাবে মিডিয়ান এবং কিউ 1 এবং কিউ 3 প্রদর্শন করতে ব্যবহৃত হওয়ায় আমি তা করতে চাই না।

আমার সমস্ত ভেরিয়েবলের বিভিন্ন স্কেল রয়েছে। এটি দুর্দান্ত হবে যদি কেউ কোনও অর্থবহ উপায়ে পরামর্শ দিতে পারে যার মাধ্যমে আমি এই সংক্ষিপ্ত পরিসংখ্যানগুলি প্লট করতে পারি। আমি আর বা স্টাতার সাথে কাজ করতে পারি।


1
তালিকায় আপনাকে স্বাগতম। আপনি যদি Rআদেশগুলি সম্পর্কে জিজ্ঞাসা করছেন তবে এই প্রশ্নটি এখানে অফ-টপিক। তবে মনে হয় আপনি একটি ভাল চক্রান্ত কেমন হবে এবং দ্বিতীয়টি কীভাবে এটি তৈরি করবেন সে সম্পর্কে প্রাথমিকভাবে জিজ্ঞাসা করছেন। যদি তা হয় তবে আমি আপনার শিরোনাম থেকে "আর" দিয়ে মুছে ফেলার পরামর্শ দিচ্ছি এবং সম্ভবত আপনার শরীরে উল্লেখ করা আছে যে আপনি Rউপলব্ধ।
পিটার ফ্লুম

উত্তর:


16

টুয়ের বক্সপ্লট সর্বজনীন হওয়ার কারণ রয়েছে, এটি গাউসিয়ান থেকে পোইসন ইত্যাদিতে বিভিন্ন বিতরণ থেকে প্রাপ্ত ডেটাগুলিতে প্রয়োগ করা যেতে পারে Med স্বাভাবিক। যাইহোক, গড় এবং এসডি বহিরাগতদের কাছে বেশি প্রবণ এবং তাদের অন্তর্নিহিত বিতরণে শ্রদ্ধার সাথে ব্যাখ্যা করা উচিত। নীচের সমাধানটি স্বাভাবিক বা লগ-স্বাভাবিক ডেটার জন্য আরও উপযুক্ত। আপনি এখানে শক্ত ব্যবস্থা গ্রহণের মাধ্যমে ব্রাউজ করতে পারেন এবং ডাব্লুআরএস আর প্যাকেজটি এখানে অন্বেষণ করতে পারেন ।

# simulating dataset
set.seed(12)
d1 <- rnorm(100, sd=30)
d2 <- rnorm(100, sd=10)
d <- data.frame(value=c(d1,d2), condition=rep(c("A","B"),each=100))

# function to produce summary statistics (mean and +/- sd), as required for ggplot2
data_summary <- function(x) {
   mu <- mean(x)
   sigma1 <- mu-sd(x)
   sigma2 <- mu+sd(x)
   return(c(y=mu,ymin=sigma1,ymax=sigma2))
}

# require(ggplot2)
ggplot(data=d, aes(x=condition, y=value, fill=condition)) + 
geom_crossbar(stat="summary", fun.y=data_summary, fun.ymax=max, fun.ymin=min)

উপরের কোডটি যুক্ত করে + geom_jitter()বা যুক্ত করে + geom_point()আপনি একই সাথে কাঁচা ডেটা মানগুলি ভিজ্যুয়ালাইজ করতে পারেন।


বেহালা প্লটটি দেখানোর জন্য @ রোল্যান্ডকে ধন্যবাদ । সংক্ষিপ্ত পরিসংখ্যান হিসাবে একই সময়ে সম্ভাব্যতা ঘনত্ব দেখার জন্য এটির একটি সুবিধা রয়েছে:

# require(ggplot2)
ggplot(data=d, aes(x=condition, y=value, fill=condition)) + 
geom_violin() + stat_summary(fun.data=data_summary)

উভয় উদাহরণ নীচে প্রদর্শিত হয়।

এখানে চিত্র বর্ণনা লিখুন


2
আমি এর চেয়ে বেশি একটি বেহালা প্লট পছন্দ করব।
রোল্যান্ড

1
বিশ্লেষণের উদ্দেশ্য অনুসারে, গড় এবং মানক বিচ্যুতি হ'ল আপনার যা প্রয়োজন। আর এর সংক্ষিপ্ত বিবরণে.ডাটা.ফ্রেমে তবে আমি বুঝতে পারি না। এটি মানে কিন্তু কোনও এসডিএস দেখায়। আমি এমন অনেক পরিস্থিতিতে ভাবতে পারি না যেখানে উপায়গুলি কার্যকর তবে মানক বিচ্যুতি বিভ্রান্তিকর।
মাইকেল এম

আসলে, কখনও কখনও আপনাকে গড় এবং এসডিটি দেখতে হবে যাতে আপনি এটি কার্যকর কিনা তা বিচার করুন ....
নিক কক্স

1
@ টিডব্লুএল: এখানে আলোচনার জন্য বিষয়টি খুব বেশি বিস্তৃত। তবে উদাহরণস্বরূপ ওষুধের অর্থনৈতিক মূল্যায়নগুলি গ্রহণ করুন: রোগীর জন্য, সম্ভবত চিকিত্সার সময়কাল জানতে গুরুত্বপূর্ণ, যখন স্বাস্থ্য বীমা সংস্থার পক্ষে এটির চিকিত্সার গড় সময়কাল হয় কারণ তাদের প্রতিটি রোগীর জন্য এটি প্রদান করা প্রয়োজন। একটি কৌতূহলোদ্দীপক সত্য: তাত্পর্য বিতরণ ক্ষেত্রে, গড় +/- 1 স্ট্যান্ডার্ড বিচ্যুতি সমস্ত ভর 68৮%, মানে +/- 2 এসডিএস সমস্ত ভর প্রায় 95% কভার করে। স্বাভাবিক হিসাবে। (তবে এটি কেবল সুযোগ;))
মাইকেল এম

1
সবাইকে ধন্যবাদ, আমি প্রস্তাবিত বেহালা প্লট পছন্দ করি তাই সেই পছন্দটি নিয়ে এগিয়ে যাব :-)
রিধিমা

9

অগণিত সম্ভাবনা আছে।

একটি বিকল্প যা আমি দেখেছি যা বক্সপ্লটগুলির সাথে বিভ্রান্তি এড়ায় (ধরে নেওয়া আপনার মিডিয়ান বা মূল ডেটা উপলব্ধ available বক্সপ্লটের এই সংস্করণ যা গড়ের জন্য একটি চিহ্নকে যুক্ত করে, তা উল্লেখ করা হয়েছে, উদাহরণস্বরূপ ফ্রিগ এট আল (1989) [1] এ:

বক্সপ্লটগুলি বোঝানো মানেও চিহ্নিত হয়েছে

বাম প্লটটি একটি গড় চিহ্ন হিসাবে একটি চিহ্নকে দেখায় এবং ডান প্লটটি ডোনে এবং ট্রেসির বিম-ও-ফুলক্রাম প্লট [২] থেকে গড় চিহ্নিতকারীকে অভিযোজিত করে প্রান্তে একটি ত্রিভুজ ব্যবহার করে।

আরও দেখুন এই তাই পোস্টে এবং এই এক

আপনার যদি মাধ্যম না থাকে (বা সত্যই দেখাতে চান না) তবে একটি নতুন প্লট প্রয়োজন হবে এবং তারপরে বক্সপ্লট থেকে দৃশ্যত পৃথক হওয়া ভাল।

সম্ভবত এরকম কিছু:

এখানে চিত্র বর্ণনা লিখুন

±

এখানে চিত্র বর্ণনা লিখুন

±

যদি আপনার সংখ্যাগুলি খুব আলাদা স্কেলে থাকে তবে সমস্ত ইতিবাচক হয় তবে আপনি লগ সহ কাজ করা বিবেচনা করতে পারেন, বা আপনি বিভিন্ন (তবে স্পষ্টভাবে চিহ্নিত) স্কেল দিয়ে ছোট গুণগুলি করতে পারেন

কোড (বর্তমানে বিশেষত 'দুর্দান্ত' কোড নয়, তবে এই মুহূর্তে এটি কেবল ধারণাগুলি অন্বেষণ করছে, এটি ভাল আর কোড লেখার কোনও টিউটোরিয়াল নয়):

fivenum.ms=function(x) {r=range(x);m=mean(x);s=sd(x);c(r[1],m-s,m,m+s,r[2])}
eps=.015

plot(factor(c(1,2)),range(c(A,B)),type="n",border=0)
points((rep(c(1,2),each=5)),c(fivenum.ms(A),fivenum.ms(B)),col=rep(c(2,4),each=5),pch=rep(c(1,16,9,16,1),2),ylim=c(range(A,B)),cex=1.2,lwd=2,xlim=c(0.5,2.5),ylab="",xlab="")
rect(1-1.2*eps,fivenum.ms(A)[2],1+1.4*eps,fivenum.ms(A)[4],lwd=2,col=2,den=0)
rect(2-1.2*eps,fivenum.ms(B)[2],2+1.4*eps,fivenum.ms(B)[4],lwd=2,col=4,den=0)

plot(factor(c(1,2)),range(c(A,B)),type="n",border=0)
points((rep(c(1,2),each=5)),c(fivenum.ms(A),fivenum.ms(B)),col=rep(c(2,4),each=5),pch=rep(c(1,16,9,16,1),2),ylim=c(range(A,B)),cex=1.2,lwd=2,xlim=c(0.5,2.5),ylab="",xlab="")
rect(1-eps/9,fivenum.ms(A)[2],1+eps/3,fivenum.ms(A)[4],lwd=2,col=2,den=0)
rect(2-eps/9,fivenum.ms(B)[2],2+eps/3,fivenum.ms(B)[4],lwd=2,col=4,den=0)

[1] ফ্রিগ, এম।, ডিসি হোয়াগলিন এবং বি। আইগেলভিজ (1989),
"বক্স প্লটের কিছু বাস্তবায়ন।"
আমেরিকান পরিসংখ্যানবিদ , 43 (ফেব্রুয়ারি): 50-54।

[২] দোয়ান ডিপি এবং আরএল ট্রেসি (2000),
"ডেটা এক্সপ্লোর করতে বিম এবং ফুলক্রাম ডিসপ্লে ব্যবহার করে"
আমেরিকান পরিসংখ্যানবিদ , 54 (4): 289-2290, নভেম্বর

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.