এবং আমি মনে করি না বর্তমান উত্তর অধিকাংশ আসলে যে সমস্যার সাথে মোকাবেলা করবেন - কেন্দ্রীয় সমস্যা ওপি আছে বলে মনে হচ্ছে তারা খুব ভারী লেজ গুটাইয়া পলাইয়া তথ্য আছে যে এ সব , তাই আমি একটি উত্তর আমার আগের মন্তব্য প্রচার করছি।
আপনি যদি বক্সপ্লটগুলির সাথে থাকতে চান তবে কিছু বিকল্প নীচে তালিকাবদ্ধ রয়েছে। আমি আর তে কিছু ডেটা তৈরি করেছি যা মূল সমস্যাটি দেখায়:
set.seed(seed=7513870)
x <- rcauchy(80)
boxplot(x,horizontal=TRUE,boxwex=.7)
ডেটার মাঝের অর্ধেকটি কয়েক মিমি প্রশস্ত একটি ক্ষুদ্র স্ট্রিপ থেকে কমে যায়। কিউকিউ প্লট, স্ট্রিপ চার্ট, মৌচাক / মৌমাছির প্লট এবং বেহালা প্লট সহ আরও বেশিরভাগ পরামর্শ একই ধরণের সমস্যায় পড়ে।
এখন কয়েকটি সম্ভাব্য সমাধান:
1) রূপান্তর ,
যদি লগ বা বিপরীতগুলি একটি পঠনযোগ্য বক্সস্প্লট উত্পাদন করে তবে এগুলি খুব ভাল ধারণা হতে পারে এবং মূল স্কেলটি অক্ষের উপরে এখনও প্রদর্শিত হতে পারে।
বড় সমস্যাটি হ'ল কখনও কখনও কোনও 'স্বজ্ঞাত' রূপান্তর হয় না। একটি ছোট সমস্যা আছে যে কোয়ান্টাইলগুলি নিজেরাই একঘেয়ে রূপান্তরগুলি যথাযথভাবে অনুবাদ করে, বেড়া দেয় না; যদি আপনি কেবল রূপান্তরিত ডেটা বক্সপ্লট করেন (যেমনটি আমি এখানে করেছি) তবে হুইস্কারগুলি মূল প্লটের চেয়ে আলাদা এক্স-মানগুলিতে থাকবে।
এখানে আমি একটি বিপরীত-হাইপারবোলিক-পাপ (asinh) ব্যবহার করেছি; এটি লেজগুলিতে লোগলের মতো এবং শূন্যের নিকটে রৈখিকের সমান, তবে লোকে সাধারণত এটি একটি স্বজ্ঞাত রূপান্তর খুঁজে পায় না, সুতরাং লগের মতো মোটামুটি স্বজ্ঞাত রূপান্তর প্রকট না হলে সাধারণভাবে আমি এই বিকল্পটির প্রস্তাব দিই না। এর জন্য কোড:
xlab <- c(-60,-20,-10,-5,-2,-1,0,1,2,5,10,20,40)
boxplot(asinh(x),horizontal=TRUE,boxwex=.7,axes=FALSE,frame.plot=TRUE)
axis(1,at=asinh(xlab),labels=xlab)
2) স্কেল বিরতি - চূড়ান্ত outliers নিতে এবং প্রতিটি প্রান্তে সংকীর্ণ উইন্ডোতে কেন্দ্রের চেয়ে অনেক বেশি সংকুচিত স্কেল দিয়ে সংকুচিত করুন। আপনি যদি এটি করেন তবে আমি পুরো স্কেলটিকে সম্পূর্ণ বিরতি দেওয়ার জন্য সুপারিশ করছি।
opar <- par()
layout(matrix(1:3,nr=1,nc=3),heights=c(1,1,1),widths=c(1,6,1))
par(oma = c(5,4,0,0) + 0.1,mar = c(0,0,1,1) + 0.1)
stripchart(x[x< -4],pch=1,cex=1,xlim=c(-80,-5))
boxplot(x[abs(x)<4],horizontal=TRUE,ylim=c(-4,4),at=0,boxwex=.7,cex=1)
stripchart(x[x> 4],pch=1,cex=1,xlim=c(5,80))
par(opar)
৩) চরম বিদেশিদের ছাঁটাই (যা আমি সাধারণত এটিকে খুব স্পষ্টভাবে ইঙ্গিত না করে পরামর্শ দেব না, তবে এটি পরের চক্রান্তের মতো দেখায়, উভয় প্রান্তে "<5" এবং "2>" ছাড়া), এবং
৪) আমি চরম-আউটলেটকে "তীর" বলব - ট্রিমিংয়ের অনুরূপ, তবে প্রতিটি প্রান্তে নির্দেশিত ছাঁটা মানের সাথে
xout <- boxplot(x,range=3,horizontal=TRUE)$out
xin <- x[!(x %in% xout)]
noutl <- sum(xout<median(x))
nouth <- sum(xout>median(x))
boxplot(xin,horizontal=TRUE,ylim=c(min(xin)*1.15,max(xin)*1.15))
text(x=max(xin)*1.17,y=1,labels=paste0(as.character(nouth)," >"))
text(x=min(xin)*1.17,y=1,labels=paste0("< ",as.character(noutl)))