কোনও হিস্টোগ্রামে গড়টি পরিকল্পনা করা কি উপযুক্ত?


13

গড় মানটি দেখার জন্য কোনও হিস্টোগ্রামে একটি উল্লম্ব রেখা যুক্ত করা কি "ঠিক আছে"?

আমার কাছে এটি ঠিক আছে বলে মনে হয় তবে আমি এটি পাঠ্যপুস্তক এবং পছন্দগুলিতে কখনও দেখিনি, তাই আমি ভাবছি যে এটি না করার জন্য কোনও ধরণের কনভেনশন রয়েছে কি না?

গ্রাফটি একটি টার্ম পেপারের জন্য, আমি কেবল এটি নিশ্চিত করতে চাই যে আমি দুর্ঘটনাক্রমে কিছু অতি গুরুত্বপূর্ণ অপ্রচলিত পরিসংখ্যান নিয়ম ভঙ্গ করব না। :)


কেন না. একটি মন্তব্য যোগ করতে। হিস্টোগ্রাম হিসাবে গড়টি একটি সংক্ষিপ্ত মান। উদাহরণস্বরূপ আপনি হিস্টোগ্রামের বালতি আকারের পরিবর্তিত প্রদত্ত তথ্যের ডিগ্রী পরিবর্তন করতে পারেন। তবে সাধারণত হিস্টগ্রাম কেবল গড়ের চেয়ে বেশি তথ্য সরবরাহ করে। আপনি আসলে কোনও হিস্টগ্রাম থেকে গড় মান আনুমানিক করতে পারেন। আমি মনে করি সে কারণেই এগুলি সাধারণত একসাথে সরবরাহ করা হয় না।
সিমোন

কেউ কখনও কখনও একটি ওভারলাইড বিতরণ দিয়ে হিস্টোগ্রামগুলি দেখতে পায় (উদাহরণস্বরূপ আমার অভিজ্ঞতায় সাধারণত বন্টনটি নমুনার অর্থ এবং মানক বিচ্যুতি ব্যবহার করে প্লট করা হয়েছিল)) যা উল্লম্ব রেখা আঁকার মতো একই জিনিসটি (এবং আরও কিছুটা) করছে যা নির্দেশ করে যেখানে নমুনা গড়টি বক্ররেখার শীর্ষে রয়েছে))
জেমস স্ট্যানলি

উত্তর:


30

অবশ্যই, কেন না?

গড় সঙ্গে হিস্টোগ্রাম

এখানে একটি উদাহরণ রয়েছে (একটি সাধারণ গুগল অনুসন্ধানের সাথে আমি কয়েক ডজনের মধ্যে একটি পেয়েছি):

গড় এবং মধ্যমা সহ হিস্ট

(চিত্র উৎস পরিমাপ ব্যবহারযোগ্যতা ব্লগ, হয় এখানে ।)

আমি অর্থ, অর্থ প্লাস বা বিয়োগের একটি মানক বিচ্যুতি দেখেছি, বিভিন্ন কোয়ান্টাইলগুলি (যেমন মিডিয়ান, কোয়ার্টাইলস, দশম এবং 90 তম পার্সেন্টাইল) সমস্ত বিভিন্ন উপায়ে প্রদর্শিত হয়।

প্লট জুড়ে সরাসরি একটি লাইন আঁকার পরিবর্তে, আপনি এর নীচে বরাবর তথ্য চিহ্নিত করতে পারেন - এর মতো:

প্রান্তিক বক্সপ্লট সহ হিস্টোগ্রাম

সেখানে শীর্ষ জুড়ে পরিবর্তে নীচে, এ boxplot সঙ্গে একটি উদাহরণ (অনেক এক পাওয়া যাবে) এর এখানে

কখনও কখনও লোকেরা ডেটা চিহ্নিত করে:

হিস্টগ্রাম রাগপ্লট সাথে জিটার
(আমি ডেটার লোকেশনগুলিকে সামান্য বিদ্রূপিত করেছি কারণ মানগুলি পূর্ণসংখ্যার সাথে বৃত্তাকার হয়ে গিয়েছিল এবং আপনি আপেক্ষিক ঘনত্বটি ভালভাবে দেখতে পারেন না))

এই পৃষ্ঠায় স্টাটাতে সম্পন্ন এই জাতীয় উদাহরণ রয়েছে ( এখানে তৃতীয়টি দেখুন )

কিছু অতিরিক্ত তথ্য দিয়ে হিস্টোগ্রামগুলি আরও ভাল - তারা নিজেরাই বিভ্রান্ত হতে পারে

আপনার প্লটটি কী কী নিয়ে গঠিত তা বোঝানোর জন্য আপনাকে কেবল যত্ন নেওয়া দরকার! (আপনি এখানে শুরুর জন্য আমি এখানে ব্যবহারের চেয়ে আরও ভাল শিরোনাম এবং এক্স-অক্ষের লেবেল চাইবেন। প্লাস কোনও চিত্রের শিরোনামে একটি ব্যাখ্যা আপনি কী এতে চিহ্নিত করেছিলেন তা ব্যাখ্যা করে))

-

একটি শেষ চক্রান্ত:

স্ট্রিপচার্ট সহ হিস্টোগ্রাম

-

আমার প্লটগুলি আর এ তৈরি করা হয়েছে

সম্পাদনা:

@ গং সুরমাইজড হিসাবে, abline(v=mean...প্লটটি জুড়ে গড় লাইনটি rugআঁকতে ব্যবহৃত হয়েছিল এবং ডেটা মানগুলি আঁকতে ব্যবহৃত হয়েছিল (যদিও আমি আসলে ব্যবহার করেছি rug(jitter(...কারণ ডেটাটি পূর্ণসংখ্যার সাথে বৃত্তাকার ছিল)।

হিস্টোগ্রাম এবং অক্ষের মধ্যে বক্সপ্লট করার একটি উপায় এখানে রয়েছে:

hist(Davis2[,2],n=30)
boxplot(Davis2[,2],
  add=TRUE,horizontal=TRUE,at=-0.75,border="darkred",boxwex=1.5,outline=FALSE)

আমি এখানে যা আছে তার জন্য তালিকা বদ্ধ করতে যাচ্ছি না, তবে ?boxplotতারা কীসের জন্য রয়েছে তা অনুসন্ধান করতে এবং সাহায্যের সাথে আপনি নিজে খেলতে সাহায্যের জন্য যুক্তিগুলি পরীক্ষা করতে পারেন ।

তবে এটি কোনও সাধারণ সমাধান নয় - আমি গ্যারান্টি দিচ্ছি না যে এটি এখানে সর্বদা যেমন কাজ করে (নোট আমি ইতিমধ্যে atএবং boxwexবিকল্পগুলি * পরিবর্তন করেছি )। আপনি যদি সমস্ত কিছুর যত্ন নেওয়ার জন্য কোনও বুদ্ধিমান ফাংশন না লিখেন তবে আপনি যা চান তা নিশ্চিত করার জন্য সবকিছু কী করে তা মনোযোগ দেওয়া প্রয়োজন।

আমি যে ডেটা ব্যবহার করেছি তা কীভাবে তৈরি করবেন তা এখানে রয়েছে (আমি চেষ্টা করার চেষ্টা করছিলাম যে থিল রিগ্রেশন কীভাবে বেশ কয়েকটি প্রভাবশালী বহিরাগতকে পরিচালনা করতে সক্ষম হয়েছিল)। আমি প্রথম যখন এই প্রশ্নের উত্তর দিয়েছিলাম তখন আমি যে ডেটা দিয়ে খেলছিলাম তা হ'ল।

 library("car")
 add <- data.frame(sex=c("F","F"),
       weight=c(150,130),height=c(NA,NA),repwt=c(55,50),repht=c(NA,NA))
 Davis2 <- rbind(Davis,add)

* - এর জন্য একটি উপযুক্ত মান atএর মান -0.5 গুণ প্রায় boxwex; আপনি এটি করতে কোনও ফাংশন লিখলে এটি একটি ভাল ডিফল্ট হবে; boxwexবক্সপ্লটের ওয়াই-স্কেল (উচ্চতা) এর সাথে সম্পর্কিত এমনভাবে স্কেল করা দরকার; আমি 0.04 থেকে 0.05 বারের উপরের ওয়াই-লিমিটটি প্রায়শই ঠিক থাকতে পারি বলে পরামর্শ দিই।

প্রান্তিক স্ট্রিপচার্টের জন্য কোড:

 hist(Davis2[,2],n=30)
 stripchart(jitter(Davis2[,2],amount=.5),
       method="jitter",jitter=.5,pch=16,cex=.05,add=TRUE,at=-.75,col='purple3')

+1, এগুলি দুর্দান্ত; কোড যুক্ত করতে যত্নশীল? abline(v=mean(Davis2[,2]))& rug(Davis2[,2])আমি অনুমান করব, তবে আপনি সেখানে বক্সপ্লটকে কীভাবে আটকাবেন?
গুং - মনিকা পুনরায়

1
@ গং সংক্ষিপ্ত বিবরণের জন্য সম্পাদনাটি দেখুন, বক্সপ্লট সহকারীর মতো পুনরুত্পাদনযোগ্য উদাহরণ সহ। এটি boxplotকার্যকরীভাবে বেশ কয়েকটি যুক্তি ব্যবহার করার চেয়ে চতুর ছাড়া আর কিছুই করছে না । এর মধ্যে boxplotএবং boxpআপনি অল্প পরিশ্রমে কিছু বদলে কিছু করতে পারেন।
গ্লেন_বি -রিনস্টেট মনিকা

বয়সের জন্য জ্ঞান: "আপনি যদি সমস্ত কিছুর যত্ন নেওয়ার জন্য কোনও বুদ্ধিমান ফাংশন না লিখেন তবে আপনি যা চান তা করছে কিনা তা নিশ্চিত করার জন্য সবকিছু কী করে তা মনোযোগ দেওয়া প্রয়োজন" ;-)।
গুং - মনিকা পুনরায়

হাঁ। আমি এমনকি সেটে চালাক কিছু লেখার ছাঁদা atএবং boxwexইত্যাদি ... কিন্তু শ্রেষ্ঠ সময়ে আমি কেবল যে এক বছরের মত কয়েক প্লট না, এবং এটি একটি কয়েক সেকেন্ডের ধরনের প্রতিটি সময় লাগে? Boxplot এবং ডান বিকল্পগুলি সেট করেন। আমি অনুভব করেছি যে আমি যা করছি তার দিকে মনোযোগ দেওয়া সহজ।
গ্লেন_বি -রিনস্টেট মনিকা

আমি যে ডেভিস 2 ডেটা ব্যবহার করছিলাম তা তৈরি করার জন্য কোডটি দেওয়ার জন্য @ গুংগ সম্পাদনা করেছি। আশা করি এইটি কাজ করবে.
গ্লেন_বি -রিনস্টেট মনিকা

3

অবশ্যই আপনি করতে পারেন. লাইনটির অর্থ কী তা স্পষ্টভাবে লেবেল / ইঙ্গিত করার বিষয়ে নিশ্চিত হোন এবং প্লটটিকে খুব 'ব্যস্ত' বানাবেন না।

কোনও গ্রাফের চেয়ে খারাপ আর কিছুই নয় যা সহজেই বোধগম্য হওয়ার জন্য খুব বেশি তথ্য সরবরাহ করে। পরিষ্কার, সংক্ষিপ্ত বিষয়ে সংক্ষিপ্ত পরিসংখ্যান প্রদর্শন করার জন্য টেবিলটি প্রায়শই অবহেলিত উপায়।


2

পূর্ববর্তী উত্তরগুলি দুর্দান্ত পয়েন্ট দেয় তবে এখানে যোগ করার জন্য একটি মৌলিক বিষয় রয়েছে।

গড়টি হ'ল একটি বিতরণের মাধ্যাকর্ষণ কেন্দ্র এবং তাই কোনও হিস্টোগ্রামের পাইভ পয়েন্ট। এটি বিতরণ ভারসাম্য হবে যেখানে। সুতরাং, একটি পারস্পরিক সম্পর্ক রয়েছে: কেবলমাত্র হিস্টোগ্রাম সম্পর্কে আপনাকে ভাবতে সহায়তা করতে পারে না, একই সাথে একটি হিস্টগ্রাম আপনাকে গড় সম্পর্কে চিন্তা করতে সহায়তা করতে পারে বিতরণটি যখন স্কিউ করা হয় এবং বিতরণের গড় মাঝখানে হয় না তখন এটি আরও বেশি সহায়ক।


1

আমি এটা দিয়ে কোন সমস্যা দেখেন তাহলে, দেখতে এই , এই , এবং এই উদাহরণ হিসাবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.