একটি বক্স প্লট কোন তথ্য সরবরাহ করে যা একটি হিস্টোগ্রাম দেয় না?


13

হিস্টোগ্রামগুলি একটি ভেরিয়েবলের বিতরণে ভাল ধারণা দেয়। বক্স প্লটগুলি একই জিনিসটি করার চেষ্টা করে তবে এই ভেরিয়েবলের বিতরণের কোনও চিত্রকে ভাল দেয় না।

লোকেরা বক্স প্লট কেন ব্যবহার করে তা আমি বুঝতে পারি না। হিস্টোগ্রামগুলি প্রতিটি উপায়েই ভাল। আমি উভয় ব্যবহার করার কোন কারণ আছে?

আমার মনে হয় যে কেবলমাত্র বাক্স প্লটগুলি হ'ল: বিদেশীরা! এটি আমাদের জানায় যে কোন পর্যবেক্ষণগুলি বিদেশী হতে পারে।


1
পুরো বিতরণের প্রতিনিধিত্বের চেয়ে হিস্টোগ্রাম কি প্রতিটি উপায়ে খারাপ?
অ্যান্টনি মার্টিন

2
আপনি যা চান তার উপর নির্ভর করে, একটি বক্স প্লটের সাথে আপনার কিছু সুনির্দিষ্ট মান থাকতে পারে (যেমন মিডিয়ান, পি 75), যা আপনার কোনও হিস্টোগ্রামের সাথে নেই। এটি কম তথ্য প্রদর্শন করে তবে সিনথেটিক more আমার বক্তব্যটি হিস্টگرام এমনকি পুরো বিতরণের তুলনায় একটি সরলীকরণ এবং তথ্যের অপচয় is তবে এটি ব্যবহার করা সহজ হতে পারে
অ্যান্টনি মার্টিন

2
হিস্টোগ্রামের ইউটিলিটি সম্পর্কে একটি বিপরীত দৃষ্টিভঙ্গি stats.stackexchange.com/a/51753 (যা "হিস্টোগ্রাম" এর জন্য আমাদের সাইটের সন্ধানের মাধ্যমে পাওয়া যাবে) এ উচ্চ উত্সাহিত পোস্টে নিখুঁতভাবে প্রকাশ করা হয়েছে, এবং ভালভাবে চিত্রিত হয়েছে ।
হোবার

3
আকর্ষণীয় চিন্তাভাবনা - তবে বিনের আকার বাড়ানো হিস্টোগ্রামকে একটি বক্সপ্লট-জাতীয় চিত্রে হ্রাস করবে যখন কাটপয়েন্টগুলির পছন্দের উপর দুর্ভাগ্যজনক নির্ভরতা বজায় রাখবে। আইএমএইচও, বক্সপ্লটগুলির আসল বৈশিষ্ট্যগুলি মাল্টিভারিয়েট ডেটার অনুসন্ধানের বিশ্লেষণের জন্য টোকির এন-লেটার সারসংক্ষেপের ব্যবহার অধ্যয়ন করে এবং মনে রেখেছিল যে তিনি সেই সময় পেন্সিল এবং কাগজ দিয়ে গণনা করেছিলেন। "ঘোরাঘুরির স্কিম্যাটিক ট্রেস" এর মতো ভিজ্যুয়ালাইজেশনের জন্য হিস্টোগ্রাম বা বেহালা প্লটের মতো শর্তাধীন প্রতিক্রিয়ার অন্যান্য অবিচ্ছিন্ন সংক্ষিপ্তসারগুলি কার্যকরভাবে কাজ করবে না।
whuber

1
হিস্টোগ্রামের দুটি ব্যর্থতা (ইমো) ঘটে যখন কয়েকটি নমুনা থাকে বা বাক্সগুলি যখন ভুল আকারের হয়। একটি ভাল বক্সপ্লোটের দুর্বলতা (এবং আমি যখন বলি তখন জেএমপি পরিবর্তনশীলতা ভাবছি) হ'ল বহু-মড্যালিটি এবং সূক্ষ্ম বিবরণ। এমন কয়েকটি জায়গা যেখানে বক্সপ্লট জ্বলজ্বল করে যখন কয়েকটি নমুনা থাকে। আমি এটিকেও পছন্দ করি যখন বিভিন্ন স্তরে প্রচুর ইন্টারেক্টিভ ভেরিয়েবল থাকে - এভাবে জেএমপি ভেরিয়েবিলিটি প্লট।
EngrStudent

উত্তর:


16

সত্য যে বাক্স প্লটগুলি বিতরণের একটি সংক্ষিপ্তসার আরও সরবরাহ করে তা নির্দিষ্ট ক্ষেত্রে একটি সুবিধা হিসাবেও দেখা যেতে পারে। কখনও কখনও যখন আমরা বিতরণগুলির সাথে তুলনা করি তখন আমরা সামগ্রিক আকারের বিষয়ে চিন্তা করি না, বরং যেখানে বিতরণগুলি একে অপরের সাথে সম্পর্কিত। পাশাপাশি কোয়ান্টাইলগুলি প্লট করা আমাদের এটির যত্ন নিতে পারে না এমন অন্যান্য বিবরণে আমাদের বিভ্রান্ত না করে এটি করার একটি কার্যকর উপায় হতে পারে।


1
এটি সেরা উত্তর। হিস্টোগ্রামের তুলনায় ডিস্ট্রিবিউশন তুলনা করার জন্য বক্সপ্লটগুলি আরও ভাল!
কেজিটিল বি হলওয়ার্সন

14

অবিচ্ছিন্ন ক্ষেত্রে, বাক্স-প্লটগুলি এমন কিছু তথ্য সরবরাহ করে যা হিস্টোগ্রাম দেয় না (অন্তত, স্পষ্টভাবে নয়)। এটি হ'ল এটি সাধারণত মধ্যম, ২৫ তম এবং thth তম পার্সেন্টাইল, ন্যূনতম / ম্যাক্স সরবরাহ করে যা কোনও আউটলেট নয় এবং বহিরাগত হিসাবে বিবেচিত পয়েন্টগুলি স্পষ্টভাবে পৃথক করে। এগুলি সবই হিস্টোগ্রাম থেকে "চোখের পাতলা" হতে পারে (এবং বহিরাগতদের ক্ষেত্রে চোখের ছাঁটাই করা আরও ভাল)।

যাইহোক, অনেক বড় সুবিধা হ'ল এক সাথে অনেকগুলি বিভিন্ন গোষ্ঠীতে বিতরণকে তুলনা করে। 10+ গোষ্ঠী সহ, এটি পাশের পাশের হিস্টোগ্রামগুলির সাথে ক্লান্তিকর কাজ তবে বক্স প্লটের সাথে খুব সহজ।

যেমনটি আপনি উল্লেখ করেছেন, বেহালা প্লট (বা শিমের প্লট) কিছুটা তথ্যমূলক বিকল্প। তবে, বক্স প্লটের তুলনায় তাদের কিছুটা পরিসংখ্যানগত জ্ঞান প্রয়োজন (যেমন যদি কোনও অ-পরিসংখ্যান দর্শকদের কাছে উপস্থাপন করা হয় তবে এটি কিছুটা ভয় দেখানো হতে পারে) এবং বাক্স-প্লটগুলি কার্নেলের ঘনত্বের অনুমানের চেয়ে প্রায় দীর্ঘতর ছিল, তাই তাদের বৃহত্তর জনপ্রিয়তা।


3
+1 টি। যদিও সংশোধন, বাক্স-প্লটগুলি মাধ্যম সরবরাহ করে, অর্থ নয়।
গ্রিনপার্কার

3
সবাই ঠিক থাকতে পারে। বক্স প্লটগুলি সাধারণত প্লট করা শো মিডিয়ানদের হিসাবে দেখায় (আমি এটি অস্বীকার করে দেখেছি, তবে উদাহরণ দেখে মনে নেই)। তবে কিছু বাস্তবায়ন আপনাকে পাশাপাশি উপায় দেখানোর অনুমতি দেয়। এটি প্রায়শই একটি ভাল ধারণা।
নিক কক্স

যে ইশারা জন্য ধন্যবাদ। আমি মনে করি (ভুলভাবে) মনে করি এটি সাধারণত গড়, যা চরম ক্ষেত্রে কিছু খুব অদ্ভুত প্লট হতে পারে।
ক্লিফ এবি

1
বক্স প্লট বনাম হিস্টোগ্রামের সাথে পাশাপাশি তুলনাগুলির মান দেখানোর জন্য চিত্রগুলি যদি পাশাপাশি যেতে হত তবে খুব ভাল লাগবে
রুডলফ ওলা

7
  1. যদি আমি আপনাকে একটি হিস্টোগ্রাম দেখায় এবং মিডিয়ানটি কোথায় তা আপনাকে জিজ্ঞাসা করে, আপনি সম্ভবত এটি বেশ কিছুটা সময় বের করতে পারেন ... এবং তারপরে আপনি কেবল এটির সাথে একটি সীমাবদ্ধতা পাবেন। আমি যদি একটি বক্সপ্লট দিয়ে একই কাজ করি তবে তা অবিলম্বে আপনার কাছে আছে; যদি আপনি এটিতে আগ্রহী হন তবে বক্সপ্লটগুলি অবশ্যই জিতবে।

  2. আমি একমত যে বাক্সপ্লটগুলি কোনও একক নমুনার বিতরণের বর্ণনার মতো কার্যকর নয়, যেহেতু তারা এটিকে কয়েকটি পয়েন্টে হ্রাস করে এবং এটি আপনাকে খুব বেশি কিছু বলে না।

    তবে, আপনি যদি কয়েক ডজন বিতরণকে তুলনা করছেন, প্রত্যেকের সমস্ত বিবরণ থাকা সহজে তুলনা করার চেয়ে আরও বেশি তথ্য হতে পারে - আপনি তুলনা করার জন্য তথ্যকে অল্প সংখ্যায় হ্রাস করতে চাইতে পারেন।

  3. যদি আরও তথ্য আরও ভাল হয় তবে হিস্টোগ্রামের চেয়ে আরও অনেক ভাল পছন্দ রয়েছে; একটি স্টেম এবং পাতার প্লট, উদাহরণস্বরূপ, বা একটি ইডিডিএফ / কোয়ান্টাইল প্লট।

    অথবা আপনি কোনও হিস্টোগ্রামে তথ্য যুক্ত করতে পারেন:

প্রান্তিক বক্সপ্লট সহ হিস্টোগ্রাম হিস্টগ্রাম রাগপ্লট সাথে জিটার স্ট্রিপচার্ট সহ হিস্টোগ্রাম

( এই উত্তর থেকে প্লট )

এর মধ্যে প্রথমটি - মার্জিনে একটি সরু বক্সপ্লট যুক্ত করা - আপনাকে যে কোনও ডিসপ্লে থেকে প্রাপ্ত কোনও সুবিধা দেয়।


1

বার প্লটগুলি কেবল পর্যবেক্ষণের সীমাবদ্ধতার পরিসর সরবরাহ করে যখন বাক্স প্লটগুলি বিতরণে বিভিন্ন পরামিতি যেখানে উদাহরণ থাকে তার উদাহরণগুলি বোঝায় এবং বার প্লটগুলি যেগুলি করতে পারে না তার রূপগুলি আরও ভাল are কারও একাধিক বিতরণ থাকলে বক্স প্লটগুলি কার্যকর তুলনামূলক সরঞ্জাম হিসাবে ব্যবহৃত হয়।


কোনও বক্সপ্লোটের পক্ষে কোনও গড়টি প্রদর্শন করা বিরল - প্রায় সবসময় তারা মাঝারি ব্যবহার করে - এবং তারা কখনও সরাসরি রূপগুলি উপস্থাপন করে না । দ্রষ্টব্য, এও যে এই পরিমাণগুলি সাধারণত "বিতরণের পরামিতি" হিসাবে বিবেচিত হয় না: এগুলি একটি ব্যাচের উপাত্তের জন্য বর্ণনামূলক পরিসংখ্যান
হোবার

হুবহু, খুব বেশি গণনা ছাড়াই কোনও বিতরণ বর্ণনা করার জন্য তারা দুর্দান্ত সরঞ্জাম। এবং তারা মিডিয়ানদের আরও প্রদর্শন করে এবং যেহেতু প্রচুর ক্ষেত্রে উভয় পদক্ষেপ মিলে যায় তাই বাক্স প্লটগুলিও প্রায় আনুমানিক গড়ার একটি দুর্দান্ত সরঞ্জাম।
শিব_90

আপনার মন্তব্য অন্তর্নিহিত বিতরণ সঙ্গে ডেটা বিভ্রান্ত করা অবিরত বলে মনে হচ্ছে । কোনও ব্যাচের উপায়ে মধ্যমকে সমান করা খুব বিরল। তদুপরি, বক্সপ্লোটের সর্বোত্তম ও সাধারণ ব্যবহারগুলির মধ্যে একটি হল অসমमितা সনাক্ত করা, যা সাধারণত গড় এবং মধ্যবর্তীগুলির মধ্যে একটি গুরুত্বপূর্ণ পার্থক্য বোঝায়। বক্সপ্লোটের মূল ধারণার পিছনে অন্যতম মূলনীতি হ'ল এটি একটি শক্তিশালী অনুসন্ধানের সরঞ্জাম tool যা বোঝায় যে গড় বা ভিন্নতার মতো সংবেদনশীল পরিসংখ্যানের ভিত্তিতে না হয়ে এটি আরও ভাল।
হোবার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.