কোনও গ্রাফের y- অক্ষটি শূন্য থেকে শুরু হওয়া উচিত কিনা তা কীভাবে নির্ধারণ করবেন?


45

"ডেটা দিয়ে মিথ্যা কথা বলার" একটি সাধারণ উপায় হ'ল ওয়াই-অক্ষ স্কেল ব্যবহার করা যা দেখে মনে হয় যে পরিবর্তনগুলি সত্যিকারের চেয়ে বেশি তাৎপর্যপূর্ণ।

যখন আমি বৈজ্ঞানিক প্রকাশনা, বা শিক্ষার্থীদের ল্যাব রিপোর্টগুলি পর্যালোচনা করি, আমি প্রায়শই এই "ডেটা ভিজ্যুয়ালাইজেশন পাপ" (যা আমি বিশ্বাস করি যে লেখকরা অনিচ্ছাকৃতভাবে প্রতিশ্রুতি দেন, তবে তারপরেও একটি বিভ্রান্তিমূলক উপস্থাপনা ফলাফল করে by)

তবে, "সর্বদা শূন্যের সাথে y- অক্ষ শুরু করুন" কোনও কঠোর এবং দ্রুত নিয়ম নয়। উদাহরণস্বরূপ, এডওয়ার্ড টুফ্ট উল্লেখ করেছেন যে একটি সময়ের সিরিজে, বেসলাইনটি শূন্য নয়:

সাধারণভাবে, একটি টাইম-সিরিজে, একটি বেসলাইন ব্যবহার করুন যা ডেটা শূন্য বিন্দু না দেখায়। যদি শূন্য বিন্দুটি ডেটা প্লট করার ক্ষেত্রে যুক্তিযুক্তভাবে ঘটে থাকে তবে ঠিক আছে। তবে ডেটা লাইনে যা চলছে তা লুকিয়ে রেখে শূন্য পয়েন্টে পৌঁছানোর চেষ্টা করে প্রচুর খালি উল্লম্ব স্থান ব্যয় করবেন না। (পরিসংখ্যানের সাথে কীভাবে মিথ্যা কথাটি বইটি এই বিষয়টিতে ভুল)

উদাহরণস্বরূপ, সময়-সিরিজের অনুপস্থিত শূন্য পয়েন্টের সমস্ত জায়গা জুড়ে, কোনও বড় বৈজ্ঞানিক গবেষণা প্রকাশনার দিকে একবার নজর দিন। বিজ্ঞানীরা তাদের তথ্য শূন্য নয়, দেখাতে চান।

উপাত্তকে প্রাসঙ্গিক করার জন্য তাগিদটি ভাল, তবে প্রসঙ্গটি শূন্যের নীচে পৌঁছে খালি উল্লম্ব স্থান থেকে আসে না, এমন একটি সংখ্যা যা একটি ভাল অনেক ডেটা সেটেও ঘটে না। পরিবর্তে, প্রসঙ্গে, অনুভূমিকভাবে আরও ডেটা দেখান!

আমি পর্যালোচনা করা কাগজগুলিতে বিভ্রান্তিমূলক উপস্থাপনাটি নির্দেশ করতে চাই, তবে আমি শূন্য-ওয়াই অক্ষ বিশুদ্ধবাদী হতে চাই না।

শূন্যে y- অক্ষ শুরু করার সময়, এবং এটি যখন অপ্রয়োজনীয় এবং / বা অনুপযুক্ত হয় তখন এমন কোনও গাইডলাইন রয়েছে যা সম্বোধন করে? (বিশেষত একাডেমিক কাজের প্রসঙ্গে।)


3
আমি মনে করি যে অন্তর্ভুক্ত নয় (অন্তর্ভুক্ত নয়) 0 সহ সম্ভাব্য বিভ্রান্তিকর ঘটনাটি বলা হওয়ার গল্পের উপর সমালোচনা নির্ভর করে।
গুং - মনিকা পুনরায়

2
একটি আলাপে "অত্যন্ত চাপা শূন্যটি নোট করুন" বা অনুরূপ বাক্যাংশটি কোনও সম্ভাব্য বিভ্রান্তকারী ব্যক্তির সততা আনতে ব্যবহার করা যেতে পারে। আমি মুদ্রিত উপাদানের সাথে এতটা খুশি নই, তবে একটি চিম্টিতে আপনি এটি সেখানে ব্যবহার করতে পারেন।
dmckee

এই সমস্ত এড়াতে, আমি যখনই সম্ভব বক্সপ্লট ব্যবহার করছি। মাধ্যম এবং ত্রুটি বারগুলি গণনা করার দরকার নেই এবং এটি একটি প্লটের মধ্যে মূল্যবান তথ্য (উদাহরণস্বরূপ ডেটা বিতরণ, স্প্রেড, স্কিউনেস, রেঞ্জ) সমেত। এছাড়াও, আপনি কাঁচা তথ্য দেখাচ্ছে।
স্টেফান

y=0

@ নিককক্স আপনার মন্তব্যের জন্য ধন্যবাদ! আমি সম্মত হই যে আনোভা করার পরে উপায় এবং ত্রুটি বারগুলি আরও বেশি বোঝা যায়। তবে, কোনও বিশ্লেষণ চালানোর আগে, আমি খুঁজে পেলাম যে বক্সপ্লটগুলি আরও তথ্যবহুল এবং আপনার ডেটা কেমন দেখাচ্ছে এবং নির্বাচিত আনোভা যথাযথ হতে পারে কি না সে সম্পর্কে তথ্য দেয়। "ডেটা সহ মিথ্যা কথা" ইতিমধ্যে ঘটতে পারে যখন প্যারামেট্রিক পরীক্ষা বাছাই করা হয় তবে ডেটা প্রয়োজনীয় অনুমানগুলি পূরণ করে না। অতএব, বৈজ্ঞানিক অধ্যয়নের পাঠক হিসাবে আমার কাছে, আমি সর্বদা উপস্থাপিত ফলাফলগুলি সম্পর্কে নিজের মন তৈরি করতে বক্সপ্লট দেখতে চাই।
স্টেফান

উত্তর:


40
  • কোনও গ্রাফের মধ্যে স্থানটি এমন কোনও উপায়ে ব্যবহার করবেন না যা বুঝতে সাহায্য করবে না। স্পেস দরকার ডেটা দেখানোর জন্য!

  • আপনার বৈজ্ঞানিক (প্রকৌশল, চিকিৎসা, সামাজিক, ব্যবসা, ...) রায় পাশাপাশি আপনার পরিসংখ্যানগত রায় ব্যবহার করুন। (আপনি যদি ক্লায়েন্ট বা গ্রাহক না হন তবে ক্ষেত্রের কারও সাথে আকর্ষণীয় বা গুরুত্বপূর্ণ কী তা অগ্রাধিকার হিসাবে বিশ্লেষণ চালাচ্ছেন সে সম্পর্কে ধারণা পেতে কথা বলুন))

  • y

সেগুলি তিনটি সহজ নিয়ম। (উপলক্ষ্যে তাদের মধ্যে কিছুটা উত্তেজনাকে অস্বীকার করার কোনও কিছুই নেই।)

এখানে একটি সাধারণ উদাহরণ, তবে তিনটি বিষয়ই উত্থাপিত হয়: আপনি সেলসিয়াসে বা ফারেনহাইটে এমনকি ক্যালভিনেও রোগীর শরীরের তাপমাত্রা পরিমাপ করেন: আপনার বাছাই করুন। কোন অর্থে শূন্য তাপমাত্রা প্রদর্শনের জন্য জোর দেওয়াটা সহায়ক বা এমনকি যৌক্তিক? গুরুত্বপূর্ণ, এমনকি চিকিত্সা বা শারীরবৃত্তীয়ভাবে গুরুত্বপূর্ণ, অন্যথায় তথ্যকে অস্পষ্ট করা হবে।

এখানে একটি উপস্থাপনা থেকে একটি সত্য গল্প। একজন গবেষক ভারতের বিভিন্ন রাজ্য এবং কেন্দ্রশাসিত অঞ্চলগুলির জন্য যৌন অনুপাতের তথ্য দেখিয়েছিলেন। গ্রাফিকটি একটি বার চার্ট ছিল যা সমস্ত বার শূন্য থেকে শুরু হয়। কিছু উল্লেখযোগ্য প্রকরণ থাকা সত্ত্বেও সমস্ত বার একই দৈর্ঘ্যের কাছাকাছি ছিল। এটি সঠিক ছিল, তবে মজাদার গল্পটি হ'ল অঞ্চলগুলি সাদৃশ্য থাকা সত্ত্বেও আলাদা ছিল, পার্থক্য থাকা সত্ত্বেও তারা একই ছিল। আমি প্রস্তাব দিয়েছি যে পুরুষ এবং স্ত্রীদের মধ্যে সমতা (1 বা 100 মহিলা / 100 পুরুষ) অনেক বেশি প্রাকৃতিক রেফারেন্স স্তর। (আমি কিছু সামগ্রিক স্তরের যেমন জাতীয় জাতীয় অর্থ যেমন একটি রেফারেন্স হিসাবে ব্যবহার করতেও উন্মুক্ত হব।) এমনকি কিছু পরিসংখ্যানবিদ যারা এই ছোট গল্পটি শুনেছেন তারা মাঝে মাঝে জবাব দিয়েছেন, "না; বারগুলি সর্বদা শূন্য থেকে শুরু করা উচিত।" আমার কাছে এ জাতীয় ক্ষেত্রে অপ্রাসঙ্গিক মতবাদের চেয়ে ভাল আর কিছু নয়।

yy

একটি সাধারণ ধরণের প্লট, বিশেষত এটি কিছু জৈবিক এবং চিকিত্সা বিজ্ঞানের ক্ষেত্রে মনে হয়, শূন্য এবং স্ট্যান্ডার্ড ত্রুটি বা স্ট্যান্ডার্ড বিচ্যুতি-ভিত্তিক অন্তরগুলি থেকে শুরু করে পাতলা বারগুলির দ্বারা অনিশ্চয়তা নির্দেশ করে মোটা দণ্ড দ্বারা অর্থ বা অন্যান্য সংক্ষিপ্তসারগুলি দেখায়। এই ধরনের ডিটোনেটর বা ডায়নামাইট প্লটগুলি যেমন তাদের কাছে ডাকা হত যারা অস্বীকার করেছিল তারা আংশিকভাবে একটি ডিকুমের কারণে জনপ্রিয় হতে পারে যে শূন্য সর্বদা প্রদর্শিত হওয়া উচিত। নেট এফেক্টটি হ'ল শূন্যের সাথে তুলনা করার বিষয়ে জোর দেওয়া যা প্রায়শই আগ্রহ বা ইউটিলিটির অভাবে থাকে।

কিছু লোক শূন্য প্রদর্শন করতে চায় তবে স্কেলটি বাধাগ্রস্ত হয়েছে তা দেখানোর জন্য স্কেল ব্রেকও যুক্ত করতে চায়। ফ্যাশনের পরিবর্তন এবং প্রযুক্তি পরিবর্তন হয়। কয়েক দশক আগে, যখন গবেষকরা তাদের নিজস্ব গ্রাফগুলি আঁকেন বা প্রযুক্তিবিদদের কাছে কাজটি অর্পণ করেছিলেন, তখন এটি হাত দিয়ে জিজ্ঞাসা করা আরও সহজ হয়েছিল। এখন গ্রাফিক্স প্রোগ্রামগুলি প্রায়শই স্কেল ব্রেকগুলি সমর্থন করে না, যা আমার মনে হয় কোনও ক্ষতি নয়। এমনকি যদি তারা তা করে তবে এটি গ্রাফিক সংযোজন যা গ্রাফিকের ক্ষেত্রের মাঝারি অংশটিকে নষ্ট করতে পারে।

x

এখানে স্বাভাবিকভাবে একটি জেরোথ বিধি রয়েছে যা উল্লিখিত তিনটি ছাড়াও প্রযোজ্য।

  • আপনি যা করেন না কেন, খুব পরিষ্কার থাকুন। ধারাবাহিকভাবে এবং তথ্যমূলকভাবে আপনার অক্ষগুলি লেবেল করুন। তারপরে বিশ্বাস করুন যে সতর্ক পাঠকরা আপনি কী করেছেন তা দেখতে সন্ধান করবে।

এইভাবে আমি এডওয়ার্ড টুফ্টির সাথে দৃ strongly়ভাবে একমত, এবং আমি ড্যারেল হাফের সাথে একমত নই।

সম্পাদনা 9 মে 2016:

আপনার সমস্ত চার্টগুলিতে একটি 0-বেসলাইনটি অনিবার্যভাবে অন্তর্ভুক্ত করার চেষ্টা করার পরিবর্তে এর পরিবর্তে যৌক্তিক এবং অর্থপূর্ণ বেসলাইনগুলি ব্যবহার করুন

কায়রো, এ। 2016. সত্যবাদী শিল্প: ডেটা, চার্ট এবং যোগাযোগের জন্য মানচিত্র। সান ফ্রান্সিসকো, সিএ: নিউ রাইডার্স, p.136।


7
এর একদিকে যেমন: আমি মনে করি যে শূন্য থেকে শুরু না হলে বারগুলি ক্ষেত্র এবং ক্ষেত্রফল দেখায় এমন ভিত্তিতে ডেটা বার দ্বারা উপস্থাপন করা হলে লোকেরা "শূন্যে শুরু" দিয়ে ঝুঁকির সাথে আরো বেশি ঝুঁকিতে থাকে। একটি উপর ক্লিভল্যান্ড ডট চক্রান্ত যা প্রায়ই আরো একটি উপযুক্ত কল্পনা আসলে - - সেখানে শূন্য এ শুরু করার এমন কোন বাধ্যকারী যুক্তি বলে মনে হয়, এবং মানুষ আরো যেখানে তারা শুরু সম্পর্কে নমনীয় হতে ইচ্ছুক বলে মনে হচ্ছে।
সিলভারফিশ

4
দুর্দান্ত উত্তর। ধারাবাহিকভাবে অনুপযুক্ত অক্ষ রেঞ্জগুলি ব্যবহার করে (তথ্যগুলিতে তুচ্ছ তাত্পর্যকে জোর দিয়ে) এমন একটি কাগজ পর্যালোচনা করার প্রসঙ্গে আমি এই প্রশ্নটি জিজ্ঞাসা করেছি। এই উত্তরটি আমাকে বুঝতে পেরেছিল যে আমি যে বিষয়টি নিয়ে সত্যই হতাশ হয়েছি তা হ'ল ডেটা বোঝার এবং ব্যাখ্যা করার ক্ষেত্রে বিচারের অভাব (পরিসংখ্যান এবং প্রকৌশল) - অক্ষের পরিসর সম্পর্কে অভিযোগ করার চেয়ে পর্যালোচনাতে মন্তব্য করা আরও অনেক গঠনমূলক বিষয়।
ff524

4
অক্ষটি শূন্য থেকে শুরু করার নিয়মটি কেবল অনুপাতযুক্ত ক্রমাগত চলকগুলির জন্য চিন্তাভাবনা করে তোলে, সুতরাং শূন্যের একটি আসল অর্থ রয়েছে। 0 এর ওজন কোনও ওজন নয়। ইত্যাদি। তবে সি বা এফের তাপমাত্রা শূন্যের জন্য নির্বিচার মানগুলি ব্যবহার করে, তাই অক্ষটি শুরু করার বিষয়ে চিন্তা করার কোনও মানে নেই।
হার্ভে মোটুলস্কি

2

3
চমৎকার, তবে আমি উল্লেখ করতে চাই যে "রায়" পয়েন্ট শ্রোতার উপর নির্ভর করে (শ্রোতা সর্বদা গুরুত্বপূর্ণ!)। প্রযুক্তিগত শ্রোতারা অক্ষটি পড়বে এবং এর প্রভাবগুলি বুঝতে পারবে। লেটের জনসংখ্যার একটি নির্দিষ্ট ভগ্নাংশটি অক্ষর লেবেলগুলিকে নির্ধারণ করে উপেক্ষা করবে এবং স্কেল সম্পর্কে সম্ভাব্য ভুল অনুমানের অধীনে গ্রাফের আকার থেকে সিদ্ধান্ত গ্রহণ করবে। যদি গ্রাফটি একটি শ্রোতাপ্রিয় শ্রোতাদের উদ্দেশ্যে করা হয় তবে আপনার বিচারের ক্ষেত্রে এটি আপনাকে ফ্যাক্টর করতে হবে।
dmckee
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.