তিনটি গ্রুপ জুড়ে অনেক অনুপাতের মধ্যে পার্থক্যটি কীভাবে সেরাভাবে কল্পনা করা যায়?


18

আমি তিনটি পৃথক সংবাদ প্রকাশনা কীভাবে বিভিন্ন বিষয় coverেকে রাখে (একটি এলডিএ বিষয় মডেলের মাধ্যমে নির্ধারিত) তা দৃশ্যত তুলনা করার চেষ্টা করছি। এটি করার জন্য আমার দুটি সম্পর্কিত পদ্ধতি রয়েছে তবে সহকর্মীদের কাছ থেকে প্রচুর প্রতিক্রিয়া পেয়েছি যে এটি খুব স্বজ্ঞাত নয়। আমি আশা করছি কারও বাইরে এটির দৃশ্যধারণের জন্য আরও ভাল ধারণা রয়েছে।

প্রথম গ্রাফে, আমি প্রতিটি প্রকাশনায় প্রতিটি বিষয়ের অনুপাত দেখায়, যেমন:

সমস্ত বিষয় এবং প্রকাশনা জন্য অনুপাত

আমি কথা বলেছি এমন প্রায় প্রত্যেকের কাছে এটি বেশ সোজা এবং স্বজ্ঞাত। তবে প্রকাশনাগুলির মধ্যে পার্থক্যগুলি দেখা মুশকিল। কোন পত্রিকা কোন বিষয়কে আরও বেশি কভার করে?

এটি পেতে, আমি সর্বোচ্চের সাথে প্রকাশের দ্বারা বর্ণিত সর্বোচ্চ এবং দ্বিতীয় সর্বোচ্চ অনুপাত সহ প্রকাশনার মধ্যে পার্থক্যটি আঁকিয়েছি। এটার মত:

প্রথম এবং দ্বিতীয় সর্বোচ্চ বিষয়ের মধ্যে পার্থক্য

সুতরাং, উদাহরণস্বরূপ, ফুটবলের বিশাল বারটি হ'ল আল-আহরাম ইংলিশ এবং ডেইলি নিউজ মিশরের (ফুটবলের কভারেজের # 2) মধ্যে দূরত্ব এবং এটি লাল বর্ণযুক্ত কারণ আল-আহরাম # 1। একইভাবে, বিচারগুলি সবুজ কারণ মিশর ইন্ডিপেন্ডেন্টের সর্বোচ্চ অনুপাত রয়েছে এবং বারের আকারটি মিশর ইন্ডিপেন্ডেন্ট এবং ডেইলি নিউজ মিশরের মধ্যবর্তী দূরত্ব (আবার # 2)।

এই সত্যটি যে আমাকে দুটি অনুচ্ছেদে বোঝাতে হবে এটি একটি নিশ্চিত নিশ্চিত লক্ষণ যে গ্রাফটি স্বয়ংসম্পূর্ণতা পরীক্ষায় ব্যর্থ। কেবল এটি দেখেই সত্যিই কী চলছে তা বলা শক্ত।

আরও স্বজ্ঞাত উপায়ে প্রতিটি বিষয়ের জন্য প্রভাবশালী প্রকাশনা কীভাবে দৃশ্যমানভাবে হাইলাইট করা যায় সে সম্পর্কে কোনও সাধারণ পরামর্শ?

সম্পাদনা করুন: খেলতে হবে ডেটা: এখানে dputআর থেকে আউটপুট , পাশাপাশি একটি সিএসভি ফাইল

সম্পাদনা 2: এখানে একটি প্রাথমিক ডট প্লটের সংস্করণ দেওয়া হয়েছে, কারপাসের বিষয়গুলির অনুপাতের সাথে সমানুপাতিক বিন্দুর ব্যাসগুলির সাথে (যেভাবে বিষয়গুলি মূলত সাজানো হয়েছিল)। যদিও আমাকে এখনও এটি আরও কিছুটা টুইট করতে হবে, আমি আগে যা করছিলাম তা তার চেয়ে অনেক বেশি স্বজ্ঞাত বোধ করে। ধন্যবাদ সবাইকে!

বিন্দু চক্রান্ত


1
আমি সবেমাত্র কিছু ডেটা যুক্ত করেছি (আর এবং একটি সিএসভির জন্য)। আমি এখনও ভাল রং নির্বাচন করা শেষ করি নি (তাই ক্রিসমাস লাল / সবুজ), যদিও আমি বর্ণের অন্ধ বিষয় সম্পর্কে সচেতন আছি :)
অ্যান্ড্রু

1
"অনুপাত" এর উল্লেখ এখানে কিছুটা লাল হেরিং হিসাবে দেখা যায়, কারণ তথ্যগুলি প্রকৃতপক্ষে অনুপাত হয় না এবং আরও বড় কথা, এখন পর্যন্ত গ্রাফিকাল সমাধানগুলির কোনওটিই ডেটা অনুপাতের উপর নির্ভর করে না। এটি ভাল কারণ সমাধানগুলির বিস্তৃত তথ্যের সাথে প্রাসঙ্গিকতা রয়েছে তবে বিভ্রান্ত হবে না।
নিক কক্স

(+1) ডাউনলোডযোগ্য ডেটাসেট এবং দ্রুত ফলোআপ সহ দুর্দান্ত প্রশ্ন!
chl

অ্যান্ড্রু, আপনার সর্বশেষ সম্পাদনা সম্পর্কিত, আমি মনে করি উল্লম্ব গ্রিড লাইনের সাথে এটি আরও ভাল হবে। তারা একটি পরীক্ষক প্যাটার্ন তৈরি করে তবে গ্রাফ থেকে সুনির্দিষ্ট মানগুলি পড়ার বিষয়ে আপনার যত্ন নেই বলে ধরে নিয়ে বেশি মান যুক্ত হয় না।
xan

উল্লম্ব লাইন ছাড়া ?
অ্যান্ড্রু

উত্তর:


18

ডেটা অ্যাক্সেসযোগ্য এবং একটি আকর্ষণীয় ডেটাসেট এবং গ্রাফিকাল চ্যালেঞ্জের জন্য ধন্যবাদ।

আমার মূল পরামর্শটি একটি (ক্লেভল্যান্ড) ডট চার্টের।

এখানে চিত্র বর্ণনা লিখুন

আমি জোর দিতে চাই সবচেয়ে গুরুত্বপূর্ণ বিশদ:

  1. সুপারিপজিশন এখানে তুলনা মঞ্জুরি দেয় এবং সহজ করে দেয়।

  2. আপনার প্রদর্শনগুলির বিষয়গুলির ক্রমটি বেশ স্বেচ্ছাসেবী হিসাবে উপস্থিত হয়। একটি প্রাকৃতিক অর্ডার অনুপস্থিত (যেমন সময়, স্থান, একটি আদেশযুক্ত ভেরিয়েবল) একটি ফ্রেমওয়ার্ক সরবরাহ করতে আমি সর্বদা একটি ভেরিয়েবলের উপর বাছাই করি। কোনটি ব্যবহার করা বিশেষত আকর্ষণীয় বা গুরুত্বপূর্ণ, গবেষকের সিদ্ধান্তের বিষয়টি হতে পারে। আর একটি সম্ভাবনা হ'ল কাগজগুলির মধ্যে পার্থক্যের কিছু পরিমাপের জন্য আদেশ দেওয়া, যাতে অনুরূপ কভারেজ প্রাপ্ত বিষয়গুলি এক প্রান্তে এবং অন্য প্রান্তে বিভিন্ন কভারেজ গ্রহণকারীদের হয়।

  3. উন্মুক্ত চিহ্নিতকারী বা পয়েন্ট প্রতীকগুলি ওভারল্যাপ বা পরিচয়কে বন্ধ বা শক্ত চিহ্নিতকারী বা চিহ্নগুলির চেয়ে ভাল সমাধানের মঞ্জুরি দেয়, যা সবচেয়ে খারাপ ক্ষেত্রে একে অপরকে অস্পষ্ট করে বা আবদ্ধ করে। (একটি বিকল্প যা এখানে বেশ ভালভাবে কাজ করতে পারে তা হ'ল তিনটি সংবাদপত্রের জন্য এ, ডি এবং আই জাতীয় অক্ষর))

আমার নকশা উন্নত করার স্পষ্টতই অনেক সুযোগ রয়েছে। উদাহরণস্বরূপ, বর্ণমালাটি কি খুব বড় এবং / বা খুব বেশি ভারী? অন্যদিকে শিরোনামগুলি অবশ্যই সহজেই পঠনযোগ্য, অন্যথায় গ্রাফটি ব্যর্থ।

কিছু ছোট, পিকার পয়েন্ট:

ক। আপনার গ্রাফের লাল এবং সবুজ একটি রঙ সমন্বয় এড়ানো যায়। যখন বিভিন্ন চিহ্নিতকারী ব্যবহার করা হয়, রঙের পছন্দগুলি কিছুটা কম গুরুত্বপূর্ণ।

খ। আপনার গ্রাফের অনুভূমিক টিকগুলি বিভ্রান্ত করছে। বিপরীতে, খনিতে গ্রিড লাইনগুলি প্রয়োজন তবে আমি পাতলা, হালকা রেখা ব্যবহার করে এগুলিকে নিরর্থক করার চেষ্টা করি।

×

ক্লিভল্যান্ড ডট চার্টের সবচেয়ে বেশি .ণী

ক্লেভল্যান্ড, ডাব্লুএস 1984. ডেটা উপস্থাপনের জন্য গ্রাফিকাল পদ্ধতি: পূর্ণ স্কেল ব্রেক, ডট চার্ট এবং মাল্টিবেসড লগিং। আমেরিকান পরিসংখ্যানবিদ 38: 270-80।

ক্লেভল্যান্ড, WS 1985. গ্রাফিকিং ডেটার উপাদানসমূহ। মন্টেরি, সিএ: ওয়েডসওয়ার্থ।

ক্লেভল্যান্ড, ডাব্লুএস 1994. গ্রাফিং ডেটার উপাদানসমূহ। সামিট, এনজে: হোবার্ট প্রেস।

এক পূর্বসূরী (পরিসংখ্যানগত দিক থেকে বেশ আলাদা কাজের জন্য !!!) ছিল

পিয়ারসন, ES 1956. পরিসংখ্যানের জ্যামিতির কিছু দিক: গাণিতিক পরিসংখ্যানের তত্ত্ব এবং প্রয়োগ বোঝার জন্য ভিজ্যুয়াল উপস্থাপনা ব্যবহার। রয়্যাল স্ট্যাটিস্টিকাল সোসাইটির জার্নাল এ 119: 125-146।

আগ্রহীদের জন্য, কোড সহ .csv পড়ার পরে স্টাটাতে গ্রাফটি প্রস্তুত করা হয়েছিল

graph dot (asis) prop , over(pub) over(label, sort(1)) asyvars 
marker(1, ms(Oh)) marker(2, ms(+)) marker(3, ms(Th)) linetype(line)   
lines(lc(gs12) lw(vthin)) scheme(s1color) 

এটি দুর্দান্ত — ধন্যবাদ! দুর্ভাগ্যক্রমে অনুভূতিগুলি কিছুতেই যুক্ত হয় না কারণ মানগুলি নথির একটি বৃহতাকার কর্পাস থেকে মানকৃত মানে হয় (যেমন প্রতিটি প্রকাশনায় প্রতিটি নথিতে 20 টি বিষয়ের কিছু সমন্বয় থাকে - এটি এলডিএ আবিষ্কার করেছেন - এটি সাধারণ উপায় দেখায় ... তাই অল্প সংখ্যক)
অ্যান্ড্রু

এছাড়াও, বিষয়গুলি কর্পাসে তাদের অনুপাত অনুসারে অর্ডার করা হয়। মিশর শাসনব্যবস্থা সর্বাধিক প্রদর্শিত হওয়ার বিষয়, যদিও বিবিধ বিষয় বিরল বিষয়। তবে এখানে সেই আদেশটি ব্যবহার করে বিন্দুগুলি / চিহ্নগুলি দর্শনীয়ভাবে অনুসরণ করা কিছুটা শক্ত করে তোলে।
অ্যান্ড্রু

এটা অসাধারণ! ধন্যবাদ! আপনার পরামর্শগুলি প্রতিবিম্বিত করতে এবং কর্পাস অনুপাত যুক্ত করতে আমি মূল পোস্টটি আপডেট করেছি।
অ্যান্ড্রু

(+6) ভাল উত্তর! এবং রেফারেন্স এবং পুনরুত্পাদনযোগ্য কোড পাওয়া সর্বদা সুন্দর।
chl

@ সিএইচএল প্রশংসাজনক মন্তব্য এবং অতিরিক্ত খ্যাতির জন্য অনেক ধন্যবাদ।
নিক কক্স

14

নিক কক্স থেকে ডট প্লট সম্পূর্ণ ছবির জন্য সম্ভবত সেরা। আপনি যদি সত্যই প্রথম দ্বিতীয় বনাম সম্পর্কের উপরে জোর দিতে চান তবে এখানে আপনার চার্টে একটি পরিবর্তন এসেছে যা দ্বিতীয় বারের দৈর্ঘ্যের সাথে পার্থক্য বারটি অফসেট করে।

এখানে চিত্র বর্ণনা লিখুন

এবং ভিন্ন ভিন্ন চিত্র দর্শনের জন্য, আপনি কোনও opeাল চার্ট বা সমান্তরাল স্থানাঙ্ক প্লটের মতো কিছু চেষ্টা করতে পারেন। লাইনগুলি এখানে কিছুটা ভিড়যুক্ত হতে পারে তবে আপনি যদি বিষয়গুলির একটি উপসেটটি হাইলাইট করতে চান তবে এটি কাজ করতে পারে।

এখানে চিত্র বর্ণনা লিখুন

এছাড়াও, আপনি helpmeviz.com চেষ্টা করতে পারেন যা খুব নির্দিষ্ট ডেটা যেমন প্রশ্নগুলির দিকে প্রস্তুত।


মজাদার! মিনিট পয়েন্ট: অক্ষের শিরোনাম বা লেবেল "অনুপাত"% এর ইউনিটগুলির সাথে মেলে না।
নিক কক্স

ওহ, এটি সত্যিই আকর্ষণীয়। আমি এটি খেলতে যাচ্ছি এটি ডট চার্টের পরিপূরক হতে পারে কিনা তা দেখতে।
অ্যান্ড্রু

2

আমার প্রথম নির্দেশটি ছিল মোজাইক প্লটটির পরামর্শ দেওয়া ; এটি প্রতিটি উপ-বিভাগকে একটি আয়তক্ষেত্র হিসাবে গ্রাফ করে, যেখানে একটি মাত্রা মূল বিভাগের জন্য মোট গণনা উপস্থাপন করে এবং অন্য মাত্রাটি উপ-বিভাগের আনুপাতিক ভাগকে উপস্থাপন করে। আছে একটি r- তাদের আঁকা প্যাকেজ , কিন্তু এটি মোটামুটি নিম্ন স্তরের গ্রাফিং সরঞ্জামগুলির সাথে করতে সহজবোধ্য।

যাইহোক, মোজাইক প্লটগুলি (শতাংশ-ভিত্তিক স্ট্যাকড বার গ্রাফগুলির মতো) যদি আপনি মাত্রাটি তুলনা করতে চান মাত্রায় মাত্র 2 বা 3 বিভাগ থাকে তবে সবচেয়ে ভাল কাজ করে work সুতরাং আপনি যদি তিনটি সংবাদপত্রের প্রত্যেকটিতে থাকা নিবন্ধের অনুপাতে বিষয়গুলির মধ্যে পার্থক্য তুলনা করতে চান তবে তারা ভালভাবে কাজ করবে তবে প্রতিটি বিষয়ের কভারেজের অনুপাতে তিনটি সংবাদপত্রের মধ্যে পার্থক্যের তুলনা করে আপনার উদ্দেশ্যে ব্যবহারের জন্য এতটা নয় । একটি সূক্ষ্ম কিন্তু গুরুত্বপূর্ণ পার্থক্য!

আপনি যা জোর দিতে চান তার জন্য, আমি মনে করি সবচেয়ে কার্যকর গ্রাফটি সবচেয়ে সহজ - একটি গ্রুপযুক্ত বার গ্রাফ। ডট চার্টের চেয়ে বেশি লোক বার গ্রাফগুলি বুঝতে পারে; এক নজরে আপনি দেখতে পাচ্ছেন যে আপনি বিভিন্ন আকারের পরিমাণের তুলনা করছেন এবং আপনি যে মানগুলি তুলনা করতে চান তা পাশাপাশি রয়েছে।

তবে, আপনি যদি সত্যই অনুপাতের পার্থক্যের উপর জোর দিতে চান তবে আপনি একটি কাস্টম গ্রুপযুক্ত বার গ্রাফ তৈরি করতে পারেন, প্রতিটি গ্রুপকে অবস্থিত করে যাতে প্রতিটি বিভাগের মধ্যমান মান শূন্য মানের পরিবর্তে অক্ষের সাথে একত্রিত হয়:

                  Difference in proportion of coverage
                     per Newspaper,
                     relative to category median 
                     (narrow bars)
    ____-0.1%____0_____0.1%____0.2%_____
                 |
        |********|*****
A       |~~~~~~~~|
        |####    |
                 |
            |****|**********
B           |~~  |
            |####|
                 |
         |*****  |
C        |~~~~~~~|~~~~~
         |#######|
                 |
     |***        |
D    |~~~~~~~~~~~|
     |###########|##
                 |
0.2%_____0.1%____0_____
Median proportion of coverage 
   per category, all papers
   (large bars)

নোট করুন যে প্রতিটি গ্রুপের বারগুলি এখনও আকারের সহজ তুলনা করার জন্য সংযুক্ত করা হয়েছে এবং প্রতিটি গোষ্ঠীর বেসলাইনটি এখন গ্রুপের মাঝারি মান অনুসারে অক্ষের বামে অবস্থিত, যখন অক্ষের ডানদিকে প্রজেক্টগুলি সমান হয় আপনার দ্বিতীয় বারের গ্রাফে শীর্ষ দুটি বিভাগের মধ্যে পার্থক্য দেখায়।

আপনি উপরের মতো কোনও স্ট্যান্ডার্ড গ্রুপযুক্ত বার গ্রাফ বা অফসেট-অ্যাডজাস্টেড গ্রাফ ব্যবহার করুন না কেন, আপনি এখনও মোজাইক প্লট থেকে ধারণা নিতে পারেন এবং প্রতিটি বারের প্রস্থকে সেই সংবাদপত্রের মোট নিবন্ধের সমানুপাতিক করে তুলতে পারেন (সুতরাং এর আকার বারটি বিভাগে। সংবাদপত্রের নিবন্ধ সংখ্যার সমানুপাতিক)।

যেহেতু আপনার পরীক্ষার পরিসংখ্যান প্রতিটি তুলনার একটি সম্পত্তি, স্বতন্ত্র মানগুলির নয়, তাই আমি মনে করি না যে এটি প্রতিটি ডাটা পয়েন্টকে তাত্পর্য অনুসারে স্কেল করা দরকারী। পরিবর্তে, আমার কাছে প্রতিটি দলবদ্ধতার তাত্পর্য উপস্থাপনের পাশে একটি আইকন থাকবে। একাডেমিক প্রকাশের জন্য, মান */ **/ ***পরিচিতির সুবিধা রয়েছে তবে আপনি যদি পরিসংখ্যানের সম্পূর্ণ ধারাবাহিকতা প্রদর্শন করতে চান তবে আপনি সৃজনশীল হতে পারেন।


এখানে মূল ধারণাটি বারগুলি উল্লম্বভাবে গ্রুপ করা। এটি একটি বহুল ব্যবহৃত ডিজাইন, তবে পোস্টারের মূলটিতে 20 এর চেয়ে 60 টি বার উল্লম্বভাবে বোঝায়। যদিও আপনি বারের প্রস্থকে স্পষ্টভাবে ঝাঁকন করতে পারেন, আমি মনে করি এই ক্ষেত্রে ভাল করার জন্য আপনার আরও স্থানের প্রয়োজন হবে, বিশেষত আপনি গ্রুপগুলির মধ্যে স্থান যুক্ত করতে চান।
নিক কক্স

@ নিককক্স এটি আরও কমপ্যাক্ট মূল চার্টের সাথে তুলনামূলক খারাপ, যদিও আপনি যদি কোনও ল্যান্ডস্কেপ-ভিত্তিক চিত্র আপনার সামগ্রিক বিন্যাসের উপযোগী হন তবে পুরো গ্রাফটি 90 ডিগ্রিটি ঘোরান।
অমেলিয়াবিআর

আপনি পারতেন, তবে bars০ টি বার বাঁ থেকে ডান দিকেও শক্ত এবং "মুসলিম ব্রাদারহুড এবং রাজনীতি" এর মতো ২০ টি লেবেল পঠনযোগ্য থাকতে হবে ...
নিক কক্স

আপনি পাশাপাশি বসার পরিবর্তে একে অপরের শীর্ষে একটি গ্রুপে বারগুলি রেখে এটি কাজ করতে সক্ষম হতে পারেন। মকআপ না দেখে বলা শক্ত (এবং আমার ASCII শিল্পটি চেহারা এবং অনুভূতি জানাতে খুব ভাল নয়)। এটি কম স্বজ্ঞাত হবে যেহেতু এটি কোনও কাঠামোর মতো পরিচিত নয় এবং যদি দুটি বার প্রায় একই উচ্চতা হয় তবে বিভ্রান্তির সৃষ্টি হতে পারে। তবে বিকল্পটি যদি এক-পিক্সেল প্রশস্ত বার হয় ...
অমেলিয়াআরবি

সুতরাং, আপনি ডট চার্টের আমার উত্তরটিতে পরামর্শটি পৌঁছে যাচ্ছেন।
নিক কক্স

1

আপনি কি বুদ্বুদ চার্ট চেষ্টা করেছেন? https://code.google.com/apis/ajax/playground/?type=visualization#bubble_chart

স্বতন্ত্র বিষয়গুলি চেনাশোনা হতে পারে এবং প্রতিটি চেনাশোনা প্রতিটি খবরের শিরোনামে বিষয়টিকে অন্তর্ভুক্ত করে এমন শতাংশের পাই চার্ট হতে পারে। বৃত্তের আকার বিষয়টি সম্পর্কিত আপেক্ষিক কভারেজ নির্দেশ করতে পারে। উদাহরণস্বরূপ, যদি সংস্কৃতির চেয়ে তেল সম্পর্কে আরও মোট নিবন্ধ লেখা হয় তবে তেলের বৃত্তটি আরও বড় ব্যাস থাকে।


[এক্স,ওয়াই]

1
@ নিক স্টাটোনার যখন আমি প্রাথমিকভাবে এর উত্তর দিয়েছিলাম তখন আমি ডেটা সেট সহ সম্পাদিত প্রশ্নটি দেখতে পাইনি। সমন্বয়গুলি সংখ্যা প্রকাশনা ব্যতীত খুব বেশি বোঝায় না। চেনাশোনাগুলি বিষয় বা ব্যাস আকারের দ্বারা ক্লাস্টার করা যায়। আমি জানি না যে সংখ্যাগুলি খুব কম হওয়ায় শতাংশ কেন প্রথম স্থানে ব্যবহার করা হয়েছিল।
rocinante
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.