आकस्मिक টেবিলগুলির জন্য সেরা ভিজ্যুয়ালাইজেশন কোনটি?


22

কোন এককটিজেন্সি টেবিলটি দেখানোর জন্য পরিসংখ্যানগত দিক থেকে সেরা চক্রান্ত কোনটি , যা সাধারণত চি-স্কোয়ার পরীক্ষা দ্বারা বিশ্লেষণ করা হয়? এটি কি ডজড বারপ্লট, স্ট্যাকড বারপ্লট, হিটম্যাপ, কনট্যুর প্লট, জিটারড স্ক্রেটারপ্লট, একাধিক লাইনের প্লট বা অন্য কিছু? কারও কি পরম মান বা শতাংশ দেখাতে হবে?

সম্পাদনা করুন: বা @ ফোরকাস্টার মন্তব্যগুলিতে যেমন পরামর্শ দিয়েছেন, সংখ্যার সারণি নিজেই একটি সাধারণ চক্রান্ত এবং যথেষ্ট হওয়া উচিত।


4
কখনও কখনও ডেটা সারণি হ'ল বনাম প্লটগুলি সেরা দৃশ্যায়ন পদ্ধতি। কন্টিনজেন্সি টেবিলগুলি এর সর্বোত্তম উদাহরণ।
পূর্বাভাসকারী

1
গুরুত্বপূর্ণ বিষয়, যদিও আমি সম্মত নই যে এটি সর্বদা সেরা বিকল্প।
rnso

1
এজন্য আমি "মাঝে মাঝে" বলেছিলাম। আমি সুপারিশ করব, স্টিফেন ফিউ'স আমাকে সেই নম্বরগুলি দেখান যার পুরো টেবিলগুলিতে উত্সর্গীকৃত বিভাগ রয়েছে।
পূর্বাভাসকারী

1
ভাল, সর্বোত্তম পদ্ধতিটি আপনি কী দেখাতে চান তার উপর নির্ভর করে, টেবিলটি কত বড়, কোনও স্পেসিফিকেশন ছাড়াই এটি প্রশস্ত!
কেজেটিল বি হালওয়ারসেন

3
বেশিরভাগ স্ট্যাটাস.স্ট্যাকেক্সেঞ্জার্ভিউ / প্রশ্ন / 6363৩২২/২ এখানে প্রাসঙ্গিক বলে মনে হচ্ছে।
নিক কক্স

উত্তর:


9

এখানে কোনও এক-আকারের-ফিট-সব সমাধান হতে পারে না। আপনার যদি খুব সাধারণ টেবিল থাকে (যেমন, ), সারণীটি উপস্থাপন করা সম্ভবত সেরা। আপনি যদি কোনও আসল চিত্র চান তবে মোজাইক প্লটগুলি (@ এক্সান দ্বারা বোঝানো হয়েছে) সম্ভবত শুরু করার জন্য একটি দুর্দান্ত জায়গা। আরও কিছু অপশন রয়েছে যা চালনী প্লট, অ্যাসোসিয়েশন প্লট এবং গতিশীল চাপের প্লট সহ মোজাইক প্লটগুলির সাথে সাদৃশ্যপূর্ণ (আমার প্রশ্নটি এখানে দেখুন: কন্টিজেন্সি টেবিলগুলির জন্য চালনা / মোজাইক প্লটের বিকল্প ); মাইকেল ফ্রেন্ডির বই, ভিজ্যুয়ালাইজিং শ্রেণিবদ্ধ ডেটা , এই বিষয়টির জন্য ভাল (এসএএস-ভিত্তিক) সংস্থান হবে এবং ভিসিডি প্যাকেজটি আর-এ এই ধারণাগুলি বাস্তবায়নের জন্য একটি ভাল উত্স is 2×2

যেহেতু টেবিলগুলিতে সারি এবং কলামগুলির প্রচুর সংখ্যা রয়েছে, তবে এগুলি আমার মতে, ব্যবহার করা শক্ত হয়ে যায়। একটি চিঠিপত্রের বিশ্লেষণ সম্পাদন / প্লট করা একটি ভিন্ন ধরণের ভিজ্যুয়ালাইজেশন বিকল্প । একটি চিঠিপত্র বিশ্লেষণটি आकस्मिक সারণির উভয় সারি এবং কলামগুলিতে মূল উপাদান বিশ্লেষণ চালানোর জন্য সাদৃশ্য। তারপরে দুজনেই একসাথে বাইপ্লট নিয়ে প্লট করা হয়। @ Xan এর উত্তর থেকে ডেটা ব্যবহার করে এখানে একটি আর ভিত্তিক উদাহরণ দেওয়া হয়েছে:

library(ca)
tab = as.table(rbind(c(28, 4,  0, 56),
                     c(38, 5,  9, 10),
                     c( 6, 6, 14, 13) ))
names(dimnames(tab)) = c("activity", "period")
rownames(tab)        = c("feed", "social", "travel")
colnames(tab)        = c("morning", "noon", "afternoon", "evening")
tab
#         period
# activity morning noon afternoon evening
#   feed        28    4         0      56
#   social      38    5         9      10
#   travel       6    6        14      13
plot(ca(tab))

এখানে চিত্র বর্ণনা লিখুন

এই প্লটটি ব্যাখ্যা করার জন্য, একই ধরণের নিকটস্থ দুটি পয়েন্ট হ'ল এই দুটি সারি / কলামের প্রোফাইলগুলি তত বেশি মিল। এবং বিভিন্ন ধরণের কাছাকাছি দুটি পয়েন্টগুলি হ'ল, তাদের সম্ভাবনার পরিমাণের সংখ্যাটি তাদের ছেদটি প্রতিনিধিত্বকারী কোষে বেশি।

আর-তে রয়েছে সিএ প্যাকেজ ; এই ভিগনেট ( পিডিএফ ) পাশাপাশি সহায়ক হতে পারে।


খুব দরকারী. স্পষ্টতই এটি ছোট মানগুলির সাথে ব্যর্থ হয়, যেমন: টিটি = উইথ (এমটিকার্স, টেবিল (ফ্যাক্টর (গিয়ার), ফ্যাক্টর (বনাম))); চক্রান্ত (CA (TT)); এক্স [,
ম্লান

কারণ কারণগুলির একটির (যেমন, factor(vs)) মাত্র দুটি স্তর রয়েছে; আপনার কমপক্ষে তিনটি দরকার ব্যবহার করে দেখুন ttt = with(mtcars, table(factor(gear), factor(cyl))); plot(ca(ttt))
গুং - মনিকা পুনরায়

বিভিন্ন কারণের মধ্যে সম্পর্কের খুব ভাল প্রদর্শন।
rnso

অথবা আপনি চিঠিপত্র বিশ্লেষণের স্কোরগুলির ক্রমে সারি এবং কলামগুলি পুনরায় অর্ডার করার পরে সারণীটি প্রদর্শন করতে পারেন।
কেজেটিল বি হালওয়ারসেন

আকর্ষণীয় ধারণা, @ কেজেটিভালভর্সেন। আমি কীভাবে এটি থেকে পেতে পারি তা নিশ্চিত নই ca, তাই আমি এটি স্ক্র্যাচ থেকে কোড করেছিলাম। যদি আমি কোন ভুল না করি তবে আপনি সারি c(1,3,2)এবং কলামগুলি পুনরায় অর্ডার করুন c(4,1,3,2)। এটি সম্পন্ন করার পরে, আমি এখানে কী দেখতে পাচ্ছি তা নিশ্চিত নয়। আপনি কি ভাবছেন?
গাং - মনিকা পুনরায়

11

বিভিন্ন বৈশিষ্ট্য হাইলাইট করার ক্ষেত্রে বিভিন্ন ভিজ্যুয়াল ভাল হবে, তবে মোজাইক প্লটগুলি একটি সাধারণ দর্শনের জন্য ভালভাবে কাজ করে (কোনও কিছু বেরিয়ে আসে কিনা তা পরীক্ষা করে দেখুন)। ডজড বার প্লট বলতে সম্ভবত এটিই বোঝানো হয়েছিল। বেশিরভাগ বিকল্পের মতো এগুলিও প্রতিসাম্য নয় যে তারা তুলনামূলক ফ্রিকোয়েন্সিগুলি অন্য মাত্রার চেয়ে একটি মাত্রায় আরও ভাল উপস্থাপন করে। একটি দুর্দান্ত বৈশিষ্ট্য হ'ল প্রান্তিক ফ্রিকোয়েন্সিগুলিও প্রতিনিধিত্ব করা হয়।

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন


এটা ভাল. উভয় সংখ্যা এবং অনুপাত প্রতিনিধিত্ব করা হয়। নম্বরও প্লটে রাখা যেতে পারে। যদি এক্স-অক্ষ আইটেমের অর্ডার সাজানো থাকে তবে এটি আরও ভাল দেখায়। ঝাঁকুনির দ্বারা আমি একে অপরের উপর সজ্জিত না হয়ে পাশাপাশি বিভাগগুলির পাশাপাশি সাধারণ বারপ্লট বোঝাতে চাইছি (এই পৃষ্ঠায় পজিশন = 'ডজ' দেখুন: r-bloggers.com/used-r-barplot-with-ggplot2 )।
rnso

1
+1 এই নকশা প্রায়শই তুলনামূলক সহজ ডেটার জন্য সত্যই খুব ভাল কাজ করে ; বিপরীতভাবে আমি খুঁজে পেয়েছি যে স্বেচ্ছাসেবী মাত্রার সংক্রমণের টেবিলগুলির এক্সটেনসিবিলিটির জন্য সাহিত্যে প্রচুর জোর দেওয়া সত্ত্বেও এটি আরও জটিল ডেটার জন্য খুব দ্রুত চিন্তা করাও শক্ত হয়ে যায়। তবুও, এই জাতীয় পরিস্থিতিতে কোনও ডিজাইন ভালভাবে কাজ করে না। এই উদাহরণের সাথে একটি ছোট বিষয় হ'ল আপনি আপনার প্রোগ্রাম দ্বারা প্রদত্ত ডিফল্ট বর্ণানুক্রমিক আদেশ "বিকেলে" ... "দুপুর" গ্রহণ করেছেন বলে মনে হয়েছে, অন্যদিকে সময় আদেশ সংরক্ষণ করা আরও প্রাকৃতিক পছন্দ বলে মনে হয়।
নিক কক্স

8

আমি সম্মত হই যে "সেরা" প্লটটি ডেটাসেট, পাঠকগণ এবং উদ্দেশ্য থেকে পৃথক নয়। দুটি পরিমাপযোগ্য ভেরিয়েবলের জন্য, স্ক্যাটার প্লটগুলি তাত্ক্ষণিকভাবে নকশাগুলি যা নির্দিষ্ট উদ্দেশ্যে বাদে অন্য সকলকে তার জাগ্রত অবস্থায় ফেলে দেয়, তবে মার্কেটের কোনও নেতা শ্রেণিবদ্ধ তথ্যের জন্য স্পষ্ট নয়।

আমার উদ্দেশ্য এখানে কেবল একটি সহজ পদ্ধতি উল্লেখ করা, প্রায়শই পুনরায় আবিষ্কার বা পুনরায় উদ্ভাবন করা সত্ত্বেও তবুও এমনকি পরিসংখ্যানগত গ্রাফিক্সকে আবৃত মনোগ্রাফ বা পাঠ্যপুস্তকেও প্রায়শই উপেক্ষা করা হয়।

প্রথম উদাহরণস্বরূপ, জ্যান দ্বারা পোস্ট করা একই ডেটা আবরণ:

এখানে চিত্র বর্ণনা লিখুন

যদি একটি নাম চাওয়া হয়, যেমনটি এটি প্রায়শই হয় তবে এটি দ্বিগুণ বারচার্ট (এই ক্ষেত্রে)। আমি এখানে অন্যান্য শর্তাদি ক্যাটালগ করব না, একাধিক বারচার্ট একই স্বাদযুক্ত একটি সাধারণ বিকল্প ব্যতীত । ("একাধিক বারচার্ট" এর প্রতি আমার ছোট আপত্তিটি হ'ল "মাল্টিপল" খুব সাধারণ স্ট্যাকড বা পাশাপাশি পাশাপাশি বার চার্টকে অস্বীকার করে না, যদিও "দ্বৈত") আমার কাছে আরও স্পষ্টভাবে একটি সারি এবং কলাম লেআউটটিকে বোঝায়, যদিও এটি ঘুরে ফিরে এটি এটি পরিষ্কার করার জন্য উদাহরণ নিতে পারে))

এই ধরণের প্লটের জন্য প্লাস এবং বিয়োগগুলিও সহজ, তবে আমি কিছুটা বানান করব। যেহেতু আমি এই ডিজাইনের (যা কমপক্ষে 1930-এর দশকে ফিরে আসে) অনুরাগী, অন্যরা তীব্র সমালোচনা যোগ করতে চাইতে পারেন।

+1 টি। ধারণাটি সহজেই বোঝা যায় , এমনকি অ প্রযুক্তিগত গোষ্ঠী দ্বারাও। বার উচ্চতা বা বার দৈর্ঘ্য এই উদাহরণে ফ্রিকোয়েন্সি এনকোড করে। অন্যান্য উদাহরণগুলিতে, তারা আপনার পছন্দমতো, অবশিষ্টাংশ ইত্যাদির জন্য গণনা করা পার্সেন্টগুলি এনকোড করতে পারে

+2। সারি ও কলামের কাঠামোটি একটি সারণির সাথে মেলে । আপনি সংখ্যাসূচক মানও যুক্ত করতে পারেন। খুব অল্প পরিমাণে এবং এমনকি অন্তর্নিহিত শূন্যগুলিও স্পষ্টভাবে স্পষ্ট হয়, যা অন্যান্য নকশাগুলির ক্ষেত্রে সর্বদা হয় না (যেমন স্ট্যাক করা বার চার্ট, মোজাইক প্লট)। সারি এবং কলাম লেবেলিং সাধারণত একটি কী বা কিংবদন্তি যুক্ত করার চেয়ে বেশি দক্ষ হয়, যার জন্য প্রয়োজন মানসিক "পিছনে" " সুতরাং এই নকশাটি গ্রাফ এবং টেবিলের ধারণাগুলিকে সংকরিত করে, যা আপাতদৃষ্টিতে কিছু পাঠককে কষ্ট দেয়; বিপরীতভাবে, আমি যুক্তি দেব যে ফিগার এবং টেবিলের মধ্যে শক্তিশালী পার্থক্য কেবল historicalতিহাসিক হ্যাং-ওভার, এখন অপ্রচলিত যে গবেষকরা তাদের নিজস্ব নথি প্রস্তুত করতে পারেন এবং ডিজাইনার, কম্পোজিটার এবং প্রিন্টারের উপর নির্ভর করতে হবে না।

+3। এক্সটেনশন তিনপথ এবং উচ্চতর ডিজাইন নীতিগতভাবে সহজ হয় । দুটি বা দুটি অক্ষের উপর দুটি বা আরও বেশি ভেরিয়েবল সম্মিলিত ভেরিয়েবল হিসাবে রাখুন, বা এই জাতীয় প্লটের একটি অ্যারে দিন। স্বাভাবিকভাবেই, নকশা যত জটিল, তত বেশি জটিল ব্যাখ্যা।

+4। নকশাটি পরিষ্কারভাবে উভয় অক্ষের উপর অরডিনাল ভেরিয়েবলগুলিকে অনুমতি দেয় । যথাযথ শেডিংয়ের পাশাপাশি সেই অক্ষের বিভাগগুলির ক্রম দ্বারা আদেশটি প্রকাশ করা যেতে পারে। অক্ষগুলির উপর বিভাগের আদেশটি তাদের অর্থ দ্বারা নির্ধারিত হতে পারে, বা ফ্রিকোয়েন্সি দ্বারা আরও ভাল নির্ধারিত হয়; পাঠ্য লেবেল অনুসারে বর্ণানুক্রমিক ক্রমটি একটি ডিফল্ট হতে পারে তবে এটি কেবলমাত্র বিবেচনা করা পছন্দ করা উচিত নয়।

-1। ডিজাইনে সাধারণ হয়ে প্লট নির্দিষ্ট ধরণের সম্পর্ক দেখানোর ক্ষেত্রে কম দক্ষ হতে পারে । বিশেষত, একটি মোজাইক প্লট স্বাধীনতা থেকে প্রস্থানগুলি খুব স্পষ্ট করতে পারে। বিপরীতে, যখন শ্রেণিবদ্ধ ভেরিয়েবলগুলির মধ্যে সম্পর্কগুলি জটিল বা অস্পষ্ট হয়, তখন সাধারণত কোনও গ্রাফ সেই দুর্বল সত্যের চেয়ে বেশি দেখানো ভাল is

-2। কিছুটা ক্ষেত্রে ডিজাইনটি প্রায় প্রতিটি ক্রস-সংমিশ্রনের জন্য জায়গা রেখে যতক্ষণ না ঘটে তা নির্বিশেষে স্থান ব্যবহারে অদক্ষ । এটি পুণ্য হিসাবে বিবেচিত একই নীতিটির ভাইস। স্পেসিফিকেশন বিভাগের উপরে নির্দিষ্ট নকশা তাদের ফ্রিকোয়েন্সি নির্বিশেষে সমান; বলিদান যে প্রায়শই পাঠযোগ্য প্রান্তিক লেবেলকে উত্সর্গ করে, যা আমি খুব মূল্যবান। এই উদাহরণে, পাঠ্য লেবেলগুলি খুব সংক্ষিপ্ত আকার ধারণ করে তবে এটি সাধারণ থেকে দূরে।

দ্রষ্টব্য: xan এর ডেটা কেবল উদ্ভাবিত হিসাবে উপস্থিত হয়েছে, সুতরাং আমি অন্য উত্তরের চেয়ে চেষ্টা করা আর কোনও ব্যাখ্যা চেষ্টা করব না। তবে কিছু হোমস্পান প্রজ্ঞা এখানে সর্বশেষ শব্দের প্রাপ্য: আপনার জন্য সর্বোত্তম নকশা হ'ল আপনার এবং আপনার পাঠকদের কাছে আপনার যত্ন নেওয়া কিছু প্রকৃত ডেটার কাঠামো best

অন্যান্য উদাহরণ অন্তর্ভুক্ত

আপনি 3 শ্রেণিবদ্ধ ভেরিয়েবলের মধ্যে সম্পর্ককে কীভাবে কল্পনা করতে পারেন?

দুটি অরডিনাল ভেরিয়েবলের মধ্যে সম্পর্কের জন্য গ্রাফ


1
অন্য কার্যকর ব্যবহারের বিকল্প এবং কিছু দুর্দান্ত আলোচনার জন্য +1। আমাকে দ্বিমুখী বারচার্ট সম্পর্কে আরও একটি প্রশ্ন জিজ্ঞাসা করতে দাও / অন্য সম্ভাব্য খারাপ দিকটির দিকে ইঙ্গিত করুন: একটি চিহ্ন রয়েছে, তবে স্পষ্টভাবে উপলব্ধিযোগ্য 'বাক্স' রয়েছে যার মধ্যে বারগুলি প্লট করা যেতে পারে। বারটি বাক্সের শীর্ষে পৌঁছানোর সাথে সাথে এটি 100% এ পৌঁছে যায়। কীভাবে এই মূল্য নির্ধারণ করা হয়? (এনবি, কন্টিনজেন্সি টেবিলগুলি সর্বদা কোনও অর্থে ডাব্লু / একটি পরিচিত মোটের বহুজাতিক থাকে)) বাক্সের সারির অঙ্কগুলি বা কলামের যোগফলগুলির শীর্ষটি তৈরি করা বিভিন্ন ধারণাগত ধারণাটিকে প্রচার করবে। (এটি টেবিলের যোগফল হিসাবে ব্যবহৃত হয় না, কারণ অনেকগুলি বার পার্থক্য করতে খুব ছোট হবে be)
গাং - মনিকা পুনরায় স্থাপন করুন

1
ধন্যবাদ আমি এখানে সিভিতে অন্য কোথাও ব্যবহৃত আমার নিজস্ব স্টাটা প্রোগ্রামটিতে মন্তব্য করতে পারি। প্রোগ্রামটি tabplotএসএসসি থেকে। বারগুলির উচ্চতা লম্বা বা দীর্ঘতম বারের উচ্চতার কিছু অংশ অবশ্যই প্রয়োজন; এর জন্য উপলব্ধ স্থানটি কত সারি দেখানো হচ্ছে তা নির্ধারণ করে। ব্যবহারকারী ডিফল্ট ফাঁক আকারটি ওভাররাইড করতে পারে তবে তারপরে বার একে অপরের সাথে স্পর্শ করা বা আটকে রাখার ঝুঁকিপূর্ণ। বারগুলি যদি নেতিবাচক পাশাপাশি ইতিবাচকও হতে পারে তবে জিনিসগুলি সহজ নয়। আমি ধারণা করি যে একই বাধা অন্য কোনও প্রোগ্রামের সাথে কামড়ায়। সংক্ষেপে, বারগুলি স্পর্শ না করে সাদা স্থান বোঝায়!
নিক কক্স

8

@ গুং এবং @ জানের উত্তরগুলির পরিপূরক করতে, এখানে vcdআর ব্যবহার করে মোজাইক এবং সমিতি প্লটগুলির একটি উদাহরণ ots

> tab
        period
activity morning noon afternoon evening
  feed        28    4         0      56
  social      38    5         9      10
  travel       6    6        14      13

প্লটগুলি পেতে:

require(vcd)
mosaic(tab, shade=T, legend=T)
assoc(tab, shade=T, legend=T)

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন

উভয় স্বজ্ঞাতভাবে প্রত্যাশিত ফ্রিকোয়েন্সিগুলি থেকে প্রস্থান ... ডিফল্ট হ'ল পারস্পরিক স্বাধীনতার মডেল , তবে যুক্তিটির মাধ্যমে এটি পরিবর্তন করা যেতে পারে (উদাহরণস্বরূপ স্পষ্ট প্রতিক্রিয়া পরিবর্তনশীল হলে যৌথ স্বাধীনতায় ) expected

আরো দেখুন:

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.