একাধিক "হিস্টোগ্রাম" (বার-চার্ট) ভিজ্যুয়ালাইজ করা


9

ডেটা ভিজ্যুয়ালাইজ করার সঠিক উপায়টি নির্বাচন করতে আমার সমস্যা হচ্ছে। ধরা যাক আমাদের বইয়ের দোকান রয়েছে যা বই বিক্রি করে এবং প্রতিটি বইয়ের কমপক্ষে একটি বিভাগ রয়েছে

একটি বইয়ের দোকানে, আমরা যদি বইয়ের সমস্ত বিভাগ গণনা করি, আমরা একটি হিস্টোগ্রাম অর্জন করি যা সেই বইয়ের দোকানের জন্য একটি নির্দিষ্ট বিভাগে পড়ে এমন বইয়ের সংখ্যা দেখায়।

আমি বইয়ের দোকানটির আচরণটি কল্পনা করতে চাই, তারা দেখতে চাই যে তারা অন্যান্য বিভাগের চেয়ে কোনও বিভাগকে সমর্থন করে কিনা। তারা সকলে একসাথে বিজ্ঞান-ফাইয়ের পক্ষপাতী কিনা তা আমি দেখতে চাই না, তবে আমি দেখতে চাই যে তারা প্রতিটি বিভাগে সমানভাবে আচরণ করছে কিনা।

আমার কাছে M 1M বইয়ের দোকান রয়েছে।

আমি 4 টি পদ্ধতি সম্পর্কে চিন্তা করেছি:

  1. ডেটা নমুনা করুন, কেবল 500 টি বইয়ের দোকানে হিস্টোগ্রাম প্রদর্শন করুন। 10x10 গ্রিড ব্যবহার করে এটিকে 5 টি পৃথক পৃষ্ঠায় দেখান। একটি 4x4 গ্রিড উদাহরণ:

    একাধিক হিস্টোগ্রাম 1

  2. # 1 হিসাবে একই। তবে এবার তাদের সংখ্যা গণনা অনুসারে এক্স অক্ষের মানগুলি বাছাই করুন, সুতরাং যদি কোনও পক্ষপাতী থাকে তবে এটি সহজেই দেখা যাবে।

  3. কল্পনা করুন যে হিস্টোগ্রামগুলি # 2 তে একত্রে ডেকের মতো রেখে 3 ডি-তে দেখানো হয়েছে। এটার মতো কিছু:
    থ্রিডি হিস্টোগ্রাম

  4. রঙগুলি উপস্থাপনের জন্য তৃতীয় অক্ষ স্যুং রঙ ব্যবহার করার পরিবর্তে হিটম্যাপ (2 ডি হিস্টোগ্রাম) ব্যবহার করে: 2 ডি হিস্টগ্রাম
    সাধারণত বইয়ের দোকানগুলি অন্যদের কাছে কিছু বিভাগ পছন্দ করে তবে এটি বাম থেকে ডানে একটি দুর্দান্ত গ্রেডিয়েন্ট হিসাবে প্রদর্শিত হবে।

একাধিক হিস্টোগ্রাম উপস্থাপন করার জন্য আপনার কাছে অন্য কোনও ভিজ্যুয়ালাইজেশন ধারণা / সরঞ্জাম রয়েছে?


4
আমি মনে করি আপনারা হিস্টোগ্রামের চেয়ে বার চার্ট বলতে চাইছেন
রব হ্যান্ডম্যান

@ রব: হিস্টগ্রাম কি একটি বিশেষ ধরণের বার চার্ট নয় যা ফ্রিকোয়েন্সি বিতরণের প্রতিনিধিত্ব করে? আমি অনেকগুলি বইয়ের দোকানে বিভাগের ফ্রিকোয়েন্সি ভিজ্যুয়ালাইজ করার চেষ্টা করছি।
নিমক্যাপ

1
@ নিমপ্যাপ নং, কারণ হিস্টোগ্রাম একটি অবিচ্ছিন্ন পরিবর্তনশীলের ওপরে এবং বইয়ের বিভাগটি একটি শ্রেণিবদ্ধ পরিবর্তনশীল।

@ এমবিকিউ বলুন যে একটি বইয়ের দোকানে 3 টি বই রয়েছে এবং তাদের বিভাগগুলি: বি 1: [সি 1, সি 2, সি 3] বি 2: [সি 1, সি 3] বি 3: [সি 1, সি 4]। আমরা যখন বিভাগের সংখ্যাকে একত্রিত করি তখন আমরা [c1 x 3, c2 x 1, c3 x 2, c4 x 1] পাই। এটি কি হিস্টগ্রাম তৈরি করার পক্ষে যথেষ্ট নয়?
নিমক্যাপ

2
@ নিমক্যাপ না, একটি বার চার্ট তৈরি করা যথেষ্ট। কোনও বইয়ের দামের জন্য উদাহরণস্বরূপ হিস্টোগ্রাম করা যেতে পারে।

উত্তর:


12

আপনি যেমন খুঁজে পেয়েছেন আপনার প্রশ্নের সহজ উত্তর নেই!

আমি অনুমান করি যে আপনি অদ্ভুত বা বিভিন্ন বইয়ের দোকানগুলি সন্ধান করতে আগ্রহী? যদি এটি হয় তবে আপনি পিসিএ-এর মতো জিনিস চেষ্টা করতে পারেন ( আরও তথ্যের জন্য উইকিপিডিয়া ক্লাস্টার বিশ্লেষণ পৃষ্ঠাটি দেখুন)।

আপনাকে ধারণা দেওয়ার জন্য, এই উদাহরণটি বিবেচনা করুন। আপনার কাছে 26 টি বুকশপ রয়েছে (এ, বি, .. জেড নাম সহ)। সমস্ত বুকশপগুলি বাদে:

  1. শপ জেড কেবলমাত্র কয়েকটি ইতিহাসের বই বিক্রি করে।
  2. দোকানগুলি ওওয়াই গড়ের চেয়ে রোম্যান্সের বই বেশি বিক্রি করে।

একটি প্রধান উপাদান প্লট আরও তদন্তের জন্য এই দোকানগুলিকে হাইলাইট করে।

এখানে কিছু নমুনা আর কোড রয়েছে:

> d = data.frame(Romance = rpois(26, 50), Horror = rpois(26, 100), 
               Science = rpois(26, 75), History = rpois(26, 125))
> rownames(d) = LETTERS
#Alter a few shops
> d[15:25,][1] = rpois(11,150)
> d[26,][4] = rpois(1, 10)
#look at the data
> head(d, 2)
       Romance Horror Science History
 A      36    107      62     139
 B      47     93      64     118
> books.PC.cov = prcomp(d)
> books.scores.cov = predict(books.PC.cov)
# Plot of PC1 vs PC2
> plot(books.scores.cov[,1],books.scores.cov[,2],
       xlab="PC 1",ylab="PC 2", pch=NA)
> text(books.scores.cov[,1],books.scores.cov[,2],labels=LETTERS)

এটি নিম্নলিখিত প্লট দেয়:

পিসিএ প্লট http://img265.imageshack.us/img265/7263/tmplx.jpg

লক্ষ্য করুন:

  1. শপ জেড একটি বহির্মুখী পয়েন্ট।
  2. অন্য দোকানগুলি দুটি স্বতন্ত্র গ্রুপ গঠন করে।

অন্যান্য সম্ভাবনার

আপনি জিজিবিতেও দেখতে পারেন , আমি এটি কখনও ব্যবহার করি নি, তবে এটি আকর্ষণীয় দেখাচ্ছে।


আপনার মূল্যবান উত্তরের জন্য আপনাকে ধন্যবাদ। পরিস্থিতিটি আমার মাতৃভাষায়ও বর্ণনা করা শক্ত :) :) আমাকে চেষ্টা করুন। বইয়ের দোকানগুলি নির্দিষ্ট বিভাগগুলির পক্ষপাতী কিনা সে বিষয়ে আমার আগ্রহ নেই তবে আমি দেখতে চাই তারা বিভাগগুলির পক্ষে নিচ্ছে কিনা। আসলে আমি এটাই প্রত্যাশা করছি। ধরা যাক আমার কাছে 3 টি বইয়ের দোকান (বি 1, বি 2, বি 3) এবং 4 বিভাগ (সি 1, সি 2, সি 3, সি 4) রয়েছে। এগুলি তাদের বিক্রয় ডেটা: বি 1 (1, 1, 20, 20) বি 2 (90, 1, 1, 1), বি 3 (1, 1, 1, 30)। এই ডেটাটি দেখে আমি বলতে পারি যে তারা কিছু বিভাগকে অন্যের পক্ষে পছন্দ করে। তবে ডেটা যদি বি 1 (20, 30, 20, 20) বি 2 (90, 100, 100, 100), বি 3 (30, 30, 40, 40) এর মতো হয় তবে আমি তা বলতে পারি না।
নিমক্যাপ

আমার উদাহরণে, দোকানগুলি ওয় রোম্যান্স বই পছন্দ করে। এই কারণেই এই দোকানগুলি পিসি প্লটে একটি আলাদা গ্রুপে রয়েছে।
csgillespie

2
আমি এটিকে একটি ভাল সাধারণ উত্তর হিসাবে ভোট দিয়েছি তবে ব্যবহারিক উত্তর হিসাবে, অনেকগুলি ডেটা পয়েন্ট নিয়ে কাজ করা নির্মম হতে চলেছে।
জন

1
+1 এটি অবশ্যই ওপি যা চায় তা নয়, তবুও এটি অবশ্যই তার / তার কী চাওয়া উচিত।

1
+1 পিসিএর "ডাউন-টু-আর্থ" প্রয়োগের দুর্দান্ত উদাহরণ।
নিকো

3

আমি এমন কিছু প্রস্তাব দেব যা একটি সংজ্ঞায়িত নাম না পেয়ে (সম্ভবত "সমান্তরাল প্লট") এবং এর মতো দেখতে:

বিকল্প পাঠ

মূলত আপনি x অক্ষতে তালিকাবদ্ধ বিভাগগুলির উপরে পয়েন্ট হিসাবে সমস্ত বইয়ের দোকানগুলির জন্য সমস্ত গণনার পরিকল্পনা করেন এবং প্রতিটি বইয়ের দোকান থেকে ফলাফলকে একটি লাইনের সাথে সংযুক্ত করেন। তবুও এটি 1 এম লাইনের জন্য খুব জটিল হয়ে উঠতে পারে। ধারণাটি জিজিবি থেকে এসেছে যা ইতিমধ্যে সিসিলিলস্পি দ্বারা উল্লেখ করা হয়েছিল।


1
সমান্তরাল প্লটগুলি ভেরিয়েবলের "ডান" ক্রমের উপর নির্ভর করে, তাই অনেকগুলি বিভাগের জন্য এটি ক্লান্তিকর হয়ে উঠবে। এবং সঠিক উৎস A.Inselberg, 1981 হবে বলে মনে হয়
বেঞ্জামিন Bannier

3
তাদের সমান্তরাল স্থানাঙ্ক প্লট বলা হয়: en.wikedia.org/wiki/Parallel_coordinates
সাইমন

@ সিমন ধন্যবাদ; @ হংক আমি সম্মত, আমি এগুলি ব্যবহার না করার এক কারণ।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.