এই প্লটটি দ্বিমুখী কন্টিনজেন্সি টেবিল প্রদর্শন করে যার ডেটা প্রায় এই:
Branded Unbranded Social Referring Direct RSS
First-time... 177276 472737 88638 265915 472737 59092
Return Visits... 236002 629339 118001 354003 629339 78667
4+ Visits in ... 166514 444037 83257 249771 444037 55505
10+ Visit in ... 28782 76751 14391 43172 76751 9594
At Least One Visit... 6707 17886 3354 10061 17886 2236
Last Touch... 660 1759 330 989 1759 220
এই প্লটটি নির্মাণের জন্য অগণিত উপায় রয়েছে। উদাহরণস্বরূপ, আপনি রঙের প্রতিটি আয়তক্ষেত্রাকার প্যাচের অবস্থানগুলি গণনা করতে এবং প্রতিটি প্যাচ পৃথকভাবে প্ল্যাট করতে পারেন। সাধারণভাবে, যদিও এটি কোনও প্লট কীভাবে ডেটা উপস্থাপন করে তার একটি সংক্ষিপ্ত বিবরণ সন্ধান করতে সহায়তা করে।
প্রস্থানের পয়েন্ট হিসাবে, আমরা এটিকে স্ট্যাক করা বার চার্টের প্রকরণ হিসাবে দেখতে পারি ।
এই প্লটটির খুব কমই একটি বিবরণ প্রয়োজন: পরিচিতির মাধ্যমে আমরা জানি যে আয়তক্ষেত্রগুলির প্রতিটি সারিটি आकस्मिक সারণীর প্রতিটি সারিটির সাথে মিলে যায়; যে আয়তক্ষেত্রগুলির দৈর্ঘ্যগুলি তাদের গণনার সাথে সরাসরি সমানুপাতিক; যে তারা উপচে পড়ে না; এবং রঙগুলি টেবিলের কলামগুলির সাথে সামঞ্জস্য করে।
আমরা যদি এই টেবিলটিকে "ডেটা ফ্রেম" বা "ডেটা টেবিল" এ রূপান্তর করি Xক্ষেত্রের সাথে প্রতি সারির একটি সারি থাকা সারি নাম, কলামের নাম এবং গণনা নির্দেশ করে, তারপরে এটি প্লট করা সাধারণত একটি উপযুক্ত ফাংশন কল করা এবং সারি নাম, কলামের নাম এবং সংখ্যাগুলি কোথায় পাওয়া যায় তা নির্ধারণের সমান। গ্রাফিক্স বাস্তবায়নের একটি ব্যাকরণ (এর জন্য ggplot2
প্যাকেজ R
) ব্যবহার করা এর মতো কিছু হবে
ggplot(X, aes(Outcome, Count, fill=Referral)) + geom_col()
গ্রাফিকের বিশদ বিবরণ যেমন বারের সারিটি কত প্রশস্ত এবং কোন রঙগুলি ব্যবহার করা উচিত তা সাধারণত স্পষ্টভাবে নির্দিষ্ট করা দরকার। কীভাবে এটি করা হয় তা চক্রান্তের পরিবেশের উপর নির্ভর করে (এবং এটি তুলনামূলকভাবে খুব কম আগ্রহের বিষয়: আপনাকে কেবল এটি সন্ধান করতে হবে)।
গ্রাফিক্সের ব্যাকরণটির এই বিশেষ প্রয়োগটি বারগুলিতে অবস্থানের ক্ষেত্রে সামান্য নমনীয়তা সরবরাহ করে। সর্বনিম্ন প্রচেষ্টা সহ কাঙ্ক্ষিত চেহারাটি উত্পাদন করার একটি উপায় হ'ল প্রতিটি বারের গোড়ায় একটি অদৃশ্য বিভাগটি প্রবেশ করানো যাতে বারগুলি কেন্দ্রিক হয়। কিছুটা চিন্তা ভাবনাটি বোঝায় যে প্রতিটি বারকে কেন্দ্র করতে জাল গণনাটি বারের মোট দৈর্ঘ্যের গড় এবং দীর্ঘতম বারের গড় হতে হবে। এই উদাহরণের জন্য এটি মানগুলির সাথে একটি প্রাথমিক কলাম হবে
254478.0 0.0 301115.0 897955.0 993610.5 1019817.0
হালকা ধূসরতে জাল তথ্য দেখানোর ফলে এখানে স্ট্যাকযুক্ত বার চার্ট দেওয়া হয়েছে:
ভুয়া কলামের অদৃশ্য গ্রাফিকগুলি তৈরি করে কাঙ্ক্ষিত চিত্রটি তৈরি করা হয়েছে:
প্লটটির গ্রাফিক্সের বিবরণটির পরিবর্তন করার দরকার নেই: আমরা কেবল একই বর্ণনানুসারে রেন্ডার করার জন্য একটি আলাদা কন্টিজেন্সি টেবিল সরবরাহ করেছি (এবং জাল কলামের জন্য ডিফল্ট রঙ অ্যাসাইনমেন্টটি ওভাররড)।
মন্তব্য
এই গ্রাফিকগুলি সৎ: প্রতিটি রঙিন প্যাচের অনুভূমিক ব্যাপ্তি কোনও বিকৃতি ছাড়াই সরাসরি অন্তর্নিহিত ডেটার সাথে সমানুপাতিক। তাদের মূল সাথে (প্রশ্নে) তুলনা করলে বোঝা যায় এর বিকৃতিটি কতটা চরম (টুফ্টের লাই ফ্যাক্টর )।
যদি "ফানেল" এর নীচে বিশদটি দেখাতে ইচ্ছুক হয় তবে দৈর্ঘ্যের চেয়ে ক্ষেত্রফল অনুসারে গণনা উপস্থাপনের বিষয়টি বিবেচনা করুন । আপনি বার লেন্থ সমানুপাতিক বানাতে পারে বর্গমূল মোট লেন্থ এবং তাদের প্রস্থ (উল্লম্ব দিক) ও বর্গমূল সমানুপাতিক হয়। এখন "ফানেল" এর নীচের অংশটি প্রায় এক-বিংশতম দীর্ঘ দৈর্ঘ্য হবে, এর চতুর্থাংশের চেয়ে একশো ভাগ, কিছু বিশদ প্রদর্শন করার অনুমতি দিয়ে। দুর্ভাগ্যক্রমে, ggplot2
বাস্তবায়ন কাউকে বারের প্রস্থে একটি পরিবর্তনশীল মানচিত্র করার অনুমতি দেয় না এবং সুতরাং আরও জড়িত কাজের আশেপাশের প্রয়োজন (যা প্রকৃতপক্ষে প্রতিটি আয়তক্ষেত্রকে স্বতন্ত্রভাবে বর্ণনা করে)। সম্ভবত একটি পাইথন বাস্তবায়ন রয়েছে যা আরও নমনীয়।
তথ্যসূত্র
এডওয়ার্ড টুফতে, পরিমাণগত তথ্যের ভিজ্যুয়াল প্রদর্শন । চ্যাশায়ার প্রেস 1984।
লিল্যান্ড উইলকিনসন, গ্রাফিক্সের ব্যাকরণ। স্প্রিংগার 2005।