গ্রাফিকভাবে প্রচুর ডেটা দেখানোর একটি ভাল উপায়


15

আমি এমন একটি প্রকল্পে কাজ করছি যা 14 টি ভেরিয়েবল এবং 345,000 পর্যবেক্ষণকে আবাসন সম্পর্কিত ডেটা (বছরের মতো নির্মিত, বর্গক্ষেত্রের ফুটেজ, বিক্রয়মূল্যের মূল্য, আবাসনের কাউন্টি ইত্যাদির জন্য) জড়িত। আমি ভাল গ্রাফিকাল কৌশলগুলি এবং আর লাইব্রেরিগুলিতে সুন্দর প্লট করার কৌশল রয়েছে সেগুলি সন্ধানের চেষ্টা নিয়ে উদ্বিগ্ন।

আমি ইতিমধ্যে জিপিপ্লট এবং ল্যাটিসে কী সুন্দরভাবে কাজ করবে তা দেখছি এবং আমি আমার কয়েকটি সংখ্যক ভেরিয়েবলের জন্য বেহালা প্লট করার কথা ভাবছি।

একটি পরিষ্কার, পালিশযুক্ত এবং সবচেয়ে গুরুত্বপূর্ণভাবে, সংক্ষিপ্ত পদ্ধতিতে সংখ্যক বা গুণক-টাইপযুক্ত ভেরিয়েবলগুলির বৃহত পরিমাণে প্রদর্শন করার জন্য লোকেরা কী কী প্যাকেজগুলির পরামর্শ দেবে?


"পরিষ্কার, পালিশ এবং সবচেয়ে গুরুত্বপূর্ণভাবে, সংমিশ্রণ পদ্ধতি" আমার কাছে ggplot2 এর মতো মনে হচ্ছে।
ব্র্যান্ডন বার্টেলসেন

1
আমি কেবল আর লাইব্রেরিগুলিতেই নয়, নির্দিষ্ট ধরণের গ্রাফের জন্যও খুঁজছি। গ্রাফগুলি সম্পর্কে আমার জ্ঞানগুলি স্ক্যাটার, বাক্স, কিউকিউ, হিস্টোগ্রাম, বেহালা, কার্নেলের ঘনত্বের অনুমান ইত্যাদির মধ্যে সীমাবদ্ধ Any
ক্রিস্টোফার অ্যাডেন

2
সমান্তরাল স্থানাঙ্কগুলি অন্যর মতো উল্লেখ করার মতো শোনায়। এছাড়াও মাত্রিকতা হ্রাসের পদ্ধতিগুলি সহায়ক হতে পারে।
তাল গালিলি

উত্তর:


13

সেরা "গ্রাফ" এতটাই সুস্পষ্ট যে এটি এখনও কেউ উল্লেখ করেনি: মানচিত্র তৈরি করুন। হাউজিং ডেটা স্থানিক অবস্থানের উপর মূলত নির্ভর করে (রিয়েল এস্টেট সম্পর্কে পুরানো কর অনুযায়ী), তাই প্রথম কাজটি হ'ল প্রতিটি ভেরিয়েবলের সুস্পষ্ট বিস্তারিত মানচিত্র তৈরি করা। এক মিলিয়ন পয়েন্টের এক তৃতীয়াংশের সাথে এটি ভালভাবে করার জন্য একটি শিল্প-শক্তি জিআইএস প্রয়োজন, যা প্রক্রিয়াটির সংক্ষিপ্ত কাজ করতে পারে। এর পরে অবিচ্ছিন্ন বিতরণগুলি অন্বেষণ করার জন্য সম্ভাব্যতা প্লট এবং বক্সপ্লটগুলি তৈরি করা এবং স্ক্রেটারপ্লট ম্যাট্রিক্স এবং ঘোরাঘুরির স্কিম্যাটিক বক্সপ্লটস ইত্যাদির উপর নির্ভরতা অন্বেষণ করার পরিকল্পনা করা বুদ্ধিমান হয়ে যায় - তবে মানচিত্রগুলি অবিলম্বে কী কী অন্বেষণ করবেন সে সম্পর্কে পরামর্শ দেবে, কীভাবে মডেলটি মডেল করবেন? ডেটা সম্পর্ক এবং কীভাবে উপাত্ত উপগ্রহে ভৌগলিকভাবে ডেটা ভাঙ্গতে হয়।


ভালো বুদ্ধি! আমার ইতিমধ্যে সমস্ত ডেটাপয়েন্টের অক্ষাংশ এবং দ্রাঘিমাংশ রয়েছে, সুতরাং এই জাতীয় কাজটি তুলনামূলকভাবে প্রাথমিক হবে। আমি ভাবছিলাম মানচিত্রের গ্রন্থাগারটি ভাল যাওয়ার ভাল উপায় হবে, যদি না আরও ভাল কিছু থাকে।
ক্রিস্টোফার অ্যাডেন

2
@ খ্রিস্টোফার আপনি এটিও করতে পারেন ggplot2(উদাহরণস্বরূপ, যদি আপনাকে দেশের সীমানা আঁকার প্রয়োজন না হয়), had.co.nz/ggplot2/coord_map.html । অন্যথায়, maps, gmapsভাল হয়। এর রয়েছে GeoXpঘাস একটি আর ইন্টারফেস। বিটিডাব্লু, মন্ড্রিয়ানের ভৌগলিক ডেটাগুলির জন্য একটি প্লাগইন রয়েছে :)
chl

বেশ কয়েকটি দুর্দান্ত পরামর্শ দেওয়া সত্ত্বেও একটি উত্তরের উত্তর নির্ধারণ করা কঠিন হতে পারে তবে আমি মনে করি "সংবিধান" মাথায় রেখেই এটি সঠিক দিক। আমি ggplot2 কে একবার চেষ্টা করব এবং মানচিত্র, জিওএক্সপি এবং মন্ড্রিয়ানের দিকে একবার নজর দেব। স্থানিকভাবে গ্রাফিংয়ের ধারণার জন্য ধন্যবাদ!
ক্রিস্টোফার অ্যাডেন

সম্পর্কে কিছু শীতল পোস্ট মানচিত্র blog.revolutionanalytics.com/2012/07/... stevendkay.wordpress.com/2010/04/21/...
ক্রিস Beeley

আমি এবং latticeএর সাথে ভাল সাফল্য পেয়েছি । প্যাকেজটিতে কিছু দুর্দান্ত বৈশিষ্ট্য রয়েছে, যার মধ্যে আপনার ডেটা কঠোরভাবে গ্রিডে না রাখলে দুর্দান্ত is গ্রিডে নন-গ্রিডড ডেটা মসৃণ করতে এটিতে একটি দুর্দান্ত পাতলা-প্লেট স্প্লাইন ফাংশন রয়েছে । উত্সর্গীকৃত জিআইএস সফ্টওয়্যার হিসাবে, গ্রাস কোনওভাবেই আমার কাছে বোধগম্য হয় না, আমি কিউজিআইএসকে পছন্দ করি। levelplotcontourplotfieldsquiltplotTps
ওয়েইন

6

আমি কমপক্ষে অনুসন্ধানের উদ্দেশ্যে GGobi , যা এর একটি আর ইন্টারফেস রয়েছে তা একবার দেখার পরামর্শ দিই । এটিতে প্রচুর গ্রাফিকাল ডিসপ্লে রয়েছে বিশেষত একটি বিশাল সংখ্যক পর্যবেক্ষণ এবং ভেরিয়েবলগুলির সাথে ডিল করার জন্য এবং এগুলিকে একসাথে যুক্ত করার জন্য কার্যকর। আপনি জিগিবি শিখুন পৃষ্ঠায় "একটি ডেমো দেখুন" বিভাগের অধীনে কয়েকটি ভিডিও দেখে শুরু করতে পারেন ।

হালনাগাদ

মন্তব্যগুলিতে chl দ্বারা প্রস্তাবিত হিসাবে GGobi এর জন্য হ্যাডলি উইকহামের সরঞ্জামগুলির লিঙ্কগুলি:

  • বর্ণনা করুন ডিসপ্লে "আর প্যাকেজ যা আরে জিগোবি গ্রাফিক্স পুনরায় তৈরি করার একটি উপায় সরবরাহ করে"
  • clusterfly "উচ্চ মাত্রার মধ্যে ক্লাস্টারিং ফলাফল ঘুরে দেখুন"
  • rggobi "আর প্যাকেজ যা GGobi এর সাথে একটি সহজ ইন্টারফেস সরবরাহ করে"

1
@ars চলুন GGobi অভিজ্ঞতা বাড়ানোর জন্য হ্যাডলির আর সরঞ্জামগুলি যুক্ত করুন, যেমন DescribeDisplayএবং clusterfly
chl

হাই আরস, আমি আমার উত্তরে যেমন লিখেছি - গিগবির সাথে আমার অভিজ্ঞতা হ'ল এটি বড় ডেটাসেটগুলি ভালভাবে পরিচালনা করে না। আপনি কি সঙ্গে অন্য অভিজ্ঞতা আছে?
তাল গালিলি

@ টাল সমস্যাটি স্ক্রিন ডিসপ্লে / রেন্ডারিংয়ের জন্য গ্লাইফের উপর নির্ভর না করা থেকে আসে, যা আর বেস গ্রাফিক্সের জন্য সাধারণ। সর্বশেষ ডিএসসি সম্মেলনে এটি আলোচনা হয়েছিল ( j.mp/bpOhBH )। প্রকৃতপক্ষে, বিশাল ডেটা সেটগুলির ইন্টারেক্টিভ প্রদর্শন বাড়ানোর জন্য কিউটিটি ব্যাকএন্ড হিসাবে এবং জিজিবি-র একটি নতুন বন্দর রয়েছে project
chl

1
@ টাল: আমার অভিজ্ঞতা হ'ল দর্শনগুলি রিফ্রেশ / পুনর্নির্মাণ করার সময় এটি বেশ ধীরে ধীরে, যেমন কোনও ভেরিয়েবল যুক্ত করার সময় বা পিসিপিতে ডিসপ্লেগুলি পুনরায় সাজানোর জন্য টেনে আনার সময়। তবুও, এটি বড় ডেটাতে বিজ্ঞাপনিত হিসাবে ইন্টারেক্টিভ না হলেও এটি ব্যবহারযোগ্য। @ সিএইচএল: এটি জেনে রাখা সত্যিই ভাল, ধন্যবাদ!
Ars

1
@ars @Tal এখানে আর (জন্য কিউটি ইন্টারফেসে লিঙ্ক j.mp/d1AJp7 ) এবং GGobi ( j.mp/cUOvfp )। হ্যাডলির গিথুব সংগ্রহশালাটিও দেখুন!
chl

6

আমি অনুভব করি আপনি আসলে দুটি প্রশ্ন জিজ্ঞাসা করছেন: 1) কী ধরণের ভিজ্যুয়ালাইজেশন ব্যবহার করা উচিত এবং 2) আর প্যাকেজ এগুলি উত্পন্ন করতে পারে।

কোন ধরণের গ্রাফ ব্যবহার করতে হবে সে ক্ষেত্রে অনেকগুলি রয়েছে এবং এটি আপনার প্রয়োজনের উপর নির্ভর করে (যেমন: ভেরিয়েবলের ধরণ - সংখ্যা, গুণক, ভৌগলিক ইত্যাদি এবং সংযোগের ধরণ যা আপনি প্রদর্শন করতে আগ্রহী):

এটি কীভাবে করা যায় সে সম্পর্কে এখন। অনেক ডেটা পয়েন্টের সাথে একটি সমস্যা প্লট তৈরি হওয়া অবধি হয়। ggplot2, iplots, ggobi খুব বেশি ডেটা পয়েন্টের জন্য খুব ভাল নয় (কমপক্ষে আমার অভিজ্ঞতা থেকে)। যে ক্ষেত্রে আপনি আর বেস গ্রাফিক্স সুবিধার উপর ফোকাস করতে চাইতে পারেন, বা আপনার সমস্ত ডেটা এবং অন্য সমস্ত সরঞ্জাম ব্যবহার করার জন্য স্যাম্পল করতে পারেন। অথবা আপনি কি আশা করতে পারেন যে মানুষ iplots চরম (অথবা উন্নয়নশীল Acinonyx ) অগ্রিম মুক্তি ধাপে পেতে হবে।


rflowcytঅ্যাকিননিএক্স এবং লিঙ্কগুলির জন্য ধন্যবাদ ।
chl

BTW, rflowcytBioconductor সাম্প্রতিক রিলিজ সঙ্গে অবচিত হয়েছে, এটি এখন ব্যবহার করা বাঞ্ছনীয় flowViz। যাইহোক, উভয়ই ভরসা lattice
chl

খুব পুঙ্খানুপুঙ্খ উত্তর, তাল! প্লট জেনারেশন সময় একটি বিশাল সমস্যা হওয়া উচিত নয়। আমি বেস প্যাকেজটি নিয়ে আমার বেশিরভাগ গ্রাফগুলি করছি এবং আমি যখন কাগজের জন্য কোনও গ্রাফ ব্যবহার করার সিদ্ধান্ত নেব তখন গ্রাফগুলি আরও ভাল লাগার বিষয়টি ছিল। আমি সংখ্যার ভেরিয়েবলের জন্য একটি স্ক্র্যাটারপ্লট ম্যাট্রিক্স ব্যবহার করার বিষয়টি বিবেচনা করেছি, তবে যেহেতু তাদের মধ্যে অনেকগুলি বিভিন্ন ইউনিটের (কিছু ডলারে, অন্য বর্গফুট), তাই কেবলমাত্র মূল্যবান তথ্যটি আমি পেয়েছি সাধারণ প্রবণতা, তবে 8 ডলার সহ ভেরিয়েবল, একটি 8x8 এসপিএম কিছুটা বিশৃঙ্খল।
ক্রিস্টোফার অ্যাডেন

3

ম্যান্ড্রিয়ান ইন্টারেক্টিভ বৈশিষ্ট্যগুলি সরবরাহ করে এবং বেশ বড় ডেটা সেটগুলি পরিচালনা করে (এটি জাভাতে রয়েছে, যদিও)।

প্যারাভিউতে 2D / 3D যেমন অন্তর্ভুক্ত রয়েছে। বৈশিষ্ট্যগুলিও উপস্থিত রয়েছে।


দুটি উপন্যাস গ্রন্থাগারের জন্য ধন্যবাদ। এই দুটির সাথে আমার প্রধান বিরোধটি হ'ল আমি কাগজের অনুলিপিটির মাধ্যমে আমার প্রতিবেদন জমা দিচ্ছি, যাতে ইন্টারেক্টিভ গ্রাফিকগুলি পুরোপুরি ব্যবহার না করা হতে পারে। মন্ড্রিয়ানের গ্রাফিকগুলি বেশ জটিল দেখাচ্ছে। আমি এটি একটি চেহারা দেখুন।
ক্রিস্টোফার অ্যাডেন

@ ক্রিস্টোফার মন্ড্রিয়ানের জন্য আপনার কাছে iplots@ টাল দ্বারা উদ্ধৃত "সমতুল্য" আর সংস্করণ রয়েছে। প্যারাভিউ সম্পর্কে, আপনার নিজের স্ক্রিনশটটি সংরক্ষণ করার বিকল্প রয়েছে। জিজিবিDescribeDisplay , ক্র্যান.আর-প্রজেক্ট.আর / ওয়েবে / প্যাকেজ / ডিসাইক্রিটডিসপ্লে / ইন্ডেক্স এইচটিএমএল থেকে ডায়নামিক ভিজুয়ালাইজেশন রফতানির পথে যাওয়ার উপায় ।
chl

-3

আমি আপনার দৃষ্টি আকর্ষণ করতে চাই, সমান্তরাল স্থানাঙ্ক: ভিজ্যুয়াল বহুমাত্রিক জ্যামিতি এবং এর অ্যাপ্লিকেশন , যাতে ক্ষেত্রের সর্বশেষ যুগান্তকারী এবং অ্যাপ্লিকেশন রয়েছে।

বইটি অন্যদের মধ্যে স্টিফেন হকিং দ্বারা প্রশংসিত হয়েছিল। পৃষ্ঠগুলি তার সাধারণ ভেক্টর দ্বারা এর পয়েন্টগুলিতে বর্ণনা করা হয় (দ্বৈত ব্যবহার করে)। এটিতে এয়ার ট্র্যাফিক কন্ট্রোল (অটোমেটিক সংঘর্ষ এড়ানো - 3 ইউএসএ পেটেন্টস), মাল্টিভারিয়েট ডেটা মাইনিং (শত শত ভেরিয়েবল সহ বাস্তব ডেটাসেটগুলিতে), মাল্টিবজেক্টিভ অপটিমাইজেশন, প্রসেস নিয়ন্ত্রণ, নিবিড় পরিচর্যা স্মার্ট ডিসপ্লে, সুরক্ষা, নেটওয়ার্ক ভিজ্যুয়ালাইজেশন এবং সম্প্রতি বড় অ্যাপ্লিকেশন রয়েছে ডেটা।


5
হাই আলফ্রেড, সাইটে যোগদানের জন্য ধন্যবাদ, এটি যদিও কিছুটা প্রচারমূলক হিসাবে প্রকাশিত হয়েছে। সম্ভবত আপনার কাছে ওপি-র ডেটাসেটের (14 ভেরিয়েবল এবং 345,000 পর্যবেক্ষণ) এর অনুরূপ একটি উদাহরণ রয়েছে যা আপনি একটি চিত্র সরবরাহ করতে পারেন এবং বর্ণনা করতে / প্রদর্শন করতে পারেন যে সমান্তরাল স্থানাঙ্কগুলি কীভাবে কার্যকর হতে পারে? অনেক স্ট্যাটিক সমান্তরাল স্থানাঙ্ক চার্টের সাথে আমি অনেকগুলি পর্যবেক্ষণ দিয়ে দেখেছি যে কোনও প্লেটে স্প্যাগেটির মতো দেখতে ঝোঁক রয়েছে, আমি সন্দেহ করি যে এত বড় এন ডেটা বোধ করার জন্য আপনার আরও অন্তর্দৃষ্টি রয়েছে।
অ্যান্ডি ডাব্লু

হাই অ্যান্ডি, অনেক পর্যবেক্ষণের সাথে আমার উদাহরণ নেই। ইন
আলফ্রেড ইনসেলবার্গ

হাই অ্যান্ডি, অনেক পর্যবেক্ষণের সাথে আমার উদাহরণ নেই। তথ্য অনুসন্ধানের জন্য ইন্টারঅ্যাক্টিভিটি প্রয়োজনীয়। "রহস্যময়" ব্যর্থতাগুলি আবিষ্কার করতে আমি সেলুলারাল টেলিফোন নেটওয়ার্কে প্রায় 800 ভেরিয়েবল এবং 10,000 টি পর্যবেক্ষণ সহ একটি ডেটাসেটে কাজ করেছি। শ্রেণিবদ্ধ ব্যবহার করে পর্যায়ক্রমে এবং ইন্টারেক্টিভের সাথে দায়িত্বশীল ১১ টি ভেরিয়েবলগুলি পাওয়া গিয়েছিল এবং ব্যর্থতার বিষয়টি নজরে নেওয়ার আগে নেটওয়ার্কে অস্বাভাবিক ক্রিয়াকলাপটি সনাক্ত করা হয়েছিল এবং সময়মতো পিছন দিকে তাদের ট্রেস করা হয়েছিল।
আলফ্রেড ইনসেলবার্গ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.