ইন্টারেক্টিভ ডেটা ভিজুয়ালাইজেশন কখন ব্যবহার করা কার্যকর?


17

: যদিও একটি টক আমি শীঘ্রই দেব জন্য প্রস্তুতি, আমি সম্প্রতি দুটি প্রধান (ফ্রি) ইন্টারেক্টিভ ডেটা ঠাহর জন্য সরঞ্জামের মধ্যে খনন শুরু GGobi এবং mondrian - উভয় প্রস্তাব ক্ষমতা একটি মহান পরিসীমা (এমনকি যদি তারা একটি বিট বগী)।

আমি উচ্চারণে আপনার সাহায্যের জন্য জিজ্ঞাসা করতে চাই (নিজের কাছে এবং আমার ভবিষ্যতের দর্শকদের জন্য) ইন্টারেক্টিভ প্লটগুলি ব্যবহার করা কখন সহায়ক? হয় ডেটা এক্সপ্লোরেশন (আমাদের জন্য) এবং ডেটা উপস্থাপনা ("ক্লায়েন্ট" এর জন্য)?

কোনও ক্লায়েন্টকে ডেটা ব্যাখ্যা করার জন্য, আমি এর জন্য অ্যানিমেশনটির মান দেখতে পারি:

  • গ্রাফের কোন ডেটা পয়েন্টটি কী তা দেখার জন্য "সনাক্ত / সংযোগ / ব্রাশিং" ব্যবহার করা।
  • ডেটাটির সংবেদনশীলতা বিশ্লেষণ উপস্থাপন করা (উদাহরণস্বরূপ: "আমরা যদি এই বিষয়টিকে সরিয়ে ফেলি তবে আমরা যা পাব তা এখানে)
  • ডেটাতে বিভিন্ন গোষ্ঠীর প্রভাব দেখাচ্ছে (উদাহরণস্বরূপ: "আসুন পুরুষদের জন্য এবং এখন মহিলাদের জন্য আমাদের গ্রাফগুলি দেখুন")
  • সময়ের প্রভাব (বা বয়স বা সাধারণভাবে উপস্থাপনায় অন্য মাত্রা সরবরাহ করা) দেখানো হচ্ছে

যখন আমরা নিজেরাই ডেটা অন্বেষণ করি তখন, আমরা কাজ করছি এমন কোনও ডেটাসেটের কোনও আউটলারের অন্বেষণ করার সময় আমি সনাক্ত / সংযুক্তকরণ / ব্রাশ করার মান দেখতে পাই।

তবে অন্য দুটি এই উদাহরণ, আমি নিশ্চিত নই যে এই প্রযুক্তিগুলি অন্যান্য ব্যবহারিক ব্যবহারগুলি কী প্রস্তাব দেয় offer বিশেষত আমাদের নিজস্ব অনুসন্ধানের জন্য!

এটি যুক্তিযুক্ত হতে পারে যে ইন্টারেক্টিভ অংশটি অনুসন্ধানের জন্য ভাল (উদাহরণস্বরূপ) ডেটাতে বিভিন্ন গোষ্ঠী / গোষ্ঠীর ভিন্ন আচরণ। তবে (বাস্তবে) যখন আমি এ জাতীয় অবস্থার কাছে পৌঁছলাম, তখন আমি যা করতে চাইছি তা ছিল প্রাসঙ্গিক পদ্ধতিগুলি (এবং উত্তরোত্তর পরীক্ষাগুলি) চালানো - এবং আমি যে বিষয়টি উল্লেখযোগ্য বলে মনে করেছি সেগুলি রঙের সাথে ডেটাগুলিতে স্পষ্ট করে ভাগ করে দেবে plot সম্পর্কিত গ্রুপ যা আমি দেখেছি, এটি থেকে একটি নিরাপদ পদ্ধতির মাধ্যমে ডেটাটি "আশেপাশে অবাক করা" হয় (যা সহজেই ডেটা ড্রেজিংয়ের দিকে নিয়ে যেতে পারে (সংশোধনের জন্য প্রয়োজনীয় একাধিক তুলনার সুযোগটিও পরিষ্কার নয়))।

আমি এই বিষয়ে আপনার অভিজ্ঞতা / চিন্তা পড়ে খুব খুশি হব।

(এই প্রশ্নটি একটি উইকি হতে পারে - যদিও এটি ব্যক্তিগত নয় এবং একটি সুচিন্তিত উত্তর আনন্দের সাথে আমার "উত্তর" চিহ্নটি জিতবে :))


3
কমপক্ষে আমার ক্ষেত্রে, আমি কিছুটা একই নৌকায় আছি। আমি মন্ড্রিয়ানের প্রশংসা করি এবং তা আপ টু ডেট রাখি, তবে যখন আমি আসলে একটি নতুন ডেটাসেট অন্বেষণ করি তখন এটি আর তে থাকে, যা কম ইন্টারেক্টিভ তবে সামগ্রিকভাবে আরও নমনীয়। আমি আপনাকে একটি পূর্ণ উত্তর লিখতে শুরু করেছিলাম এবং বুঝতে পেরেছিলাম যে আমি তাত্ত্বিক ভাষায় কথা বলছিলাম এবং আসল অভিজ্ঞতা থেকে নয়।
ওয়েন

উত্তর:


8

@ ভুবার দ্বারা চিত্রিত হিসাবে, পরিমাণগত বা গুণগত তথ্যকে স্থানিক নিদর্শনগুলির সাথে সংযুক্ত করার পাশাপাশি আমি দ্রাঘিমাংশ এবং উচ্চ-মাত্রিক ডেটা বিশ্লেষণের জন্য ব্রাশিং এবং বিভিন্ন সংযোগের প্লটগুলি একসাথে ইডিএর ব্যবহারের কথা উল্লেখ করতে চাই ।

উভয়ই ডায়ান্ন কুক এবং ডেবোরাহ এফ সুইয়েন (স্প্রঞ্জার ইউজারআর !, 2007) র দুর্দান্ত তথ্য , ইন্টারেক্টিভ এবং ডায়নামিক গ্রাফিক্স ডেটা অ্যানালাইসিস উইথ আর আর জিজিবিতে আলোচিত, যা আপনি অবশ্যই জানেন। জন টুকি (পি। 13) এর উদ্ধৃতি দিয়ে EDA "" আমাদের উপর অপ্রত্যাশিতভাবে চাপ প্রয়োগ করার "প্রয়োজনীয়তার ন্যায্যতা প্রমাণ করে লেখকরা ইডিএ-এর প্রথম অধ্যায়টিতে একটি দুর্দান্ত আলোচনা করেছেন: ইন্টারেক্টিভ এবং ডায়নামিক ডিসপ্লেগুলির ব্যবহার না হয় ডেটা স্নোপিং বা প্রাথমিক তথ্য নয় পরিদর্শন (উদাহরণস্বরূপ, ডেটা বিশুদ্ধভাবে গ্রাফিকাল সংক্ষিপ্তসার), তবে এটি কেবল তথ্যের একটি ইন্টারেক্টিভ তদন্ত হিসাবে দেখা যায় যা খাঁটি অনুমান-ভিত্তিক পরিসংখ্যানের মডেলিংয়ের আগে বা পরিপূরক হতে পারে।

একসাথে GGobi ব্যবহার তার আর ইন্টারফেস ( rggobi ) এ ছাড়া, কিভাবে অন্তর্বর্তী প্রতিবেদন বা চূড়ান্ত প্রকাশনার জন্য স্ট্যাটিক গ্রাফিক্স জেনারেট করতে সমস্যা solves এমনকি অভিক্ষেপণ সাধনা (পৃ। 26-34), ধন্যবাদ DescribeDisplay বা ggplot2 প্যাকেজ।

একই লাইনে, মাইকেল ফ্রেন্ডলি দীর্ঘদিন ধরে শ্রেণিবদ্ধ ডেটা অ্যানালাইসিসে ডেটা ভিজ্যুয়ালাইজেশন ব্যবহারের পক্ষে সমর্থন জানিয়েছিলেন, যা ভিসিডি প্যাকেজটিতে বেশিরভাগ ক্ষেত্রে অনুকরণ করা হয়েছে, তবে আরও সাম্প্রতিক ভিসিডিেক্সট্রা প্যাকেজে (গতিশীল যেমন, আরজিএল প্যাকেজটির মাধ্যমে )ও রয়েছে, যা এর মধ্যে একটি আঠালো হিসাবে কাজ করে ভিসিডি এবং gnm লগ-রৈখিক মডেল ব্যাপ্ত জন্য প্যাকেজ। তিনি সম্প্রতি সময় যে কাজ একটি চমৎকার সারসংক্ষেপ দিলেন 6 ষ্ঠ Carme সম্মেলন, ভিজুয়ালাইজিং শ্রেণীগত ডেটা উন্নতির দ ভিসিডি, gnm এবং vcdExtra প্যাকেজগুলি ব্যবহার

সুতরাং, ইডিএ কোনও বিশুদ্ধ পরিসংখ্যানের মডেলিংয়ের আগে বা এর সমান্তরালে , কোনও তথ্যের ভিজ্যুয়াল ব্যাখ্যা প্রদান করার জন্য বিবেচনা করা যেতে পারে (এটি পর্যবেক্ষণ করা ডেটাতে অপ্রত্যাশিত নিদর্শনগুলির জন্য বিবেচিত হতে পারে) । এটি হ'ল, ইডিএ কেবলমাত্র উপাত্তের অভ্যন্তরীণ কাঠামো অধ্যয়নের জন্য দরকারী উপায় সরবরাহ করে না, তবে এটি প্রয়োগ করা পরিসংখ্যানগুলির মডেলগুলি পরিমার্জন এবং / বা সংক্ষিপ্ত করতেও সহায়তা করতে পারে। উদাহরণস্বরূপ, বাইপলটগুলি যা করতে দেয় তা মূলত এটি । যদিও সেগুলি প্রতি সেচ বহুমাত্রিক বিশ্লেষণ কৌশল নয় , তারা বহুমাত্রিক বিশ্লেষণ থেকে ফলাফল দেখার জন্য সরঞ্জাম (একটি আনুমানিক সংকেত দিয়েসমস্ত ব্যক্তিকে একসাথে বিবেচনা করার সময় বা সমস্ত ভেরিয়েবল একসাথে বা উভয় বিবেচনার ক্ষেত্রেই সম্পর্কের বিষয়ে। ফ্যাক্টর স্কোরগুলি পরবর্তী মেট্রিকের পরিবর্তে পরবর্তী মডেলিংয়ে ডাইমেনশিয়ালটি হ্রাস করতে বা প্রতিনিধির মধ্যবর্তী স্তর সরবরাহ করতে ব্যবহৃত হতে পারে।

সাইড নোট

পুরানো ফ্যাশন হওয়ার ঝুঁকিতে, আমি এখনও সময়ে সময়ে xlispstat( লুক টায়ার্নি ) ব্যবহার করছি । এটি ইন্টারেক্টিভ ডিসপ্লেগুলির জন্য সহজ তবে কার্যকর কার্যকারিতা রয়েছে, বর্তমানে বেস আর গ্রাফিকগুলিতে উপলব্ধ নেই। আমি Clojure + Incanter (+ প্রসেসিং) এর অনুরূপ ক্ষমতা সম্পর্কে অবগত নই।


8

গ্রাফিক্সের গতিশীল সংযোগ অনুসন্ধানের স্থানিক ডেটা বিশ্লেষণ , বা ইএসডিএর জন্য প্রাকৃতিক এবং কার্যকর । ইএসডিএ সিস্টেমগুলি সাধারণত এক বা একাধিক পরিমাণগত মানচিত্রের (যেমন চোরোপ্লেথ ম্যাপস ) টেবুলার ভিউ এবং অন্তর্নিহিত তথ্যের পরিসংখ্যানগত গ্রাফিক্সের সাথে লিঙ্ক করে। এই জাতীয় কিছু দক্ষতা প্রায় 15 বছর ধরে কয়েকটি ডেস্কটপ জিআইএস সিস্টেমগুলির একটি অংশ হয়ে রয়েছে, বিশেষত আর্কভিউ 3 (একটি বিচ্ছিন্ন বাণিজ্যিক পণ্য)। বিনামূল্যে জিওডা সফ্টওয়্যার স্থানিক তথ্য অনুসন্ধান এবং পরিসংখ্যান বিশ্লেষণের জন্য ডিজাইন করা একটি পরিবেশের মধ্যে এই কয়েকটি দক্ষতার সরবরাহ করে। এটি একটি আড্ডা, একটি আইডিসিঙ্ক্র্যাটিক ইন্টারফেস এবং অপরিশোধিত গ্রাফিক্স সহ, তবে মোটামুটি বাগ বিনামূল্যে।

ইডিএর এই ব্যবহারটি এই আপত্তিটিকে আটকায় যে পরিসংখ্যান সংক্রান্ত পরীক্ষা-নিরীক্ষার চেয়ে পরিসংখ্যানগত পরীক্ষা আরও ভাল হতে পারে কারণ অনেক (সর্বাধিক?) পরিস্থিতিতে স্পষ্ট পরিসংখ্যানের মডেল নেই, কোনও সুস্পষ্ট (বা এমনকি উপযুক্ত) পরিসংখ্যান পরীক্ষাও নেই, এবং হাইপোথিসিস টেস্টিং প্রায়শই অপ্রাসঙ্গিক: লোকেরা কী ঘটে তা দেখতে হবে , এটি কোথায় ঘটে এবং স্থানিক প্রসঙ্গে ভেরিয়েবলের মধ্যে পরিসংখ্যানগত সম্পর্কগুলি পর্যবেক্ষণ করতে হবে সমস্ত ডেটা বিশ্লেষণ আনুষ্ঠানিক প্রক্রিয়া নয়, এমনকি হওয়া উচিত!


হ্যালো হুইবার আপনার ইএসডিএর উদাহরণ একটি দুর্দান্ত উদাহরণ, আপনাকে ধন্যবাদ! আপনি (বা অন্যরা) যখন আনুষ্ঠানিক পদ্ধতিগুলি কম প্রাসঙ্গিক হয় তার অন্যান্য উদাহরণগুলির পরামর্শ দিতে পারেন - এটি সবচেয়ে সহায়ক হবে।
তাল গালিলি

7

আমার কাছে ইন্টারেক্টিভ ভিজুয়ালাইজেশনটি কেবলমাত্র আমার নিজের অনুসন্ধানের জন্য বা খুব হ্যান্ড-অন ক্লায়েন্টের সাথে কাজ করার জন্য দরকারী। চূড়ান্ত উপস্থাপনা নিয়ে কাজ করার সময়, আমি স্থির গ্রাফটি বেছে নিতে পছন্দ করি যা আমার বক্তব্যকে সর্বোত্তম করে তোলে। অন্যথায় ক্লায়েন্টরা জি-হুইজ ফ্যাক্টর দ্বারা সম্পূর্ণরূপে বিভ্রান্ত হতে পারে।

আমি এটি থেকে সবচেয়ে বড় সুবিধাটি হ'ল গতির একটি স্তর যা যদি আমি কোনও সমাধানের প্রোগ্রাম বন্ধ করে রাখি তবে আমার চেয়ে অনেক বেশি পরীক্ষা করতে আমাকে মুক্তি দেয়। জেএমপি এটির জন্য আমার পছন্দের একটি সরঞ্জাম যেহেতু এটি আমার একক ইন্টারফেসে যা চায় তার অনেকটাই সংহত করে। আমি মনে করি বেশিরভাগ লোকেরা যারা ভাল স্ট্যাটিস্টিকাল প্রোগ্রামার হন তারা খুব ভাল সময়ের জন্য খুব কম সময়ের জন্য জেএমপি (বা জিজিবি, ইত্যাদি) এর মতো কিছু চেষ্টা করে। জেএমপি বিশেষত আপনাকে মেনুগুলি সন্ধানের দ্বারা এটি জেনে যাওয়ার অনুভূতি দেবে। যাইহোক, ম্যানুয়ালটির মাধ্যমে কাজ করা এর সমস্ত শক্তি উন্মোচনের জন্য সত্যই প্রয়োজন।

আপনি যদিও এই স্তরের গতি সম্পর্কে আমার প্রধান উদ্বেগের কথা উল্লেখ করেছেন: আপনার পি-মানগুলি কী বোঝায় তা সম্পর্কে কোনও ধারণা ছাড়াই আপনি শেষ করেছেন। মাত্র কয়েক মিনিটের মধ্যে আপনি দৃষ্টিগোচর কয়েকশত সম্পর্ক পরীক্ষা করতে পারেন। এরপরে হাইপোথিসিস টেস্টিং করা সম্পূর্ণরূপে বিভ্রান্তিকর, তবে আমি দেখছি লোকেরা সর্বদা তা করে।

জিগোবিতে আমি পছন্দ করি এমন একটি বৈশিষ্ট্য হ'ল এটির অভিক্ষেপ অনুসরণ, যাতে আপনি একটি উচ্চ মাত্রিক স্থানে কী ধরণের প্যাটার্ন সন্ধান করেন তা নির্দিষ্ট করে এবং তারপরে আপনি পিছনে বসে লক্ষ্যটিকে "অনুসরণ" দেখেন। দুর্দান্ত জিনিস!


2
+1 টি। চূড়ান্ত উপস্থাপনা সম্পর্কে মন্তব্য মনে রাখে, একটি উল্লেখযোগ্য পাল্টা নমুনা হিসাবে, হান্স রোজলিংয়ের বিখ্যাত 2006 টিইডি টক ( ted.com/talks/… )। পুনরায়: "আরও অনেক বেশি" পরীক্ষা করার বিষয়টি আমার মনে পড়ছে যে কীভাবে একজন জবানবন্দিতে একজন আইনজীবী আমাকে আমার সাক্ষ্যকে সমর্থনকারী ডেটা পরীক্ষা করে দেখেছিলেন এবং যখন কাজটি ইন্টারেক্টিভভাবে সম্পন্ন হয়েছে তা শিখেছিলেন তখন তার মুখ কীভাবে পড়েছিল এবং অতএব কিছুই মুদ্রিত বা সংরক্ষণ করা হয়নি (যা সে তখন উপমুনা, পরীক্ষা করতে এবং প্ররোচিত করার চেষ্টা করতে পারে)। ;-)
হুবুহু

জেএমপি হ'ল একটি সর্বোত্তম পরিসংখ্যান অ্যাপ্লিকেশন out পরিসংখ্যানবিদদের অবশ্যই এটি কীভাবে ব্যবহার করতে হবে তা শিখতে হবে, যদি কেবল তাদের ক্লায়েন্টকে প্রভাবিত করে। এটি ব্যয়বহুল, তবে সস্তা যদি আপনি কোনও স্কুল / কলেজ / ইউনিয়নে শিক্ষার্থী বা স্টাফ সদস্য হন
নিল ম্যাকগুইগান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.