তাপের মানচিত্রগুলি কি "ডেটা ভিজ্যুয়ালাইজেশনের অন্যতম কার্যকর কার্যকারিতা"?


22

প্রশ্ন: কখন (কী ধরণের ডেটা ভিজুয়ালাইজেশন সমস্যার জন্য) তাপের মানচিত্রগুলি সবচেয়ে কার্যকর? (বিশেষত, অন্যান্য সমস্ত সম্ভাব্য চাক্ষুষ প্রযুক্তির চেয়ে কার্যকর?)

তাপের মানচিত্র কখন কার্যকর হয়?

থাম্বের কোনও সাধারণ প্যাটার্ন বা নিয়মগুলি কী তা ব্যবহার করতে পারেন যে তাপের মানচিত্রটি ডেটা দেখার জন্য কার্যকর উপায় হতে পারে এবং কখন সেগুলি অকার্যকর হওয়ার সম্ভাবনা রয়েছে?

(মূলত আমার 2 টি স্পষ্টতাল ভেরিয়েবল এবং 1 ক্রমাগত ভেরিয়েবলের জন্য উত্তাপের মানচিত্র রয়েছে, তবে অন্যান্য ধরণের তাপের মানচিত্রের বিষয়ে মতামত শুনে আমি আগ্রহী))

প্রসঙ্গ: আমি ডেটা ভিজ্যুয়ালাইজেশন সম্পর্কে একটি অনলাইন কোর্স নিচ্ছি এবং এখনই তারা অকার্যকর এবং অতিরিক্ত ব্যবহৃত প্লটের ধরণের বিষয়ে আলোচনা করছে। তারা ইতিমধ্যে ডিনামাইট প্লট এবং পাই চার্ট উল্লেখ করেছে এবং কেন সেগুলি অকার্যকর এবং কেন তাদের আরও ভাল বিকল্প রয়েছে তার কারণগুলি আমার কাছে স্পষ্ট এবং বিশ্বাসযোগ্য ছিল। তদুপরি, অন্যান্য উত্সগুলি ডায়নামাইট প্লট এবং পাই চার্ট সম্পর্কে প্রদত্ত মতামতকে সংযুক্ত করে খুঁজে পাওয়া সহজ ছিল।

তবে কোর্সটি আরও বলেছে যে "তাপের মানচিত্রগুলি হ'ল ডেটা ভিজ্যুয়ালাইজেশনের অন্যতম কার্যকর কার্যকারিতা"। নীচে কেন দেওয়া হচ্ছে তার একটি প্যারাফ্রেসিং। তবে যখন আমি গুগলে এই ভিউটি সংশোধন করার জন্য অন্যান্য স্থানগুলি সন্ধান করার চেষ্টা করেছি তখন পাই চার্ট এবং ডায়নামাইট প্লটের কার্যকারিতা সম্পর্কে মতামত সন্ধান করার বিপরীতে আমার অনেক অসুবিধা হয়েছিল। সুতরাং আমি জানতে চাই যে কোর্সে প্রদত্ত তাপের মানচিত্রের বৈশিষ্ট্যটি কতটা বৈধ, এবং যখন তাদের বিপরীতে কারণগুলি কোনও নির্দিষ্ট প্রেক্ষাপটের জন্য কমপক্ষে গুরুত্বপূর্ণ এবং সর্বাধিক গুরুত্বপূর্ণ।

প্রদত্ত কারণগুলি হ'ল:

  1. অবিচ্ছিন্ন স্কেলে রঙ ম্যাপ করা কঠিন।

    এই নিয়মের কিছু ব্যতিক্রম রয়েছে, সুতরাং এটি সাধারণত ডিল ব্রেকার নয়, তবে তাপের মানচিত্রের ক্ষেত্রে সমস্যাটি বিশেষত কঠিন, কারণ আমাদের রঙের উপলব্ধি প্রতিবেশী রঙগুলির উপর নির্ভর করে পরিবর্তিত হয়। সুতরাং তাপের মানচিত্রগুলি স্বতন্ত্র ফলাফলগুলি দেখার জন্য উপযুক্ত নয়, এমনকি ছোট ডেটা সেটগুলিতেও। যা বাড়ে:

  2. একটি সারণী বর্ণন পদ্ধতি ব্যবহার করে নির্দিষ্ট প্রশ্নের উত্তর দেওয়া সাধারণত সম্ভব হয় না, যেহেতু প্রদত্ত রঙের সাথে সংখ্যক মানটি পর্যাপ্ত নির্ভুলতার সাথে অনুমান করা অসম্ভব।

  3. প্রবণতাগুলি প্রকাশের জন্য প্রায়শই ডেটাগুলি এমনভাবে ক্লাস্টার করা হয় না।

    এ জাতীয় ক্লাস্টারিং ব্যতীত সাধারণ সামগ্রিক নিদর্শন সম্পর্কে কোনও কিছু অনুমান করা প্রায়শই কঠিন বা অসম্ভব।

  4. উত্তাপের মানচিত্রগুলি প্রায়শই কেবল "বাহ ফ্যাক্টর" যোগাযোগের জন্য বা কেবল শীতল দেখতে ব্যবহার করা হয়, বিশেষত মাল্টিকালার গ্রেডিয়েন্ট ব্যবহার করার সময়, তবে সাধারণত ডেটা যোগাযোগের আরও ভাল উপায় থাকে।

একটি সাধারণ স্কেলে অবিচ্ছিন্ন ডেটা প্লট করা সর্বদা সেরা বিকল্প। যদি কোনও সময় উপাদান থাকে তবে সর্বাধিক সুস্পষ্ট পছন্দ হ'ল লাইন প্লট।


15
"হিট ম্যাপস" এর সমালোচনা (4) এর শেষ লাইনে নেমে আসে: যোগাযোগের এই "আরও ভাল উপায়" ঠিক কী? (যদি এর চেয়ে ভাল উপায় না থাকে তবে (1) - (3) খুব কমই প্রাসঙ্গিক।) যদি উদ্দেশ্যটি আক্ষরিক অর্থে ডেটা যোগাযোগ করা হয় , তবে অবশ্যই আরও ভাল উপায় আছে: সংখ্যাগুলি লিখুন write ভিজ্যুয়ালাইজেশনের উদ্দেশ্য যদিও তথ্যটি খুব কমই প্রকাশ করা হয়: পরিবর্তে এটি কোনও ব্যাখ্যাকে সমর্থন করা বা একটি বার্তা প্রেরণা। আপনার উত্সটি কোন ব্যাখ্যার মনে রাখে এবং কী দাবি করে যে এই ব্যাখ্যাগুলি উপস্থাপনের সর্বোত্তম উপায়?
whuber

4
@ হুইবার তার পরিপূরক হিসাবে - তাপের মানচিত্র সম্পর্কে একটি খুব সুন্দর বিষয় হ'ল বেশিরভাগ ক্ষেত্রে প্রতিটি টাইলের উপর সরাসরি কাঁচা তথ্য (সম্ভবত উপযুক্ত গোলাকার) প্রদর্শন করে তাদের পরিপূরক করা সহজ। এমনকি স্প্রেডশিটে সেলগুলির পটভূমির রঙের জন্য শর্তসাপেক্ষ বিন্যাস ব্যবহার করা খুব কার্যকর, এবং খুব সাধারণ, "হিট ম্যাপ" প্রকারের, যার পরিপ্রেক্ষিতে এগুলি কীভাবে উন্নত করা যায় তা দেখা শক্ত।
সিলভারফিশ 21

2
আমার মন্তব্যটি কেবল সমালোচনার সাথে সম্পর্কিত It এটি সঠিক যে রঙ শারীরিকভাবে (তরঙ্গ দৈর্ঘ্য) করলেও মনস্তাত্ত্বিকভাবে কোনও অর্ডার করা স্কেলটিতে রঙ (হিউ) মানচিত্র দেয় না। তবে উজ্জ্বলতার মতো অপ্রয়োজনীয় মাত্রা যুক্ত করে এগুলিকে আরও সহজে ব্যাখ্যা করা যায়। আপনার আলোর চেয়ে গা dark় উচ্চতর হতে পারে তবে হালকা নীল এবং গা red় লাল রঙের মতো রঙ ব্যবহার করুন।
ডেভিড লেন

2
প্রসঙ্গে নির্ভর করে। তাপের মানচিত্র থেকে প্রাপ্ত মূল্যবান, কর্মক্ষম তথ্যের একটি দুর্দান্ত উদাহরণ এখানে রয়েছে , যার জন্য আমি আর কোনও সুবিধাজনক বা দরকারী ডেটা ভিজ্যুয়ালাইজেশন ধরণের কথা ভাবতে পারি না।
জেসন সি

5
রঙটি অতিরিক্ত অতিরিক্ত (এবং স্বীকারোক্তিযুক্ত, খারাপভাবে বেছে নেওয়া হয়েছে - এটি কেবলমাত্র আর ডিফল্ট চিত্রের রঙিন্যাপ) তবে এখানে বেশ কয়েক বছর আগে আমি কাজ করেছি মাইনসুইপার খেলার একটি উদাহরণ । আমি হটম্যাপটি তাত্ক্ষণিকভাবে আলোকিত করে দেখতে পেলাম যে এটি সমস্যাটি সম্পর্কে কাঠামোটি প্রকাশ করে যা স্বজ্ঞাতভাবে পরিষ্কার হয়ে গেলে আপনি একবার তা দেখে একবারের জন্য এটির জন্য চিন্তা করেন তবে প্লটটি দেখার আগে যা তাত্ক্ষণিকভাবে স্পষ্ট হয় না (বেশিরভাগ লোকের কাছে)।
কার্ডিনাল

উত্তর:


15

এর জন্য বা এটির জন্য "সেরা" প্লট বলে কোনও জিনিস নেই। আপনি কীভাবে আপনার ডেটা প্লট করছেন তা নির্ভর করে আপনি যে বার্তাটি দিতে চান তার উপর। সাধারণত ব্যবহৃত প্লটগুলির সুবিধা রয়েছে যে ব্যবহারকারীরা সেগুলি পড়তে সক্ষম হওয়ার সম্ভাবনা বেশি। তবুও, এর অর্থ এই নয় যে তারা অগত্যা সেরা পছন্দ।

তাপের মানচিত্রের বিষয়ে, আমি তাদের বিরুদ্ধে অনুমান করা যুক্তি দিয়ে আমার প্রতিক্রিয়াটির আদেশ দিয়েছি।

বিজ্ঞাপন 1) আপনি যদি কোনও এনকোডিং চ্যানেল হিসাবে রঙকে বিশ্বাস করেন না, তার পরিবর্তে উজ্জ্বলতা ব্যবহার করুন, গা dark় ধূসর থেকে হালকা ধূসর "বর্ণ" টোন সমেত একটি স্কেল। বেশিরভাগ ক্ষেত্রে, আপনি অবিচ্ছিন্ন পরিবর্তনশীলগুলি বিনিন করতে চান (এছাড়াও দেখুন 5), যাতে আপনি রঙের সংখ্যা কম রাখতে এবং ব্যবহারকারীদের দ্বারা ডিকোড করা সহজ করতে পারেন। যদিও এটি আবশ্যক নয়। এই উদাহরণটি একবার দেখুন , যাতে ক্রমাগত পরিবর্তনশীল বিন্যস্ত হয় না।

বিজ্ঞাপন 2) অবশ্যই, সুনির্দিষ্ট মানগুলি দেখার জন্য তাদের বিকল্প হিসাবে ব্যবহার করা উচিত নয়। তাপের মানচিত্রগুলি প্রাথমিকভাবে প্যাটার্নগুলি চিত্রিত করতে ব্যবহার করা উচিত, টেবিলগুলি প্রতিস্থাপনের জন্য নয়।

বিজ্ঞাপন 3 + 4) আমি কীভাবে এটি তাপের মানচিত্রের সাথে সম্পর্কিত হবে তা দেখছি না।

বিজ্ঞাপন 5) উত্তাপের মানচিত্র আদর্শভাবে তবে পৃথকভাবে ভেরিয়েবলের সাথে ব্যবহার করা হয় না। অবিচ্ছিন্ন ভেরিয়েবলের জন্য, তাপের মানচিত্রগুলি যথাযত বেনিংয়ের পাশাপাশি একটি এনকোডিং চ্যানেলের মতো উজ্জ্বলতার পাশাপাশি দ্বি-মাত্রিক হিস্টোগ্রাম বা বার চার্ট হিসাবে ব্যবহার করা যেতে পারে।


2
দুর্দান্ত উত্তর! "অ্যাড" এর অর্থ কী তা আমি জানি না। ল্যাটিন? সমাহার?
xan

1
ধন্যবাদ! "বিজ্ঞাপন" এর অর্থ "চালু" বা "সম্পর্কিত", আমার ধারণা এটি ল্যাটিন থেকে এসেছে।
g3o2

আমি "বিজ্ঞাপন" এর আগে কখনও ব্যবহার করেনি (সিসি, @ এক্সান)। আপনার বিবরণ থেকে, আমি মনে করি আমি গতি ব্যবহার করতে পারি ।
গুং - মনিকা পুনরায়

1
আপনার উজ্জ্বলতা ভিত্তিক তাপের মানচিত্র গামা-সংশোধন করতেও মনে রাখবেন।
ব্যবহারকারী 253751

3
আইএমও গতির তুলনায় এর কোনও অর্থ নেই - এটির পরিবর্তে সংযোজন, কেবলমাত্র উল্লেখ করা যায় না ... এটি পশ্চিমে সর্বজনীন ছিল, লাতিন থেকে এসেছিল এবং ধর্মতত্ত্ব এবং বৈজ্ঞানিক ও রাজনৈতিক সাহিত্যে ব্যাপকভাবে ব্যবহৃত হয়েছিল, এর মধ্যে অন্য জিনিস. একটি (মেল) কথোপকথনে, দুটি পক্ষই এটি প্রতিটি পয়েন্টের যুক্তিগুলিকে রেফারেন্স করতে ব্যবহার করবে। লিখিত ভাষা ছাঁটাই হওয়ার সাথে সাথে এটি বিতর্কিত হয়ে পড়েছে বলে মনে হচ্ছে। সাধারণ প্রতিস্থাপনটি কেবল "বিজ্ঞাপন 1.1" এর পরিবর্তে "1.1" ব্যবহার করছে যা কিছুটা বিভ্রান্তিকর হতে পারে এবং আমার কাছে কিছুটা অভদ্র বলে মনে হয় তবে ওহ ভাল well
লুয়ান

5

কেউ বলতে পারেন না যে হিট ম্যাপটি ভিজ্যুয়ালাইজের সবচেয়ে কম কার্যকর ধরণের। আমি বরং এটি বলতে চাই এটি আপনার প্রয়োজনের উপর নির্ভর করে। কিছু ক্ষেত্রে তাপের মানচিত্র খুব কার্যকর। ধরা যাক আপনাকে একটি দেশের রাষ্ট্র-ভিত্তিতে (বা শহর-ভিত্তিক) অপরাধ সম্পর্কিত একটি প্রতিবেদন তৈরি করতে হবে। এখানে আপনার একটি বিশাল ডেটা সেট থাকবে যা সময়ের নির্ভরতা থাকতে পারে।

একইভাবে, যাক আপনাকে শহরগুলির জন্য বিদ্যুৎ খরচ নিয়ে একটি প্রতিবেদন তৈরি করতে হবে। এই ক্ষেত্রে আপনি তাপের মানচিত্রের মাধ্যমে সহজেই কল্পনা করতে পারবেন। এটি আরও বুদ্ধিমান এবং কম জটিল হবে।

সুতরাং, সংক্ষেপে, যদি আপনার কাছে প্রচুর ধারাবাহিক ডেটা থাকে এবং আপনি এমন একটি প্রতিবেদন তৈরি করতে চান যা উত্তরগুলি দ্রুত পিন-পয়েন্ট করতে পারে তবে তাপ মানচিত্রটি সেরা।


2
শক্তি ব্যবহারের জন্য প্রায়শই হিটম্যাপের চেয়ে ভাল প্লট আর হয় না: argustech.be/wp-content/uploads/2012/04/heatmap.png সপ্তাহ শেষে এবং কাজের সময় দর্শকের ডানদিকে লাফ দেয়। আপনি বেস লোড দেখতে পারেন, আপনি শিখর দেখতে পারেন, কখন তা ঘটবে তা আপনি দেখতে পাবেন। আপনি কয়েক সেকেন্ডের মধ্যে কোনও অদ্ভুত প্যাটার্ন সনাক্ত করতে পারেন, উদাহরণস্বরূপ যদি কিছু বৈদ্যুতিক ডিভাইস সর্বদা চালু থাকে বা খুব তাড়াতাড়ি বা খুব দেরিতে শুরু হয়।
এরিক ডুমিনিল

4

মূল প্রশ্নের 1 টি সমালোচনা বৃহত্তম ত্রুটিটি কভার করে - যে কেউ উত্তাপের মানচিত্রটি পড়ছেন তাদের যে পরিমাণগত তথ্য পৌঁছেছেন তা ডিকোড করা কঠিন। এক্স-স্কেটার প্লট বা ডট প্লট বিবেচনা করুন, যেখানে অন্তর্নিহিত পরিমাণটি চার্টের দূরত্বের সাথে সরাসরি সম্পর্কিত - ব্যাখ্যা করার জন্য খুব সোজা।

অন্যদিকে উত্তাপের মানচিত্রে, চার্টটি পড়া ব্যক্তিটি নিজের সন্তুষ্টির জন্য 10% 'রেড্ডার' বা 'গাer়' বর্ণনার স্বাধীনতা রয়েছে। তার উপরে হ'ল রঙ এবং ছায়া গোটা থেকে শুরু করার জন্য লোকের পৃথকীকরণের দক্ষতার সমস্যা। এগুলি প্রকৃত অসুবিধাগুলি তবে এগুলি সর্বজনীন মারাত্মক নয়।

তৃতীয় সমালোচনা, বিপরীতে, অযৌক্তিকভাবে এমন একটি অনুষ্ঠান সনাক্ত করে বলে মনে হয় যখন তাপের মানচিত্রগুলি বিশেষত কার্যকর হয় - যখন ডেটা 2 ডি প্লেনে ক্লাস্টার করা হয় যাতে তৃতীয় মাত্রার অনুরূপ মানগুলি নির্দিষ্ট ছায়া বা রঙের প্যাচ হিসাবে প্রদর্শিত হয়। সুতরাং তাপের মানচিত্রগুলি কিছু ক্ষেত্রে অকার্যকর হওয়ার সাথে সাথে সেগুলি অন্যের পক্ষে কার্যকর এবং এগুলি আপনার ব্যাগেই রাখা উচিত, গল্ফাররা প্রায়শই পিচিং ওয়েজগুলি বহন করে বা গাড়ি চালানো বা রাখার জন্য অকেজো হওয়া সত্ত্বেও, বা চালকরা না করে হাতুড়ি উপেক্ষা করুন কারণ তারা কাঠ কাটার পক্ষে ভাল নয়।

সাধারণভাবে ভিজ্যুয়ালাইজিং ডেটাটিকে পুনরাবৃত্ত ক্রিয়াকলাপ হিসাবে দেখা উচিত যা আপনি একাধিক ধরণের ভিজ্যুয়ালাইজেশন চেষ্টা করে ডেটের গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি উপস্থাপন করে এবং এরপরে সর্বোত্তম সেটিংস সন্ধানের জন্য পরীক্ষামূলকভাবে চেষ্টা করে যা কিছু সময় নেবে বিশেষ পছন্দ। বা এটিও ধারণা করা উচিত নয় যে ফলাফলটি একটি ভিজ্যুয়ালাইজেশন হবে - কখনও কখনও তথ্যের একাধিক গুরুত্বপূর্ণ বৈশিষ্ট্য হাইলাইট করার জন্য ডেটাগুলির বেশ কয়েকটি ভিজ্যুয়ালাইজেশন প্রয়োজন হয়। এই প্রসঙ্গে, এমন সময় আসবে যখন নির্দিষ্ট ডেটা সেটগুলির নির্দিষ্ট বৈশিষ্ট্যগুলির জন্য, তাপের মানচিত্রটি সবচেয়ে কার্যকর হবে এবং বর্ণিত গোষ্ঠীগুলিতে যোগাযোগ করা সেই সময়ের মধ্যে একটি হতে পারে। সামগ্রিকভাবে, প্রায়শই এমন অনুষ্ঠান হবে যেখানে একক ভিজ্যুয়ালাইজেশন সমস্ত কিছু করতে পারে না এবং একাধিকের প্রয়োজন হবে।


3

অন্যের দ্বারা উল্লিখিত হিসাবে, তাপের মানচিত্র সর্বদা অকার্যকর হয় তা বলা সত্যিই অনুচিত। আসলে, তারা অনেক ক্ষেত্রে বেশ কার্যকর।

উদাহরণস্বরূপ, আপনি যদি 4D ডেটা ভিজ্যুয়ালাইজ করতে চান তবে অনেক প্লট করা সফ্টওয়্যারটিতে প্রথম তিনটি মাত্রা করা যথেষ্ট সহজ। যাইহোক, 4D এর সম্পূর্ণ ধারণাটি একেবারেই ধারণাগতকরণ করা বেশ কঠিন। "চতুর্থ" দিক / মাত্রা কী?

সেই স্থানে তাপের মানচিত্র কার্যকর হতে পারে, কারণ এটি স্থানাঙ্ক অক্ষের উপর প্রথম তিনটি মাত্রা প্লট করার অনুমতি দেয় এবং চতুর্থটি আপনার প্লট করা প্লেনে (বা লাইনে, তবে এটির সম্ভাবনা কম) তাপের মানচিত্র স্ট্যাক করে দৃশ্যমান করা যেতে পারে।

নীচের লাইনটি আপনার প্রসঙ্গের প্রয়োজন। আপনি আপনার ভিজ্যুয়ালাইজেশন মধ্যে কি খুঁজছেন? এছাড়াও, একজন সহ-শিক্ষক হিসাবে আমি আপনাকে বলতে পারি যে এই অনলাইন কোর্সগুলি খুব তুচ্ছ এবং অপ্রয়োজনীয় হতে থাকে। আপনি যখন পুরো বিষয় সম্পর্কে শেখানোর চেয়ে সুনির্দিষ্ট বিষয়ে তথ্য / সাহায্যের সন্ধান করছেন তখনই এগুলি ব্যবহার করা থেকে আপনি অনেক ভাল।

যাইহোক শুভকামনা।


3

প্রকৃতির দ্বারা, একটি তাপের মানচিত্র দুটি অবিচ্ছিন্ন স্বতন্ত্র ভেরিয়েবলগুলি (বা, বেশিরভাগ সমতুল্য নয়, একটি দ্বিমাত্রিক ভেক্টর স্থান থেকে একটি স্বতন্ত্র ভেরিয়েবল) এবং একটি অবিচ্ছিন্ন নির্ভরশীল পরিবর্তনশীল সহ ডেটা প্রদর্শন করে । এই ধরণের ডেটার জন্য, তাপের মানচিত্র অবশ্যই ডেটা ভিজুয়ালাইজেশনের অন্যতম কার্যকর ধরণের। হ্যাঁ, এটির সমস্যাগুলি রয়েছে তবে এটি অনিবার্য really আপনার সাথে কাজ করার জন্য কেবলমাত্র দুটি মাত্রা রয়েছে এবং কাঠামো সংরক্ষণকারী উপায়ে একটি ত্রি-মাত্রিক স্থান ম্যাপ করা যায় না , সুতরাং আপনার রঙের সাথে একটি মাত্রা ম্যাপিংয়ের মতো হ্যাকের প্রয়োজন or কনট্যুর লাইনগুলি অঙ্কন ইত্যাদি etc

আর2এক্স×ওয়াই|এক্স||ওয়াই|, যা একটি শ্রেণিবদ্ধ ভেরিয়েবলের জন্য সীমাবদ্ধ - অন্য কথায়, দুটি শ্রেণীবদ্ধ ভেরিয়েবলের কার্টেসিয়ান পণ্যটিকে একক শ্রেণিবদ্ধ ভেরিয়েবল হিসাবে বিবেচনা করা যেতে পারে ! এবং সেই আলোকে, আপনি ঠিক তেমন অন্যান্য প্লটও ব্যবহার করতে পারেন, যা উত্তাপের মানচিত্রের সমস্যা নেই।

আপনি যদি একটি অবস্থা যেখানে দুই শ্রেণীগত ভেরিয়েবল উপর বলা হিট ম্যাপ দরকারী মনে হচ্ছে নিজেকে খুঁজে পান, তাহলে একটি ইঙ্গিত যে এই সম্ভবত হয় এর না সত্যিই শ্রেণীগত ভেরিয়েবল, বরং quantised একটানা ভেরিয়েবল।


4
এই উত্তরটি আকর্ষণীয়, তবে আমি মনে করি শ্রেণীবদ্ধ ভেরিয়েবলগুলির সাথে হিটম্যাপগুলি ব্যবহার করার ধারণাকে সংক্ষিপ্ত পরিবর্তন দেওয়া। উদাহরণস্বরূপ, কেউ তাদের গণনাগুলি (বা কিছু অন্যান্য প্রাসঙ্গিক বাছাইকরণ ভেরিয়েবল) দ্বারা শ্রেণিবদ্ধ স্তরগুলি র‌্যাঙ্ক করতে পারে এবং তারপরে যৌথ বন্টন বা যৌথ শ্রেণিবদ্ধ স্তরের সাথে পরিবর্তিত কিছু অন্যান্য পরিমাণের দৃশ্যধারণের জন্য হিটম্যাপ ব্যবহার করে। এটি কপুলাস (এবং এর সাধারণ ধারণা) এর সাথে আবদ্ধ হতে পারে । এ জাতীয় দৃশ্যায়নগুলি যখন ভালভাবে সম্পন্ন করা হয় তখন ডেটাগুলিতে আসল কাঠামো প্রকাশ করতে পারে যা অন্যথায় সনাক্ত করা খুব কঠিন। (...)
কার্ডিনাল

(...) এবং, এই জাতীয় দৃষ্টিভঙ্গি ইউক্লিডিয়ান স্পেসে শ্রেণিবদ্ধ স্তরগুলি এম্বেড করার যে কোনও (প্রত্যক্ষ) ধারণার চেয়ে স্বাধীন।
কার্ডিনাল

আমি ভাবছিলাম তখন জিনের এক্সপ্রেশন / মাইক্রোরে ডেটার জন্য তাপের মানচিত্র ব্যবহারের অনুশীলন সম্পর্কে আপনার কোনও মন্তব্য আছে কিনা - এগুলি 2 শ্রেণিবদ্ধের জন্য তাপ মানচিত্র ব্যবহারের ক্ষেত্রে এবং একটি ধ্রুবক ভেরিয়েবলের ক্ষেত্রে মনে হয় যার জন্য শ্রেণিবদ্ধ ভেরিয়েবলগুলি সত্যই হতে পারে না কোয়ান্টাইজড ক্রমাগত ভেরিয়েবল হিসাবে ব্যাখ্যা করা। বা আমি সাধারণভাবে শ্রেণিবদ্ধ ভেরিয়েবলের পারস্পরিক সম্পর্কের জন্য তাপের মানচিত্রগুলি অনুমান করি।
চিল 2ম্যাচট

3

একাধিক ভেরিয়েবলের টাইম সিরিজের দৃষ্টিকোণ থেকে সরল দৃষ্টিভঙ্গি প্রদানের ক্ষেত্রে উত্তাপের মানচিত্রগুলি দুর্দান্ত - ডেটা সময়ের সাথে নিখুঁত পরিবর্তন হতে পারে বা জেড স্কোর বা অন্য উপায়ে ব্যবহার করে বিভিন্ন পরিমাপের অন্তর বা উপগোষ্ঠীর আপেক্ষিক পরিবর্তনের সাথে ভেরিয়েবলগুলি পরীক্ষা করতে পারে standard এটি একটি খুব দর্শনীয়ভাবে লক্ষণীয় দৃষ্টিভঙ্গি সরবরাহ করে যে কোনওটি পারস্পরিক সম্পর্কগুলি স্পট করতে পারে - বা বিপুল পরিমাণ গ্রাফকে বিপরীত করে এবং প্রতিস্থাপন করে। এগুলি সম্ভাব্য মাত্রা হ্রাস- যেমন ফ্যাক্টরিং বা পিসিএ মূল্যায়ন করতে প্রিপ্রোসেসিংয়েও ব্যবহার করা যেতে পারে।

খারাপ-হস্তান্তরশীল ভেরিয়েবল এবং অন্যান্য কারণগুলি স্পট পারস্পরিক সম্পর্কের ক্ষেত্রে এই পদ্ধতির ব্যবহার করার সময় লুকিয়ে থাকতে পারে। লাইন গ্রাফগুলির সাথে একই লুকানো দিকগুলি ঘটে - তবে প্রচুর পরিমাণে ভেরিয়েবল দেওয়া- আমার অভিজ্ঞতা হিট মানচিত্রগুলি এত বেশি তথ্য নিয়ে আসে যে কোনও ব্যবহারকারী হস্তক্ষেপকারী দিকগুলি বা অন্যান্য লুকানো বিষয়গুলি বিবেচনা করে না।

ক্ষেত্রের ডেটা উত্পাদনশীল ক্ষেত্রে 20 বছর ধরে প্রগতিশীল অর্থনীতিবিদ দৃষ্টিকোণ থেকে এটি ডেটা সায়েন্টিস্টের কাছ থেকে এবং সাধারণ জনগণকে এই জাতীয় ডেটা দিয়ে শিক্ষিত করার দায়িত্ব দেওয়া হয়েছে।


1

যখন স্ক্যাটারপ্ল্লটে দেখার জন্য অনেক বেশি ডেটা পয়েন্ট থাকে তখন হিটম্যাপগুলি স্ক্রেটারপ্লটগুলির চেয়ে সুবিধাজনক। এটিকে একটি স্ক্র্যাপপ্লোটে ট্রান্সফুল্যান্ট ডেটা পয়েন্ট ব্যবহার করে প্রশমিত করা যেতে পারে তবে একটি নির্দিষ্ট প্রান্তিকের বাইরে ডেটা সংক্ষিপ্ত করা আরও ভাল হয়।

ইন এই ব্লগে scatterplots হার্ড হচ্ছে ব্যাখ্যা দেওয়া হয় একটি বাধ্যকারী উদাহরণ।

একটি স্ক্র্যাটারপ্লট কেবলমাত্র একটি নির্দিষ্ট প্রান্তিক পর্যন্ত ঘনত্ব উপস্থাপন করতে পারে - "সর্বত্র পয়েন্টগুলি" এর প্রান্তিক ...

প্লটের ঘনত্ব, পয়েন্ট নয়

সমাধানটি বিন্দুগুলির পরিবর্তে বিন্দু বিন্দুর ঘনত্বের পরিকল্পনা করা হয়। এই পদ্ধতিটি আমরা ইতিমধ্যে হিস্টোগ্রাম হিসাবে এক মাত্রায় জানি।

দুটি মাত্রায় এটি করার একাধিক উপায় রয়েছে। স্কয়ার বা হেক্সাগনগুলির মতো বিমানকে সমানভাবে টাইলিংয়ের যে কোনও পদ্ধতি থেকে বিন আকারগুলি নেওয়া যেতে পারে। প্রতিটি টাইলের জন্য, টাইলের অভ্যন্তরে ডেটা পয়েন্টগুলির সংখ্যা গণনা করা হয়। টাইলটি পয়েন্টের সংখ্যা অনুসারে একটি রঙ নির্ধারিত হয়।

2 ডি বিন গণনার হিটম্যাপে ggplot2 ডক্সের অনুরূপ বিবৃতি :

geom_point()ওভারপ্লোটিংয়ের উপস্থিতিতে এটি একটি দরকারী বিকল্প ।

এর ডক্সে geom_point():

Overplotting

একটি স্ক্যাটারপ্লোটের সাথে সবচেয়ে বড় সম্ভাব্য সমস্যাটি হ'ল overplotting: আপনি যখনই কয়েকটি পয়েন্টের বেশি হন তখন পয়েন্টগুলি একে অপরের শীর্ষে প্লট করা যেতে পারে। এটি চক্রান্তের চাক্ষুষ চেহারাটিকে মারাত্মকভাবে বিকৃত করতে পারে। এই সমস্যার কোনও সমাধান নেই, তবে এমন কিছু কৌশল রয়েছে যা সহায়তা করতে পারে। আপনার সাথে অতিরিক্ত তথ্য যোগ করতে পারেন geom_smooth(), geom_quantile()বা geom_density_2d()। আপনার যদি কয়েকটি অনন্য এক্স মান থাকে তবে এটি কার্যকরও geom_boxplot()হতে পারে।

অন্যথা, আপনি প্রতিটি অবস্থানে বিন্দুর সংখ্যা সংক্ষেপ এবং প্রদর্শন যে কোনো না কোনোভাবে করতে পারেন ব্যবহার geom_count(), geom_hex()অথবা geom_density2d()

আরেকটি কৌশল হ'ল পয়েন্টগুলি স্বচ্ছ (যেমন geom_point(alpha = 0.05)) বা খুব ছোট (উদাঃ geom_point(shape = ".")) করা।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.