প্লট তৈরি করার সময় আমি সাধারণত আমার নিজস্ব আইডিসিঙ্ক্রেটিক পছন্দ করি। তবে আমি ভাবছি প্লট তৈরির জন্য যদি কোনও সেরা অনুশীলন থাকে are
দ্রষ্টব্য: এই প্রশ্নের উত্তরে রবের মন্তব্যটি এখানে খুব প্রাসঙ্গিক।
প্লট তৈরি করার সময় আমি সাধারণত আমার নিজস্ব আইডিসিঙ্ক্রেটিক পছন্দ করি। তবে আমি ভাবছি প্লট তৈরির জন্য যদি কোনও সেরা অনুশীলন থাকে are
দ্রষ্টব্য: এই প্রশ্নের উত্তরে রবের মন্তব্যটি এখানে খুব প্রাসঙ্গিক।
উত্তর:
প্লট তৈরি করার সময় টুফতে নীতিগুলি খুব ভাল অনুশীলন are তাঁর বইয়ের সুন্দর প্রমাণও দেখুন
নীতিগুলির মধ্যে রয়েছে:
অনুসন্ধানের শব্দটি হ'ল তথ্য ভিজ্যুয়ালাইজেশন
SO
: stackoverflow.com/questions/6973394/…
আমরা এখানে সারা দিন সর্বোত্তম অনুশীলনগুলি চিহ্নিত করে থাকতে পারি, তবে আপনার উচিত টুফ্টে পড়া শুরু করা। আমার প্রাথমিক সুপারিশ:
সহজবোধ্য রাখো.
প্রায়শই লোকেরা তথ্য সহ তাদের চার্টগুলি লোড করার চেষ্টা করে। তবে আপনার কাছে সত্যিই একটি মূল ধারণা থাকা উচিত যা আপনি বোঝানোর চেষ্টা করছেন এবং যদি কেউ আপনার বার্তাটি সঙ্গে সঙ্গে না পায় তবে আপনি কীভাবে উপস্থাপন করেছেন তা আপনাকে পুনর্বিবেচনা করা উচিত। সুতরাং বার্তাটি পরিষ্কার হওয়া অবধি আপনার চার্টে কাজ শুরু করবেন না। ওসামের রেজারটি এখানেও প্রযোজ্য।
থাম্বের একটি নিয়ম যা আমি সর্বদা অনুসরণ করি না তবে যা উপলক্ষে দরকারী তা হ'ল এই বিষয়টি বিবেচনা করা যে সম্ভবত আপনার প্লটটি তার ভবিষ্যতের কোনও পর্যায়ে হবে
আপনার প্লটগুলি যথেষ্ট পরিমাণে পরিষ্কার করার দরকার রয়েছে যে ভবিষ্যতে যদি তারা সঠিকভাবে পুনরুত্পাদন করা হয় তবে প্লটটি যে তথ্য জানাতে চাইছে তা এখনও সুস্পষ্ট।
স্পষ্ট বার্তা দেওয়ার পাশাপাশি আমি সর্বদা প্লটসম্যানশিপটি মনে রাখার চেষ্টা করি:
এই অধিকারটি বেশিরভাগ ক্ষেত্রে ডিফল্টরূপে করার জন্য আমি আমার প্লটিং সফ্টওয়্যার (ম্যাটপ্ল্লোব, রুট বা রুট 2 ম্যাটপ্লোটিলিব) কনফিগার করেছি। আমি ব্যবহার করার আগে gnuplot
এখানে অতিরিক্ত যত্নের প্রয়োজন ছিল ।
পদার্থবিজ্ঞানের ক্ষেত্রে একটি নিয়ম রয়েছে যে কেবলমাত্র প্লটগুলিতে তাত্ক্ষণিক নজর দেওয়া থেকে পুরো কাগজ / রিপোর্টটি বোধগম্য হওয়া উচিত। সুতরাং আমি মূলত পরামর্শ দেব যে তাদের স্ব-ব্যাখ্যামূলক হওয়া উচিত।
এটি এও বোঝায় যে আপনার শ্রোতাদের অবশ্যই কোনও ধরণের চক্রান্তের সাথে পরিচিত কিনা তা অবশ্যই সর্বদা যাচাই করতে হবে - আমি একবার ধরে ধরে একটি বড় ভুল করেছিলাম যে প্রতিটি বিজ্ঞানী বক্সপ্লটগুলি কী তা জানেন এবং তারপরে এটি ব্যাখ্যা করার জন্য একটি ঘন্টা নষ্ট করেছিলেন।
আমি দেখছি সর্বাধিক সাধারণ ত্রুটিগুলির ভিত্তিতে আমার গাইডলাইনগুলি এখানে রয়েছে (উল্লিখিত সমস্ত ভাল পয়েন্ট ছাড়াও)
আর গ্রাফিক্স লাইব্রেরি, জিজিপ্লট 2 দেখুন। বিস্তারিত ওয়েবপৃষ্ঠাটি হয় http://had.co.nz/ggplot2/ এই প্যাকেজের খুব ভাল ডিফল্ট প্লট, যে Tufte নীতি, ক্লিভল্যান্ড এর নির্দেশাবলী এবং Ihaka রঙ প্যাকেজ অনুসরণ জেনারেট করে।
রঙে ষড়যন্ত্র করা থাকলে, বিবেচনা করুন যে রঙব্লাইন্ড লোকদের একা রঙ দ্বারা উপাদান আলাদা করতে সমস্যা হতে পারে। তাই:
এগুলি দুর্দান্ত পরামর্শ। আমরা http://biostat.mc.vanderbilt.edu/ স্ট্যাটগ্রাফকোর্সে প্রচুর উপাদান একত্রিত করেছি । ফার্মা শিল্প, একাডেমিয়া এবং এফডিএ-তে একাধিক পরিসংখ্যানবিদ এমন একটি সংস্থান তৈরি করছেন যা ক্লিনিকাল ট্রায়ালগুলি এবং সম্পর্কিত গবেষণার জন্য খুব কার্যকর হবে। এক মাসে অনেক নতুন সামগ্রী উন্মোচিত হবে তবে অনেক কিছুই ইতিমধ্যে রয়েছে - http://www.ctspedia.org/do/view/CTSpedia/PageOneStatGraph
আমার ব্যক্তিগত প্রিয় গ্রাফিক্স বইটি উইলিয়াম ক্লেভল্যান্ডের এলিমেটস অফ গ্রাফিং ডেটা ।
সফ্টওয়্যারটির ক্ষেত্রে, আমার মতে আর-এর জিপিপ্লট 2 এবং জাল প্যাকেজগুলিকে পরাজিত করা শক্ত। স্টাটা কিছু দুর্দান্ত গ্রাফিক্সও সমর্থন করে।
আপনি কোথায় আপনার প্লট প্রকাশ করতে চান না তার উপরও এটি নির্ভর করে। জার্নালের জন্য কোনও প্লট করার আগে লেখকদের জন্য গাইডের পরামর্শ নিয়ে আপনি নিজেকে অনেক সমস্যা বাঁচাতে পারবেন।
প্লটগুলি এমন বিন্যাসে সংরক্ষণ করুন যা আপনার তৈরি করার জন্য আপনি যে কোডটি ব্যবহার করেছেন তা সংশোধন করা বা সংরক্ষণ করতে সহজ। সম্ভাবনাগুলি হ'ল আপনার সংশোধন করা দরকার।
ডায়নামাইট প্লট ব্যবহার করবেন না: http://pablomarin-garcia.blogspot.com/2010/02/why-dynamite-plots-are-bad.html , বেহালা প্লট বা অনুরূপ (বক্সপ্লট পরিবার) ব্যবহার করুন
অন্যান্য উত্তরগুলি বিশ্বাসযোগ্য হওয়ার পক্ষে খুব সূত্রযুক্ত, সুতরাং আমাকে আরও সাধারণ উত্তর দেওয়া যাক। আমি এই প্রশ্নের সাথে কিছুক্ষণ লড়াই করেছি। আমি এই প্রক্রিয়া অফার:
আমি কম্বল দাবী সম্পর্কে সন্দেহ করি যেমন "এটি সহজ রাখুন" - এর অর্থ কী? ঠিক আছে, এটি দর্শকদের উপর নির্ভর করে। কিছু শ্রোতারা টুফতে স্টাইল খেয়ে ফেলবেন। তবে কিছু শ্রোতা এখন এবং তারপরে একটু চার্ট জাঙ্কের প্রশংসা করে। কিছু লোক স্ক্রেটারপ্লট দ্বারা বিরক্ত হয়। কিছু লোক রঙিন ব্যাকগ্রাউন্ড পছন্দ করে। আপনি "নান্দনিক" বিশুদ্ধতার সাথে আপোষ করলেও কি তাদের কিছুটা যুক্ত করা এতটা ভুল? এটি আপনার সিদ্ধান্ত নিতে হবে।
আপনার দর্শকদের প্রতিক্রিয়া প্রতিক্রিয়ার একটি গুরুত্বপূর্ণ অংশ হবে, তবে কেবল এটিই নয়। আপনি যদি নিজের উপস্থাপনের আগে এবং পরে তাদের বোঝার জন্য কোনও উপায় খুঁজে পান তবে আপনি যে প্রভাবটি করেছেন তা আপনি বুঝতে শুরু করবেন।
"ডান" উত্তরটি এই ধরণের প্রশ্নের উপর নির্ভর করবে:
আপনি কোন মিডিয়া ব্যবহার করবেন?
আপনি কি স্থির বা ইন্টারেক্টিভ প্লট তৈরি করছেন?
আপনি কি একটি পূর্বনির্ধারিত গল্প (প্রদর্শনী) বলার চেষ্টা করছেন বা পরীক্ষা (এক্সপ্লোরেশন) কে উত্সাহিত করছেন?
আপনি শ্রোতারা তাদের নিজস্ব উপসংহার আঁকতে চান?
আপনার শ্রোতাদের সাথে আপনি কোন ডিগ্রী অনুসরণ করতে চান এবং আপনার গল্পের দ্বারা নিশ্চিত হন?
শ্রোতারা আপনার সন্ধানকে চ্যালেঞ্জ জানাতে আপনি কোন ডিগ্রীতে যেতে চান?
সংক্ষেপে, আপনার বার্তাগুলি, শ্রোতা এবং প্রতিবন্ধকতাগুলি ইচ্ছাকৃতভাবে আপনার সামগ্রীগুলি ডিজাইন করুন।
টুফ্টের উল্লেখ করার মতো একটি জিনিস যা আমি মনে করি তা অন্য উত্তরগুলিতে ম্যাপিং নয় - এটি আপনার গ্রাফের অবস্থান, দিকনির্দেশ, আকার ইত্যাদি তৈরি করে বাস্তবতা উপস্থাপন করে । গ্রাফটিতে যা রয়েছে তা বাস্তব বিশ্বে হওয়া উচিত। কোনটি বড় তা বড় হওয়া উচিত (মনে রাখবেন যে অঞ্চলগুলি অঞ্চলগুলিকে প্রতিনিধিত্ব করবে এবং আয়তনের পরিমাণগুলি Never এটি প্রাসঙ্গিক হলে রঙ, আকার ইত্যাদির ক্ষেত্রেও এটি প্রযোজ্য।
একটি আকর্ষণীয় উদাহরণ হ'ল এখানে "স্কার্ট সিরিজ" গ্রাফ: http://a-little-book-of-r-for-time-series.readthedocs.org/en/latest/src/timeseries.html । প্রযুক্তিগতভাবে এটি সঠিক, এবং একটি "লম্বা" স্কার্টের দৈর্ঘ্য গ্রাফের উপর একটি উচ্চতর অবস্থান দখল করে, এটি আসলে বেশ বিভ্রান্তিকর, কারণ স্কার্টের দৈর্ঘ্য শীর্ষ থেকে শুরু হয় এবং নীচে চলে যায় (মানুষ বা গাছের মতো নয়, যেখানে আমরা উচ্চতাটি পরিমাপ করি স্থল)। স্কার্টের দৈর্ঘ্য বাড়ানো আসলে একটি কম মান উপস্থাপন করে:
skirts <- scan("http://robjhyndman.com/tsdldata/roberts/skirts.dat",skip=5)
skirtsseries <- ts(skirts,start=c(1866))
plot.ts(skirtsseries, ylim=c(max(skirts),min(skirts)))
সর্বদা হিসাবে, অসুবিধা আছে। উদাহরণস্বরূপ, আমরা সাধারণত এগিয়ে যাওয়ার সময় বিবেচনা করি এবং পশ্চিমে কমপক্ষে আমরা বাম থেকে ডান পড়ি, তাই আমাদের সময়-সিরিজের গ্রাফগুলিও সময় বাড়ার সাথে সাথে সাধারণত বাম থেকে ডানে প্রবাহিত হয়। সুতরাং আপনি যদি এমন কিছু উপস্থাপন করতে চান যা সময়ের সাথে সর্বোত্তমভাবে উপস্থাপিত হয় (যেমন কোনও কিছুর পূর্ব-পশ্চিম পরিমাপ)? সেক্ষেত্রে আপনাকে আপস করতে হবে এবং হয় সময়কে উপরের দিকে বা নীচে চিত্রিত করতে হবে (যা আবার সংস্কৃতি ধারণার উপর নির্ভর করে, আমার ধারণা) আপনার গ্রাফিকের উপরের / নীচে আপনার পার্শ্বীয় পরিবর্তনশীল মানচিত্রটি বেছে নিতে হবে।
এটি নির্ভর করে প্লটগুলি কীভাবে আলোচনা হবে on
উদাহরণস্বরূপ, আমি যদি কোনও গ্রুপ মিটিংয়ের জন্য প্লট পাঠাচ্ছি যা বিভিন্ন অবস্থানের কলারদের সাথে করা হবে, তবে আমি এটিকে এক্সেলের বিপরীতে পাওয়ারপয়েন্টে একসাথে রাখাই পছন্দ করি, তাই এটির কাছাকাছি যাওয়া খুব সহজ।
একের পর এক কারিগরি কলের জন্য, আমি এক্সেলে এমন কিছু রাখব যাতে ক্লায়েন্ট কোনও প্লট সরিয়ে রাখতে পারে এবং কাঁচা ডেটা দেখতে পারে। অথবা, আমি পাশের রিগ্রেশন সহগগুলি যেমন কোষগুলিতে পি-মানগুলি প্রবেশ করতে পারি
মনে রাখবেন: প্লটগুলি সস্তা, বিশেষত একটি স্লাইড শো বা কোনও গ্রুপকে ইমেল করার জন্য। আমি বরং 10 টি স্পষ্ট প্লট তৈরি করব যা আমরা 5 টিরও বেশি প্লটের মাধ্যমে ফ্লিপ করতে পারি যেখানে আমি একই গ্রাফটিতে স্বতন্ত্র দল (যেমন "পুরুষ এবং মহিলা") রাখার চেষ্টা করি try
আমি যুক্ত করব যে প্লটের পছন্দটি ডেটা বিশ্লেষণের জন্য ব্যবহৃত পরিসংখ্যানগত পরীক্ষার ধরণের প্রতিফলিত করে। অন্য কথায়, বিশ্লেষণের জন্য যে কোনও উপাত্তের বৈশিষ্ট্য ব্যবহৃত হয়েছিল তা দৃষ্টিভঙ্গিভাবে দেখানো উচিত - সুতরাং আপনি যদি টি-টেস্ট ব্যবহার করেন তবে আপনি যদি মান-হুইটনি পরীক্ষা ব্যবহার করেন তবে বক্সপ্লটগুলি যদি উপায় এবং মান ত্রুটিগুলি দেখান।