ছোট ছোট নমুনাগুলি আঁকানো


13

কোনও কাজ শেষ করতে আমার কাছে পৃথক 14 বারের একটি ছোট ডেটা সেট রয়েছে। তবে ডেটা গ্রাফ করার জন্য উপযুক্ত গ্রাফ খুঁজতে আমার অসুবিধা হচ্ছে। যদি নমুনাটি বড় হয় তবে আমি বাক্স প্লট বা হিস্টোগ্রাম ব্যবহার করতাম তবে নমুনা এত ছোট হলে এই ক্ষেত্রে ব্যবহার করা উপযুক্ত কিনা তা আমি নিশ্চিত নই।

আপডেট: সময়গুলি 5.2,3.9,5.6,4.2,3.8,4.1,6.0,5.6,4.4,4.5,4.9,4.5,4.9,4.2


4
লোকেদের বিভিন্ন সমাধান পোস্ট করতে উত্সাহিত করার জন্য একটি দৃ concrete় উদাহরণ হিসাবে আপনি যে সত্যিকারের ডেটা যত্নশীল তা দেখায় এমন কিছুই মারেনি। অগ্রিম আমি ডট বা স্ট্রিপ্লটস এবং বাক্স ওভারলেড সহ কোয়ান্টাইল প্লটগুলি প্রস্তাব করি।
নিক কক্স

উত্তর:


16

আমি মনে করি যে এখানে মূল নীতিটি হ'ল আপনি স্বতন্ত্র মানগুলি প্রদর্শন করতে এবং করতে পারেন। এমনকি বিশদটি স্পষ্টতই আকর্ষণীয় বা দরকারী না হলেও, এটি না দেখানোর কোনও কারণ নেই বা পাঠককে একটি হিস্টগ্রাম ডিকোড করতে বাধ্য করুন (বলতে) যেখানে বারগুলি কেবল একটি বা দুটি মান উপস্থাপন করতে পারে।

আমি এখানে একটি ছোট যৌগিক অফার। উপরের বামটি হ'ল একটি বিন্দু বা স্ট্রিপ প্লট (অন্তত বিশটি অন্যান্য নাম একই ধারণার জন্য ব্যবহৃত হয়েছে) অনুভূমিকভাবে উপস্থাপিত এবং উপরের ডানদিকে একই ধারণা উল্লম্বভাবে উপস্থাপিত। একই মানটির উদাহরণগুলি স্ট্যাকিংয়ের সাথে মিলে যায়।

পার্জেনের অর্থে নীচের অংশে একটি কোয়ান্টাইল-বক্স প্লট, যাতে স্পষ্টভাবে অনুভূমিক স্কেল সংশ্লেষিত সম্ভাবনা (প্লটিং পজিশন, একটি সাধারণ জার্গনে) এবং প্রচলিত মাঝারি এবং কোয়ার্টাইল বক্সটি এমনভাবে আঁকতে পারে যে (নীতিগতভাবে) অর্ধেক মানগুলি বাক্সের অভ্যন্তরে থাকে, বরাবরের মতো বিজ্ঞাপন দেওয়া হয় এবং বাইরে মানের অর্ধেক থাকে। এখানে অতিরিক্ত অনুভূমিক রেখাটি গড়কে উপস্থাপন করে। কিছু লোক অতিরিক্ত প্লট বা চিহ্নিতকারী প্রতীক হিসাবে বাক্স প্লটগুলিতে অর্থ যোগ করে; আমি দেখতে পাচ্ছি যে এটি ডেটা দেখানোর সাথে সংঘবদ্ধ হতে পারে এবং আমি একটি অতিরিক্ত লাইন পছন্দ করি। যদি মধ্যমাধ্যমের জন্য লাইন এবং গড়টির জন্য রেখাটি মিলে যায় তবে আপনাকে কী করা উচিত তা ভাবতে হবে। প্রায় সর্বদা গড় এবং মাঝারিগুলি পৃথক পৃথক পৃথক।

যুক্তিযুক্তভাবে গ্রাফটিতে পরিমাপের ইউনিটগুলি সুস্পষ্ট করা মানসম্পন্ন, তবে সেগুলি কী তা আমি দেখতে পাচ্ছি না।

এখানে চিত্র বর্ণনা লিখুন

(আমি ইচ্ছাকৃতভাবে এখানে একটি অতিরিক্ত পয়েন্ট ধাক্কা দিয়েছি, এটি হ'ল গ্রাফগুলি খুব ছোট তবে তথ্যবহুল হতে পারে practice

সম্পাদনা করুন:

পার্জন-অর্থে বিস্তৃতভাবে কোয়ান্টাইল-বক্স প্লটে যোগ করা ক্রস-রেফারেন্সগুলি (নীচে দ্বিতীয়টি আরও উল্লেখ; "কোয়ান্টাইল-বক্স প্লট" এর অন্যান্য ব্যবহার বিদ্যমান)

আমি অনেক শূন্যের সাথে পরামিতিবিহীন ডেটার মধ্যে পার্থক্য কীভাবে পরিমাপ করতে পারি?

যেখানে বিভিন্ন শর্ত থেকে মানগুলি আসার সম্ভাবনা রয়েছে সেই পয়েন্টটি খুঁজতে বক্সপ্লটগুলি কীভাবে ব্যবহার করবেন?

কীভাবে স্বাধীন দুটি নমুনা টি-পরীক্ষা ভিজ্যুয়ালাইজ করবেন?

মান-হুইটনি ইউ টেস্ট ব্যবহার করে কোন পরীক্ষাটি আরও ভাল করছে তা আমি কীভাবে পেতে পারি?

শেরা, ডিএম 1991. তথ্য উপস্থাপনা বৃদ্ধির জন্য কোয়ান্টাইল প্লটের কিছু ব্যবহার। কম্পিউটিং বিজ্ঞান এবং পরিসংখ্যান 23: 50-53।

মিলিটকি, জে। এবং এম। মেলুন। 1993. অবিচ্ছিন্ন অনুসন্ধানের তথ্য বিশ্লেষণের জন্য কিছু গ্রাফিকাল এইডস। বিশ্লেষণ চিমিকা অ্যাক্টা 277: 215-221।

মেলুন, এম এবং জে মিলিটকি 1994. বিশ্লেষণী কেমোমেট্রিক্সে কম্পিউটারের সহায়তায় ডেটা ট্রিটমেন্ট। I. অবিচ্ছিন্ন তথ্যগুলির অনুসন্ধান বিশ্লেষণ। রাসায়নিক কাগজপত্র 48: 151-157।

সম্পাদনা 2:

এই থ্রেডগুলির মূল বিষয়টি কেবল তাত্ক্ষণিক প্রশ্নের উত্তর দেওয়া নয়, অন্যদের আগ্রহী হতে পারে এমন ঘনিষ্ঠ অনুরূপ প্রশ্নগুলিতে স্পর্শ করা।

এখানে অন্যান্য উত্তরের কিছু অন্যান্য গ্রাফ ডিজাইনগুলি শনাক্তকারীদের দেখায়, অন্য বিশদের অভাবে 1 ... 14 লেবেলযুক্ত থাকে n মনে করুন যে এই এবং অন্যান্য সনাক্তকারীদের ব্যাখ্যায় ব্যবহৃত হয়েছিল, তাদের দেখানোর জন্য একটি সাধারণ নকশা হ'ল (ক্লেভল্যান্ড) ডট চার্ট। এখানে কয়েকটি সম্ভাবনার মধ্যে দুটি রয়েছে, যার মধ্যে শনাক্তকারী ক্রমটিকে আক্ষরিক (বাম) সম্মান করা হয় এবং মানগুলি বাছাই করা হয় (ডান)। প্রয়োজনে লম্বা লেবেলের জন্য প্রচুর জায়গা রয়েছে।

বার চার্টের উপর এই নকশার একটি সুবিধা হ'ল প্রতিক্রিয়া বা ফলাফলের অক্ষটি শূন্য নয় এমন মান থেকে শুরু হতে পারে যদি এটি আরও ভাল পছন্দ বলে মনে হয়।

চার্টগুলি ঘোরানো যাতে প্রতিক্রিয়ার অক্ষটি উল্লম্ব হয় তবে সহজেই তা কল্পনাও করা যেতে পারে।

এখানে চিত্র বর্ণনা লিখুন


(+1) আমি মাঝে মাঝে বিন্দু বা স্ট্রিপ প্লটটি দেখেছি, বিশেষত যদি উল্লম্বমুখী হয় তবে "সজ্জিত" পয়েন্টগুলি বাম-প্রান্তিকের চেয়ে কেন্দ্রীয়ভাবে প্রান্তিককরণের (যেমন যদি তিনটি স্তুপীকৃত পয়েন্ট থাকে তবে মাঝেরটিটি তার সাথে সামঞ্জস্য থাকবে) আনস্ট্যাকড পয়েন্ট)। এটি প্রতিসাম্যের একটি লাইন দেয় যা নান্দনিকভাবে আনন্দদায়ক তবে আমি নিশ্চিত না যে এটি ব্যবহারিকভাবে কতটা উপকারী। সম্ভবত এটি কোনও বাক্সকে সুপারিমাইজ করা সহজ করে তোলে। এর কি আলাদা নাম আছে, জানেন? এবং এটি এড়াতে / গ্রহণ করার জন্য কোনও পরামর্শ দেওয়া হয়েছে?
সিলভারফিশ

1
এছাড়াও, পারজেনের জন্য কোনও রেফারেন্স দেওয়ার কোনও সুযোগ আছে কি? আমি এই প্লটগুলি সর্বদা পছন্দ করেছি তবে বাস্তবে কখনও তাদের জন্য উপযুক্ত রেফারেন্স পড়িনি।
সিলভারফিশ

@ সিলভারফিশ কেন্দ্রিক (কেন্দ্রিক) রূপগুলি অবশ্যই জনপ্রিয় এবং প্রায়শই আলোচিত। আপনি যেমন উল্লেখ করেছেন ছোট ছোট বিষয়গুলি প্রতিসাম্যের জন্য আকাঙ্ক্ষা বলে মনে হয়, হিস্টোগ্রামের শৈলীর সাদৃশ্য করার জন্য একটি নকশা বনাম, যা আমি সামান্য পছন্দ করি তবে এটি স্বাদ এবং পরিস্থিতি বিষয়। আমি ক্রস-রেফারেন্স যুক্ত করেছি এবং পরিবর্তে অন্যদের স্বাগত জানাব।
নিক কক্স

3

@ নিক কক্স ইতিমধ্যে কিছু ভাল উদাহরণ দিয়েছে, আমি দুটি ঘন ঘন ঘন ঘন ব্যবহার করি এমন দুটি অপশন হ'ল পয়েন্টগুলি ওভারলেডযুক্ত বা সামান্য বিড়ম্বনাযুক্ত,

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন

আর কোড সহ

times<-c(5.2,3.9,5.6,4.2,3.8,4.1,6.0,5.6,4.4,4.5,4.9,4.5,4.9,4.2)
boxplot(times)
points(rep(1,length(times)),times,cex = 3, pch = 'x')

boxplot(times)
points(jitter(rep(1,length(times)),amount = 0.1),times,cex = 3, pch = 'x')

সম্পাদনা: আপনি যদি চান তবে আপনি একটি বেহালা প্লটও ব্যবহার করতে পারেন

ggplot(data.frame(times), aes(x = rep(0,length(times)), y = times)) + geom_violin() + geom_jitter()

এখানে চিত্র বর্ণনা লিখুন


1
উত্তরের জন্য অনেক ধন্যবাদ। নমুনার আকারের কারণে আমি আমার বিশ্লেষণগুলিতে বক্স প্লটগুলি ব্যবহার করতে নারাজ। তবে বিভিন্ন পাঠ্য বইয়ের পরে দেখে মনে হচ্ছে আমার নমুনা আকারটি যথেষ্ট।
ইমন

1

আপনার প্রশ্ন আমাকে এই ব্লগ পোস্টে বর্ণিত কৌশলটির কথা মনে করিয়ে দিয়েছে । এটি বিচ্ছিন্ন ঘটনাগুলির দৃশ্যধারণ সম্পর্কে।

মূল কৌশলটি the time before an eventএক্স প্লট করা হয় the time after an event

আপনার ডেটা ভিজ্যুয়ালাইজড [1]

এটি যথাযথভাবে হতে পারে তবে শীর্ষ মধ্যম অঞ্চলে কোনও ডেটা নেই। সুতরাং কিছু কাঠামো দৃশ্যমান হয়।


দ্রুত এবং নোংরা Rকোড।

data <- c(5.2,3.9,5.6,4.2,3.8,4.1,6.0,5.6,4.4,4.5,4.9,4.5,4.9,4.2)
x=data[1:12]
y=data[2:13]
plot(x,y, col="white", xlab="Time before an event", ylab="Time after an event"  )
for (i in 1:12) {
    text(x[i],y[i], i)
}

ওপি পৃথক 14 বার বলেছেন। আমি পড়তে যে implying যে এই হিসাবে না একটি সিরিজ। যদি সেগুলি একটি সিরিজ হয় তবে আপনার ধারণা অবশ্যই প্রাসঙ্গিক।
নিক কক্স

তোমার ধারনা সম্ভবত ঠিক. যাইহোক, এমনকি যদি তারা না একটি সিরিজ, গ্রাফ হবে বার মধ্যে নির্ভরতা প্রদর্শন করুন। স্পষ্টত অক্ষের লেবেলগুলি তখন ভুল।
হ্যারাল্ড থমসন

2
কেবল ওপি ডেটা কী তা স্পষ্ট করে বলতে পারে তবে আমি মনে করি না এই গ্রাফটি কোনওভাবেই জিতবে। যদি ডেটা পৃথক সময় হয়, তবে মানগুলি প্রদত্ত ক্রমের কোনও অর্থ না থাকলে গ্রাফটি অর্থহীন।
নিক কক্স

fyi textভেক্টর আর্গুমেন্ট নেয় - text(x, y, 1:12)কাজ করা উচিত।
মাইকেলচিরিকো

1

আর একটি ধারণা, যেহেতু আপনি সময় ব্যবহার করছেন।

একটি রেসট্র্যাক প্লট - মেরু সমন্বয়যুক্ত বারপ্লট - স্টপ ওয়াচের মতো একই প্রভাব দেয়:

ঘোড়দৌড়ের মাঠ

আদর্শভাবে পর্যবেক্ষণ লেবেলগুলি বারে বা কমপক্ষে অন্য প্রান্তে সুপারমোজ করা হবে। এখনই দর্শকের কোনও তুলনা করার সময় কোন পর্যবেক্ষণটি কোনটি (উপরে / নীচে) রয়েছে তা ট্র্যাক করার অতিরিক্ত স্ট্রেন রয়েছে।


2
আমি বিবেচনা করতে হবে যে একটি তুচ্ছ হিসাবে, সত্যিই একেবারে বিকৃত, গ্রাফ কৌশল। চক্ষু এমনকি আর্কের দৈর্ঘ্যও নয়, এমন একটি অঞ্চলকে ডিকোড করার মতো ক্ষেত্রও দেখায়, তবে মস্তিষ্ককে হস্তক্ষেপ করতে হবে এবং আন্ডারলাইন করতে হবে যে কেবল ঘূর্ণন কোণ তথ্যবহুল। এমনকি কোন মানগুলি একে অপরের চেয়ে কম, সমান বা বৃহত্তর, এটি যে কোনও গ্রহণযোগ্য গ্রাফ শৈলীতে তাত্ক্ষণিক, এমনকি এটি দেখার পক্ষে কঠোর পরিশ্রম।
নিক কক্স

এই নকশার জন্য আমি কেবলমাত্র আরও দেখতে পাচ্ছি, যদি না গ্রেডিং অস্বাভাবিক ডিজাইনের জন্য হয় তবে এটি হ'ল # 1 থেকে # 14 শনাক্তকারীরা এই নকশায় তাত্ক্ষণিক। আমি আমার নিজের উত্তরের একটি সম্পাদনায় এই পয়েন্টটি তুলেছি।
নিক কক্স
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.