এটি আপনার চক্রান্তের উদ্দেশ্য সম্পর্কে পরিষ্কার হওয়া উচিত is সাধারণভাবে, দুটি ভিন্ন ধরণের লক্ষ্য রয়েছে: আপনি যে অনুমানগুলি তৈরি করছেন তা মূল্যায়ন করতে এবং ডেটা বিশ্লেষণ প্রক্রিয়াটি গাইড করার জন্য আপনি নিজের জন্য প্লট তৈরি করতে পারেন, বা অন্যকে কোনও ফলাফলের কথা জানানোর জন্য আপনি প্লট তৈরি করতে পারেন। এগুলি এক নয়; উদাহরণস্বরূপ, আপনার প্লট / বিশ্লেষণের অনেক দর্শক / পাঠক পরিসংখ্যানগতভাবে অপ্রতিরোধ্য হতে পারে, এবং টি-পরীক্ষায় এর সমান বৈচিত্র্য এবং এর ভূমিকা সম্পর্কে ধারণা নাও পেতে পারেন। আপনি চান যে আপনার প্লটটি তাদের ডেটা সম্পর্কিত গুরুত্বপূর্ণ তথ্য এমনকি তাদের মতো গ্রাহকদের কাছে পৌঁছে দেবে। তারা সুস্পষ্টভাবে বিশ্বাস করছে যে আপনি কাজগুলি সঠিকভাবে করেছেন। আপনার প্রশ্ন সেটআপ থেকে, আমি সংগ্রহ করি আপনি পরবর্তী সময়ের পরে আছেন are
বাস্তবিকভাবে, টি-টেস্ট 1 -এর ফলাফলগুলি অন্যের কাছে যোগাযোগের জন্য সবচেয়ে সাধারণ এবং স্বীকৃত প্লট (এটি আসলে সবচেয়ে উপযুক্ত কিনা তা আলাদা করে রাখুন) স্ট্যান্ডার্ড ত্রুটি বারগুলির সাথে একটি বার চার্ট। এটি টি-টেস্টের সাথে খুব ভাল মেলে যে কোনও টি-টেস্ট দুটি স্ট্যান্ডার্ড ত্রুটিগুলি ব্যবহার করে তার সাথে দুটি তুলনা করে। যখন আপনার দুটি স্বতন্ত্র গ্রুপ রয়েছে, এটি পরিসংখ্যানহীন, এমনকি পরিসংখ্যানহীন অপরিজ্ঞাতদের জন্যও এমন একটি চিত্র প্রকাশ করবে যা "ডেটা ইচ্ছুক" লোকেরা "তাত্ক্ষণিকভাবে দেখতে পাবে যে তারা সম্ভবত দুটি ভিন্ন জনগোষ্ঠীর থেকে এসেছে"। @ টিমের ডেটা ব্যবহার করে এখানে একটি সাধারণ উদাহরণ রয়েছে:
nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se = c(sd(nonsmokers)/sqrt(length(nonsmokers)),
sd(smokers)/sqrt(length(smokers)))
windows()
bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
box()
arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)
এটি বলেছে যে ডেটা ভিজ্যুয়ালাইজেশনের বিশেষজ্ঞরা সাধারণত এই প্লটগুলি ত্যাগ করেন। এগুলি প্রায়শই "ডায়নামাইট প্লট" (সিএফ।, কেন ডায়নামাইট প্লটগুলি খারাপ ) as বিশেষত, যদি আপনার কাছে কেবল কয়েকটি ডেটা থাকে তবে প্রায়শই এটির পরামর্শ দেওয়া হয় আপনি কেবল নিজেরাই ডেটাটি দেখান । যদি পয়েন্টগুলি ওভারল্যাপ হয় তবে আপনি এগুলি আনুভূমিকভাবে ঝাঁকুনি দিতে পারেন (এলোমেলো গোলমাল একটি স্বল্প পরিমাণ যোগ করুন) যাতে তারা আর ওভারল্যাপ না করে। যেহেতু একটি টি-পরীক্ষা মৌলিকভাবে মানে এবং মান ত্রুটিগুলি সম্পর্কে থাকে, তবে এই জাতীয় প্লটটিতে উপায়গুলি এবং মানগত ত্রুটিগুলি ওভারলে করা ভাল। এখানে একটি ভিন্ন সংস্করণ:
set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE,
xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)
আপনার যদি প্রচুর ডেটা থাকে তবে বন্টনগুলির দ্রুত সংক্ষিপ্ত বিবরণ পাওয়ার জন্য বক্সপ্লটগুলি আরও ভাল পছন্দ হতে পারে এবং আপনি সেখানে উপায় এবং এসএসকে ওভারলে করতে পারেন।
data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see
ডেটাগুলির সহজ প্লট এবং বক্সপ্লটগুলি যথেষ্ট সহজ যে বেশিরভাগ লোকেরা তাদের পরিসংখ্যানগতভাবে জ্ঞান না থাকলেও সেগুলি বুঝতে সক্ষম হবে। তবে মনে রাখবেন যে এগুলির কোনওটিই আপনার গ্রুপগুলির তুলনা করার জন্য টি-টেস্ট ব্যবহার করার বৈধতা নির্ধারণ করা সহজ করে না। এই লক্ষ্যগুলি বিভিন্ন ধরণের প্লট দ্বারা সর্বোত্তমভাবে পরিবেশন করা হয়।
1. দ্রষ্টব্য যে এই আলোচনাটি একটি স্বতন্ত্র নমুনা টি-পরীক্ষা গ্রহণ করে। এই প্লটগুলি নির্ভরশীল নমুনা টি-টেস্টের সাহায্যে ব্যবহার করা যেতে পারে, তবে সেই প্রসঙ্গে বিভ্রান্তিকর হতেও পারে (সিএফ।, কোনও বিষয়গুলির মধ্যে অধ্যয়নের জন্য ভুলের বারগুলি ব্যবহার করা ভুল? )।