আর-তে গড়টির মানক ত্রুটিটি খুঁজে পেতে কোনও আদেশ আছে?
উত্তর:
স্ট্যান্ডার্ড ত্রুটিটি কেবলমাত্র নমুনার আকারের বর্গমূল দিয়ে বিভক্ত স্ট্যান্ডার্ড বিচ্যুতি। সুতরাং আপনি সহজেই নিজের কাজটি করতে পারেন:
> std <- function(x) sd(x)/sqrt(length(x))
> std(c(1,2,3,4))
[1] 0.6454972
স্ট্যান্ডার্ড ত্রুটি (এসই) নমুনা বিতরণের কেবলমাত্র স্ট্যান্ডার্ড বিচ্যুতি। স্যাম্পলিং বিতরণের বিভিন্নতা হ'ল এন দ্বারা বিভক্ত তথ্যের বৈচিত্র এবং এসই এর বর্গমূল। এই বোঝাপড়া থেকে যাওয়া একজন দেখতে পাচ্ছেন যে এসই গণনায় বৈকল্পিক ব্যবহার করা আরও দক্ষ। আর-তে sdফাংশনটি ইতিমধ্যে একটি বর্গমূল তৈরি করে (কোডটি sdআর-তে রয়েছে এবং কেবল "এসডি" টাইপ করে প্রকাশিত হয়)। সুতরাং, নিম্নলিখিতটি সবচেয়ে কার্যকর।
se <- function(x) sqrt(var(x)/length(x))
ফাংশনটিকে কেবল আরও জটিল করতে এবং আপনি যে বিকল্পগুলিতে যেতে পারেন সেগুলি হ্যান্ডেল করার জন্য var, আপনি এই পরিবর্তনটি করতে পারেন।
se <- function(x, ...) sqrt(var(x, ...)/length(x))
এই বাক্য গঠনটি ব্যবহার করে যে কোনও কীভাবে varঅনুপস্থিত মানগুলির সাথে ডিল করে things varনামযুক্ত আর্গুমেন্ট হিসাবে যে কোনও কিছু পাস করা যেতে পারে এই seকলটিতে ব্যবহার করা যেতে পারে ।
stderrমধ্যে একটি ফাংশন নাম base।
stderrমানক ত্রুটি এটি প্রদর্শিত হয় তা গণনা করে নাdisplay aspects. of connection
stderrস্ট্যান্ডার্ড ত্রুটির গণনার কথা বলেননি , তিনি হুঁশিয়ারি দিয়েছিলেন যে এই নামটি বেসে ব্যবহৃত হয় এবং জন প্রথমে তার ফাংশনটির নাম রেখেছিলেন stderr(সম্পাদনা ইতিহাস পরীক্ষা করুন ...)।
উপরে জন এর উত্তরের একটি সংস্করণ যা পেস্কি এনএ'র অপসারণ করে:
stderr <- function(x, na.rm=FALSE) {
if (na.rm) x <- na.omit(x)
sqrt(var(x)/length(x))
}
stderrএ baseপ্যাকেজ যে কিছু আর, তাই এটা ভাল হতে পারে অন্য একটি নাম এই এক জন্য যেমন বেছে নিতে আগ্রহীse
প্যাকেজ স্কিপ্লটের বিল্ট-ইন ফাংশন সে (এক্স) রয়েছে
যেহেতু আমি এই প্রশ্নটিতে এখনই ফিরে যাচ্ছি এবং কারণ এই প্রশ্নটি পুরানো, তাই আমি সর্বাধিক ভোট দেওয়া উত্তরের জন্য একটি মানদণ্ড পোস্ট করছি।
দ্রষ্টব্য, এটি @ ইয়ান এবং @ জন এর উত্তরগুলির জন্য আমি অন্য সংস্করণ তৈরি করেছি। ব্যবহারের পরিবর্তে length(x), আমি sum(!is.na(x))(এনএএস এড়ানোর জন্য) ব্যবহার করেছি । আমি ১০,০০০ পুনরাবৃত্তি সহ 10 ^ 6 এর একটি ভেক্টর ব্যবহার করেছি।
library(microbenchmark)
set.seed(123)
myVec <- rnorm(10^6)
IanStd <- function(x) sd(x)/sqrt(length(x))
JohnSe <- function(x) sqrt(var(x)/length(x))
IanStdisNA <- function(x) sd(x)/sqrt(sum(!is.na(x)))
JohnSeisNA <- function(x) sqrt(var(x)/sum(!is.na(x)))
AranStderr <- function(x, na.rm=FALSE) {
if (na.rm) x <- na.omit(x)
sqrt(var(x)/length(x))
}
mbm <- microbenchmark(
"plotrix" = {plotrix::std.error(myVec)},
"IanStd" = {IanStd(myVec)},
"JohnSe" = {JohnSe(myVec)},
"IanStdisNA" = {IanStdisNA(myVec)},
"JohnSeisNA" = {JohnSeisNA(myVec)},
"AranStderr" = {AranStderr(myVec)},
times = 1000)
mbm
ফলাফল:
Unit: milliseconds
expr min lq mean median uq max neval cld
plotrix 10.3033 10.89360 13.869947 11.36050 15.89165 125.8733 1000 c
IanStd 4.3132 4.41730 4.618690 4.47425 4.63185 8.4388 1000 a
JohnSe 4.3324 4.41875 4.640725 4.48330 4.64935 9.4435 1000 a
IanStdisNA 8.4976 8.99980 11.278352 9.34315 12.62075 120.8937 1000 b
JohnSeisNA 8.5138 8.96600 11.127796 9.35725 12.63630 118.4796 1000 b
AranStderr 4.3324 4.41995 4.634949 4.47440 4.62620 14.3511 1000 a
library(ggplot2)
autoplot(mbm)
আপনি pastec প্যাকেজ থেকে ফাংশনটি স্টেট.ডেস্ক ব্যবহার করতে পারেন।
library(pastec)
stat.desc(x, BASIC =TRUE, NORMAL =TRUE)
আপনি এখান থেকে এ সম্পর্কে আরও জানতে পারেন: https://www.rdocamentation.org/packages/pastecs/versions/1.3.21/topics/stat.desc
মনে রাখবেন যে গড়টি লিনিয়ার মডেলটি ব্যবহার করে একটি একক ইন্টারসেপ্টের বিপরীতে ভেরিয়েবলটি পুনরায় চাপিয়েও আপনি এটির lm(x~1)জন্য ফাংশনটিও ব্যবহার করতে পারেন !
সুবিধাগুলি হ'ল:
confint()car::linear.hypothesis()sandwich## generate data
x <- rnorm(1000)
## estimate reg
reg <- lm(x~1)
coef(summary(reg))[,"Std. Error"]
#> [1] 0.03237811
## conpare with simple formula
all.equal(sd(x)/sqrt(length(x)),
coef(summary(reg))[,"Std. Error"])
#> [1] TRUE
## extract confidence interval
confint(reg)
#> 2.5 % 97.5 %
#> (Intercept) -0.06457031 0.0625035
2020-10-06 এ ডিপেক্স প্যাকেজ (v0.3.0) দ্বারা তৈরি হয়েছে
y <- mean(x, na.rm=TRUE)
sd(y)var(y)বৈকল্পিক জন্য আদর্শ বিচ্যুতি জন্য।
উভয় ডেরাইভেশনগুলি n-1ডিনোমিনেটরে ব্যবহার করে তাই তারা নমুনা তথ্যের উপর ভিত্তি করে।