এমিরিকাল সিডিএফ ফাংশনগুলি সাধারণত একটি পদক্ষেপ ফাংশন দ্বারা অনুমান করা হয়। লিনিয়ার ইন্টারপোলেশন ব্যবহার না করে এমনভাবে এবং কেন এমন করার কোনও কারণ আছে? পদক্ষেপের কার্যক্রমে কি কোনও আকর্ষণীয় তাত্ত্বিক বৈশিষ্ট্য রয়েছে যা আমাদের এটি পছন্দ করে?
এখানে দু'জনের উদাহরণ:
ecdf2 <- function (x) {
x <- sort(x)
n <- length(x)
if (n < 1)
stop("'x' must have 1 or more non-missing values")
vals <- unique(x)
rval <- approxfun(vals, cumsum(tabulate(match(x, vals)))/n,
method = "linear", yleft = 0, yright = 1, f = 0, ties = "ordered")
class(rval) <- c("ecdf", class(rval))
assign("nobs", n, envir = environment(rval))
attr(rval, "call") <- sys.call()
rval
}
set.seed(2016-08-18)
a <- rnorm(10)
a2 <- ecdf(a)
a3 <- ecdf2(a)
par(mfrow = c(1,2))
curve(a2, -2,2, main = "step function ecdf")
curve(a3, -2,2, main = "linear interpolation function ecdf")
সম্পর্কিত ...................................
"... একটি পদক্ষেপ ফাংশন দ্বারা অনুমান" একটি সূক্ষ্ম ভুল ধারণাটিকে বোঝায়: ইসিডিএফ কেবল একটি পদক্ষেপের দ্বারা অনুমান করা হয় না ; এটা হল সংজ্ঞা দ্বারা যেমন একটি ফাংশন। এটি একটি এলোমেলো ভেরিয়েবলের সিডিএফ এর অনুরূপ। বিশেষ করে, সংখ্যার কোনো সসীম ক্রম দেওয়া , একটি সম্ভাব্যতা স্থান নির্ধারণ সঙ্গে , পৃথক, এবং অভিন্ন। যাক দৈব চলক বরাদ্দ হতে করতে । ইসিডিএফ হ'ল এর সিডিএফ ।এই বিশাল ধারণাগত সরলকরণ সংজ্ঞাটির জন্য একটি বাধ্যতামূলক যুক্তি।
—
হোবার