কোন ডিস্ট্রিবিউশনটি আমার ডেটাতে সেরা ফিট করে তা কীভাবে নির্ধারণ করবেন?


133

আমার একটি ডেটাসেট রয়েছে এবং এটি নির্ধারণ করতে চাই যে কোন বিতরণটি আমার ডেটাতে সেরা।

fitdistr()অনুমিত বিতরণ (যেমন ওয়েবুল, কচী, সাধারণ) বর্ণনা করার জন্য প্রয়োজনীয় পরামিতিগুলি অনুমান করার জন্য আমি ফাংশনটি ব্যবহার করেছি । এই পরামিতিগুলি ব্যবহার করে আমি অনুমান করতে আমার নমুনা ডেটা একই ধরণের বিতরণ থেকে প্রাপ্ত কিনা তা অনুমান করার জন্য একটি কলমোগোরভ-স্মারনভ পরীক্ষা পরিচালনা করতে পারি।

যদি পি-মান হয় তবে 0.05 আমি ধরে নিতে পারি যে নমুনা ডেটা একই বিতরণ থেকে আঁকা। তবে পি-ভ্যালু ফিটের theশ্বরত্ব সম্পর্কে কোনও তথ্য সরবরাহ করে না, তাই না?

সুতরাং যদি আমার নমুনা তথ্যের পি-মানটি সাধারণ বন্টন এবং ওয়েবেল বিতরণের জন্য ০.০৫ হয় তবে আমি কীভাবে জানতে পারি যে কোন বিতরণ আমার ডেটা আরও ভাল ফিট করে?

এটিই মূলত আমি যা করেছি:

> mydata
 [1] 37.50 46.79 48.30 46.04 43.40 39.25 38.49 49.51 40.38 36.98 40.00
[12] 38.49 37.74 47.92 44.53 44.91 44.91 40.00 41.51 47.92 36.98 43.40
[23] 42.26 41.89 38.87 43.02 39.25 40.38 42.64 36.98 44.15 44.91 43.40
[34] 49.81 38.87 40.00 52.45 53.13 47.92 52.45 44.91 29.54 27.13 35.60
[45] 45.34 43.37 54.15 42.77 42.88 44.26 27.14 39.31 24.80 16.62 30.30
[56] 36.39 28.60 28.53 35.84 31.10 34.55 52.65 48.81 43.42 52.49 38.00
[67] 38.65 34.54 37.70 38.11 43.05 29.95 32.48 24.63 35.33 41.34

# estimate shape and scale to perform KS-test for weibull distribution
> fitdistr(mydata, "weibull")
     shape        scale   
   6.4632971   43.2474500 
 ( 0.5800149) ( 0.8073102)

# KS-test for weibull distribution
> ks.test(mydata, "pweibull", scale=43.2474500, shape=6.4632971)

        One-sample Kolmogorov-Smirnov test

data:  mydata
D = 0.0686, p-value = 0.8669
alternative hypothesis: two-sided

# KS-test for normal distribution
> ks.test(mydata, "pnorm", mean=mean(mydata), sd=sd(mydata))

        One-sample Kolmogorov-Smirnov test

data:  mydata
D = 0.0912, p-value = 0.5522
alternative hypothesis: two-sided

পি-মানগুলি ওয়েইবুল বিতরণের জন্য 0.8669 এবং সাধারণ বিতরণের জন্য 0.5522। সুতরাং আমি ধরে নিতে পারি যে আমার ডেটা একটি ওয়েইবুলের পাশাপাশি একটি সাধারণ বিতরণ অনুসরণ করে। তবে কোন বিতরণ ফাংশন আমার ডেটা আরও ভালভাবে বর্ণনা করে?


ইলেভেনডোলারের কথা উল্লেখ করে আমি নিম্নলিখিত কোডটি পেয়েছি, তবে কীভাবে ফলাফলগুলি ব্যাখ্যা করতে হয় তা জানি না:

fits <- list(no = fitdistr(mydata, "normal"),
             we = fitdistr(mydata, "weibull"))
sapply(fits, function(i) i$loglik)
       no        we 
-259.6540 -257.9268 

5
আপনার ডেটা কোন ডিস্ট্রিবিউশন সবচেয়ে ভাল ফিট করে তা আপনি কেন বের করতে চান?
রোল্যান্ড

6
কারণ আমি প্রদত্ত বিতরণ অনুসরণ করে সিউডো-এলোমেলো সংখ্যা তৈরি করতে চাই।
tobibo

6
আপনি ডেটাসেট থেকে পাওয়া প্যারামিটারগুলির সাথে কোনও বিতরণ ডেটাসেটের সাথে মেলে কিনা তা যাচাই করতে আপনি কেএস ব্যবহার করতে পারবেন না। উদাহরণস্বরূপ, এই পৃষ্ঠায় # 2 দেখুন , আরও বিকল্পগুলি (এবং কেএস পরীক্ষাটি বিভ্রান্তিকর হতে পারে অন্যান্য উপায়)।
tpg2114

নমুনা থেকে পরামিতি অনুমান করা হয় কীভাবে কেএস পরীক্ষা প্রয়োগ করতে হবে সে সম্পর্কে কোড নমুনার সাথে এখানে আরও একটি আলোচনা ।
আকসকল

1
I used the fitdistr() function ..... fitdistrফাংশন কী ? এক্সেল থেকে কিছু? অথবা আপনি নিজেকে সি লিখেছেন কিছু?
নেকখরা

উত্তর:


162

প্রথমত, এখানে কিছু দ্রুত মন্তব্য দেওয়া হয়েছে:

  • আনুমানিক প্যারামিটার সহ একটি কলমোভরভ-স্মারনভ-পরীক্ষা (কেএস-টেস্ট) এর ভ্যালুগুলি বেশ ভুল হবে। সুতরাং দুর্ভাগ্যক্রমে, আপনি কেবলমাত্র একটি বিতরণ মাপসই করতে পারবেন না এবং তারপরে আপনার নমুনাটি পরীক্ষা করতে একটি কলমোগোরভ-স্মারনভ-পরীক্ষায় অনুমিত প্যারামিটারগুলি ব্যবহার করুন।p
  • আপনার নমুনা কখনই একটি নির্দিষ্ট বিতরণ অনুসরণ করবে না । সুতরাং কেএস-পরীক্ষা থেকে আপনার ভ্যালুগুলি বৈধ এবং হতে পারে তবে এর অর্থ হ'ল আপনার ডেটা এই নির্দিষ্ট বিতরণটি অনুসরণ করে তা অস্বীকার করতে পারবেন না । অন্য সূত্রটি হ'ল আপনার নমুনা একটি নির্দিষ্ট বিতরণের সাথে সামঞ্জস্যপূর্ণ। তবে এই প্রশ্নের উত্তর "আমার ডেটা কি বিতরণ জাইকে ঠিক অনুসরণ করে?" সর্বদা না।p>0.05
  • আপনার নমুনা কোন বিতরণ অনুসরণ করে তা নিশ্চিত করেই এখানে লক্ষ্য নির্ধারণ করা যাবে না। @ হুবার (মন্তব্যে) ডেটার পার্সিমোনিয়াস আনুমানিক বিবরণটিকে লক্ষ্য বলে । একটি নির্দিষ্ট প্যারামেট্রিক বিতরণ তথ্য উপাত্তের মডেল হিসাবে দরকারী হতে পারে।

তবে কিছু অন্বেষণ করা যাক। আমি দুর্দান্ত fitdistrplusপ্যাকেজটি ব্যবহার করব যা বিতরণ ফিটিংয়ের জন্য কিছু দুর্দান্ত ফাংশন সরবরাহ করে। descdistসম্ভাব্য প্রার্থীদের বিতরণ সম্পর্কে কিছু ধারণা পেতে আমরা ফাংশনটি ব্যবহার করব ।

library(fitdistrplus)
library(logspline)

x <- c(37.50,46.79,48.30,46.04,43.40,39.25,38.49,49.51,40.38,36.98,40.00,
38.49,37.74,47.92,44.53,44.91,44.91,40.00,41.51,47.92,36.98,43.40,
42.26,41.89,38.87,43.02,39.25,40.38,42.64,36.98,44.15,44.91,43.40,
49.81,38.87,40.00,52.45,53.13,47.92,52.45,44.91,29.54,27.13,35.60,
45.34,43.37,54.15,42.77,42.88,44.26,27.14,39.31,24.80,16.62,30.30,
36.39,28.60,28.53,35.84,31.10,34.55,52.65,48.81,43.42,52.49,38.00,
38.65,34.54,37.70,38.11,43.05,29.95,32.48,24.63,35.33,41.34)

এখন ব্যবহার করতে দিন descdist:

descdist(x, discrete = FALSE)

Descdist

আপনার নমুনার কুর্তোসিস এবং স্কোয়ার স্কিউনেসটি "পর্যবেক্ষণ" নামে একটি নীল বিন্দু হিসাবে প্ল্যাটটেট। দেখে মনে হয় যে সম্ভাব্য বিতরণগুলির মধ্যে ওয়েবুল, লগনারমাল এবং সম্ভবত গামা বিতরণ অন্তর্ভুক্ত রয়েছে।

আসুন একটি ওয়েইবুল বিতরণ এবং একটি সাধারণ বিতরণ মাপসই:

fit.weibull <- fitdist(x, "weibull")
fit.norm <- fitdist(x, "norm")

এখন স্বাভাবিকের জন্য ফিটটি পরীক্ষা করুন:

plot(fit.norm)

সাধারণ ফিট

এবং ওয়েবুলের জন্য উপযুক্ত:

plot(fit.weibull)

ওয়েইবুল ফিট

উভয়ই দেখতে দেখতে দেখতে বেশ ভাল তবে কিউকিউ-প্লট দ্বারা বিচার করা, ওয়েবুল সম্ভবত কিছুটা ভাল দেখায়, বিশেষত লেজগুলিতে। স্বতঃস্ফূর্তভাবে, ওয়েইবুল ফিটের এআইসি স্বাভাবিক ফিটের তুলনায় কম:

fit.weibull$aic
[1] 519.8537

fit.norm$aic
[1] 523.3079

কোলমোগোরভ-স্মারনভ পরীক্ষার সিমুলেশন

আমি শূন্যের নীচে কেএস-পরিসংখ্যান অনুকরণ করতে এখানে বর্ণিত @ আকাকালের পদ্ধতিটি ব্যবহার করব ।

n.sims <- 5e4

stats <- replicate(n.sims, {      
  r <- rweibull(n = length(x)
                , shape= fit.weibull$estimate["shape"]
                , scale = fit.weibull$estimate["scale"]
  )
  estfit.weibull <- fitdist(r, "weibull") # added to account for the estimated parameters
  as.numeric(ks.test(r
                     , "pweibull"
                     , shape= estfit.weibull$estimate["shape"]
                     , scale = estfit.weibull$estimate["scale"])$statistic
  )      
})

সিমুলেটেড কেএস-পরিসংখ্যানগুলির ইসিডিএফ দেখতে নীচের মত দেখাচ্ছে:

plot(ecdf(stats), las = 1, main = "KS-test statistic simulation (CDF)", col = "darkorange", lwd = 1.7)
grid()

সিমুলেটেড কেএস-পরিসংখ্যান

পরিশেষে, কেএস-পরিসংখ্যানের সিমুলেটেড নাল বিতরণ ব্যবহার করে আমাদের ভ্যালুটি হ'ল:p

fit <- logspline(stats)

1 - plogspline(ks.test(x
                       , "pweibull"
                       , shape= fit.weibull$estimate["shape"]
                       , scale = fit.weibull$estimate["scale"])$statistic
               , fit
)

[1] 0.4889511

এটি আমাদের গ্রাফিকাল উপসংহারটিকে নিশ্চিত করে যে নমুনাটি ওয়েইবুল বিতরণের সাথে সামঞ্জস্যপূর্ণ।

এখানে বর্ণিত হিসাবে , আমরা অনুমান করা ওয়েইবুল পিডিএফ বা সিডিএফ-তে পয়েন্টওয়াইজ আস্থার অন্তরগুলি যুক্ত করতে বুটস্ট্র্যাপিং ব্যবহার করতে পারি:

xs <- seq(10, 65, len=500)

true.weibull <- rweibull(1e6, shape= fit.weibull$estimate["shape"]
                         , scale = fit.weibull$estimate["scale"])

boot.pdf <- sapply(1:1000, function(i) {
  xi <- sample(x, size=length(x), replace=TRUE)
  MLE.est <- suppressWarnings(fitdist(xi, distr="weibull"))  
  dweibull(xs, shape=MLE.est$estimate["shape"],  scale = MLE.est$estimate["scale"])
}
)

boot.cdf <- sapply(1:1000, function(i) {
  xi <- sample(x, size=length(x), replace=TRUE)
  MLE.est <- suppressWarnings(fitdist(xi, distr="weibull"))  
  pweibull(xs, shape= MLE.est$estimate["shape"],  scale = MLE.est$estimate["scale"])
}
)   

#-----------------------------------------------------------------------------
# Plot PDF
#-----------------------------------------------------------------------------

par(bg="white", las=1, cex=1.2)
plot(xs, boot.pdf[, 1], type="l", col=rgb(.6, .6, .6, .1), ylim=range(boot.pdf),
     xlab="x", ylab="Probability density")
for(i in 2:ncol(boot.pdf)) lines(xs, boot.pdf[, i], col=rgb(.6, .6, .6, .1))

# Add pointwise confidence bands

quants <- apply(boot.pdf, 1, quantile, c(0.025, 0.5, 0.975))
min.point <- apply(boot.pdf, 1, min, na.rm=TRUE)
max.point <- apply(boot.pdf, 1, max, na.rm=TRUE)
lines(xs, quants[1, ], col="red", lwd=1.5, lty=2)
lines(xs, quants[3, ], col="red", lwd=1.5, lty=2)
lines(xs, quants[2, ], col="darkred", lwd=2)

CI_Density

#-----------------------------------------------------------------------------
# Plot CDF
#-----------------------------------------------------------------------------

par(bg="white", las=1, cex=1.2)
plot(xs, boot.cdf[, 1], type="l", col=rgb(.6, .6, .6, .1), ylim=range(boot.cdf),
     xlab="x", ylab="F(x)")
for(i in 2:ncol(boot.cdf)) lines(xs, boot.cdf[, i], col=rgb(.6, .6, .6, .1))

# Add pointwise confidence bands

quants <- apply(boot.cdf, 1, quantile, c(0.025, 0.5, 0.975))
min.point <- apply(boot.cdf, 1, min, na.rm=TRUE)
max.point <- apply(boot.cdf, 1, max, na.rm=TRUE)
lines(xs, quants[1, ], col="red", lwd=1.5, lty=2)
lines(xs, quants[3, ], col="red", lwd=1.5, lty=2)
lines(xs, quants[2, ], col="darkred", lwd=2)
#lines(xs, min.point, col="purple")
#lines(xs, max.point, col="purple")

CI_CDF


গ্যামএলএসএস-এর সাথে স্বয়ংক্রিয় বিতরণ ফিটিং

gamlssপ্যাকেজের Rঅফার বিভিন্ন ডিস্ট্রিবিউশন চেষ্টা এবং "শ্রেষ্ঠ" GAIC (সাধারণ Akaike তথ্য মাপদণ্ড) অনুযায়ী নির্বাচন করতে ক্ষমতা। মূল কাজটি হ'ল fitDist। এই ফাংশনটির একটি গুরুত্বপূর্ণ বিকল্পটি চেষ্টা করা হয় এমন বন্টনের ধরণ। উদাহরণস্বরূপ, সেটিং type = "realline"পুরো বাস্তব লাইনে সংজ্ঞায়িত সমস্ত বাস্তবায়িত বিতরণ type = "realsplus"চেষ্টা করবে যেখানে কেবল সত্য পজিটিভ লাইনে সংজ্ঞায়িত বিতরণগুলি চেষ্টা করবে। আর একটি গুরুত্বপূর্ণ বিকল্প হ'ল প্যারামিটার , যা জিএআইসির জন্য জরিমানা। নীচের উদাহরণে, আমি প্যারামিটার সেট করেছিলাম যার অর্থ ক্লাসিক এআইসি অনুযায়ী "সেরা" বিতরণটি নির্বাচিত হয়েছে। আপনার পছন্দ মতো যেকোন কিছুতে আপনি সেট করতে পারেনkk=2klog(n)IC BIC এর জন্য ।

library(gamlss)
library(gamlss.dist)
library(gamlss.add)

x <- c(37.50,46.79,48.30,46.04,43.40,39.25,38.49,49.51,40.38,36.98,40.00,
       38.49,37.74,47.92,44.53,44.91,44.91,40.00,41.51,47.92,36.98,43.40,
       42.26,41.89,38.87,43.02,39.25,40.38,42.64,36.98,44.15,44.91,43.40,
       49.81,38.87,40.00,52.45,53.13,47.92,52.45,44.91,29.54,27.13,35.60,
       45.34,43.37,54.15,42.77,42.88,44.26,27.14,39.31,24.80,16.62,30.30,
       36.39,28.60,28.53,35.84,31.10,34.55,52.65,48.81,43.42,52.49,38.00,
       38.65,34.54,37.70,38.11,43.05,29.95,32.48,24.63,35.33,41.34)

fit <- fitDist(x, k = 2, type = "realplus", trace = FALSE, try.gamlss = TRUE)

summary(fit)

*******************************************************************
Family:  c("WEI2", "Weibull type 2") 

Call:  gamlssML(formula = y, family = DIST[i], data = sys.parent()) 

Fitting method: "nlminb" 


Coefficient(s):
             Estimate  Std. Error  t value   Pr(>|t|)    
eta.mu    -24.3468041   2.2141197 -10.9962 < 2.22e-16 ***
eta.sigma   1.8661380   0.0892799  20.9021 < 2.22e-16 ***

এআইসির মতে, ওয়েইবুল বিতরণ (আরও নির্দিষ্টভাবে WEI2, এর একটি বিশেষ প্যারামিট্রাইজেশন) তথ্য সেরা ফিট করে। বন্টন সঠিক parametrization WEI2মধ্যে detailled হয় এই দস্তাবেজটি পৃষ্ঠা 279. উপর এর একটি -এ অবশিষ্টাংশ দিকে তাকিয়ে হইয়া পরিদর্শন করা যাক কীট চক্রান্ত (মূলত একটি ডি প্রবণতা হয়েছিল কিউকিউ-চক্রান্ত):

WormPlot

আমরা আশা করি যে অবশিষ্টাংশগুলি মাঝের অনুভূমিক রেখার কাছাকাছি থাকবে এবং তাদের মধ্যে 95% উচ্চ এবং নিম্ন বিন্দুযুক্ত বক্ররেখার মধ্যে শুয়ে থাকবে, যা 95% পয়েন্টওয়াইজ আস্থার অন্তর হিসাবে কাজ করে। এই ক্ষেত্রে, কীট প্লটটি আমার কাছে সূক্ষ্ম দেখাচ্ছে যা ইঙ্গিত করে যে ওয়েইবুল বিতরণ পর্যাপ্ত ফিট।


1
+1 সুন্দর বিশ্লেষণ। একটি প্রশ্ন, যদিও। কোনও নির্দিষ্ট প্রধান বিতরণের সাথে সামঞ্জস্যের বিষয়ে ইতিবাচক উপসংহার (ওয়েবুল, এই ক্ষেত্রে) মিশ্রণ বিতরণের উপস্থিতির সম্ভাবনাটি বাতিল করতে দেয়? বা সেই বিকল্পটি বাতিল করার জন্য আমাদের একটি সঠিক মিশ্রণ বিশ্লেষণ করা এবং GoF পরীক্ষা করা দরকার?
আলেকসান্দ্র ব্লেক

18
@ আলেকসান্দরলেখ মিশ্রণটি বাতিল করার পক্ষে যথেষ্ট ক্ষমতা থাকা অসম্ভব: যখন মিশ্রণটি প্রায় একই রকম বিতরণের হয় তখন এটি সনাক্ত করা যায় না এবং যখন একটি উপাদান ছাড়া খুব কম অনুপাত থাকে তবে তা সনাক্তও করা যায় না। সাধারণত (কোনও তত্ত্বের অনুপস্থিতিতে যা একটি বিতরণ ফর্মের পরামর্শ দিতে পারে), ডেটার পার্সিমোনিয়াস আনুমানিক বর্ণনার বর্ণনা অর্জনের জন্য একজন প্যারাম্যাট্রিক বিতরণে ফিট করে। মিশ্রণগুলি সেগুলির মধ্যে কোনওটি নয়: তাদের জন্য অনেকগুলি পরামিতি প্রয়োজন এবং উদ্দেশ্যটির জন্য খুব নমনীয়।
whuber

4
@ শুভ: +1 আপনার দুর্দান্ত ব্যাখ্যাটির প্রশংসা করুন !
আলেকসান্দ্র ব্লেক

1
@ লরেনকো আমি কুলেন এবং ফে গ্রাফের দিকে চেয়েছিলাম। নীল পয়েন্টটি আমাদের নমুনাকে বোঝায়। আপনি দেখতে পাচ্ছেন যে পয়েন্টটি ওয়েইবুল, লগনারমাল এবং গামার (যা ওয়েবুল এবং গামার মাঝামাঝি) লাইনগুলির নিকটে রয়েছে। এই বিতরণগুলির প্রত্যেককে ফিট করার পরে, আমি ফাংশন gofstatএবং এআইসি ব্যবহার করে সদল্য -সংক্রান্ত ফিটনেসগুলির পরিসংখ্যান তুলনা করেছি । "সেরা" বিতরণটি নির্ধারণ করার সর্বোত্তম উপায় কী তা নিয়ে aক্যমত্য নেই। আমি গ্রাফিকাল পদ্ধতি এবং এআইসি পছন্দ করি।
COOLSerdash

1
@ লরেনকো আপনি লগনরমাল বলতে চান? যৌক্তিক বিতরণ ("+" সাইন) পর্যবেক্ষণ করা ডেটা থেকে কিছুটা দূরে। লগনরমালটি এমন একজন প্রার্থীও হবে যা আমি সাধারণত দেখি। এই টিউটোরিয়ালের জন্য, পোস্টটি সংক্ষিপ্ত রাখার জন্য আমি এটি প্রদর্শন না করা বেছে নিয়েছি। লগন্যালমাল ওয়েইবুল এবং সাধারণ বিতরণ উভয়ের তুলনায় আরও খারাপ ফিট দেখাচ্ছে। এআইসি 537.59 এবং গ্রাফগুলিও খুব ভাল দেখাচ্ছে না।
COOLSerdash

15

আপনার ডেটা কেমন লাগে সে সম্পর্কে আরও ভাল ধারণা পাওয়ার জন্য প্লটগুলি বেশিরভাগই ভাল উপায়। আপনার ক্ষেত্রে আমি ফিটডিজ্টর () থেকে প্রাপ্ত প্যারামিটারগুলির সাথে তাত্ত্বিক সিডিএফগুলির বিরুদ্ধে ইমিরিকালিক ক্রমবর্ধমান বিতরণ ফাংশন (ইসিডিএফ) প্লট করার পরামর্শ দেব ।

আমি একবার আমার ডেটার জন্য এটি করেছি এবং আত্মবিশ্বাসের অন্তর অন্তর্ভুক্ত করেছি। আমি ggplot2 () ব্যবহার করে যে ছবিটি পেয়েছি তা এখানে।

এখানে চিত্র বর্ণনা লিখুন

ব্ল্যাক লাইনটি ইম্পেরিকাল ক্রমবর্ধমান বিতরণ ফাংশন এবং রঙিন লাইনগুলি সর্বাধিক সম্ভাবনা পদ্ধতিটি ব্যবহার করে প্যারামিটার ব্যবহার করে বিভিন্ন বিতরণ থেকে সিডিএফ হয়। সহজেই দেখা যায় যে সূচকীয় এবং সাধারণ বিতরণ ডেটাগুলির পক্ষে উপযুক্ত নয়, কারণ লাইনগুলির ইসিডিএফ থেকে আলাদা রূপ রয়েছে এবং লাইনগুলি ইসিডিএফ থেকে অনেক দূরে রয়েছে। দুর্ভাগ্যক্রমে অন্যান্য বিতরণগুলি বেশ কাছাকাছি। তবে আমি বলব যে লগনরমাল লাইনটি কালো লাইনের নিকটবর্তী। দূরত্বের একটি পরিমাপ (উদাহরণস্বরূপ এমএসই) ব্যবহার করা অনুমিতিকে বৈধতা দিতে পারে।

আপনার যদি কেবল দুটি প্রতিযোগী বিতরণ থাকে (উদাহরণস্বরূপ যেগুলি প্লটটিতে সবচেয়ে ভাল ফিট করে) বাছাই করে আপনি কোন সম্ভাবনা -অনুপাত-পরীক্ষাটি পরীক্ষা করতে ব্যবহার করতে পারেন যা বিতরণগুলি আরও ভাল fits


20
ক্রসভিলেটেডে স্বাগতম! আপনার উত্তরটি আরও কার্যকর হতে পারে যদি আপনি এটিকে সম্পাদনা করতে পারতেন (ক) আপনি গ্রাফিক তৈরির জন্য যে কোডটি ব্যবহার করেছিলেন এবং (খ) কীভাবে গ্রাফিকটি পড়বে।
স্টিফান কোলাসা

2
সেখানে কী চক্রান্ত করা হচ্ছে? এটি কি কোনও ধরণের ঘনিষ্ঠতা-প্লট?
Glen_b

1
তবে আপনি কীভাবে সিদ্ধান্ত নেবেন যে কোন বিতরণ আপনার ডেটার সাথে সবচেয়ে উপযুক্ত? কেবল গ্রাফিক অনুযায়ী আমি আপনাকে বলতে পারিনি লগনরমাল বা ওয়েইবুল আপনার ডেটা সবচেয়ে ভাল ফিট করে কিনা।
tobibo

4
আপনি যদি ছদ্ম-এলোমেলো সংখ্যার জেনারেটর তৈরি করতে চান তবে এমিরিকাল সিডিএফ ব্যবহার করবেন না কেন? আপনি কি এমন নম্বর আঁকতে চান যা আপনার পর্যবেক্ষণের বিতরণের বাইরে?
এলেভেনডোলার

6
আপনার গ্রাফটিকে সামান্য মূল্যের দিকে নিয়ে গেলে, এটি প্রদর্শিত হবে যে আপনার প্রার্থী বিতরণগুলির কোনওই ডেটা একেবারেই ফিট করে না। এছাড়াও, আপনার এসসিডিএফটির একটি অনুভূমিক অ্যাসিম্পটোট 0.03 এরও কম রয়েছে বলে মনে হয় না, তাই আমি নিশ্চিত নই যে এটি সত্যই প্রথম স্থানের একটি এক্সডিএফ।
হংক ওওই
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.