দাবি অস্বীকার: নিম্নলিখিত পয়েন্টগুলিতে, এই গুরুতরভাবে অনুমান করা হয় যে আপনার ডেটা সাধারণত বিতরণ করা হয়। আপনি যদি প্রকৃতপক্ষে কোনও ইঞ্জিনিয়ারিং করছেন তবে শক্তিশালী পরিসংখ্যান পেশাদারের সাথে কথা বলুন এবং সেই স্তরটি কী হবে তা বলে সেই ব্যক্তিকে লাইনে সাইন ইন করুন let তাদের মধ্যে পাঁচজনের সাথে কথা বলুন বা তাদের 25 জনের সাথে কথা বলুন। এই উত্তরটি সিভিল ইঞ্জিনিয়ারিংয়ের শিক্ষার্থীদের জন্য "কেন" জিজ্ঞাসা করে ইঞ্জিনিয়ারিং পেশাদারদের জন্য জিজ্ঞাসা করা হয়নি "কীভাবে" asking
আমি মনে করি প্রশ্নের পিছনে প্রশ্নটি "চূড়ান্ত মান বিতরণ কী?" হ্যাঁ এটি কিছু বীজগণিত - চিহ্ন। তাতে কি? ঠিক আছে?
1000 বছরের বন্যার কথা ভাবা যাক। তারা বিস্তৃত.
যখন তারা ঘটবে, তখন তারা প্রচুর লোককে হত্যা করবে। প্রচুর সেতু নেমে যাচ্ছে।
তুমি জানো কোন ব্রিজটি নামছে না? আমি করি. আপনি না ... এখনও।
প্রশ্ন: 1000 বছরের বন্যায় কোন সেতুটি নামছে না?
উত্তর: সেতুটি এটি সহ্য করার জন্য ডিজাইন করা হয়েছে।
আপনার এটি উপায়ে আপনার করার দরকার ডেটা:
সুতরাং আসুন ধরে নেওয়া যাক আপনার কাছে 200 বছরের দৈনিক জলের ডেটা রয়েছে। 1000 বছরের বন্যা কি সেখানে আছে? দূর থেকে নয়। আপনার কাছে বিতরণের একটি লেজের নমুনা রয়েছে। আপনার লোকসংখ্যা নেই। আপনি যদি বন্যার ইতিহাসের সমস্ত কিছু জানতেন তবে আপনার মোট উপাত্তের জনসংখ্যা থাকবে। এই সম্পর্কে চিন্তা করা যাক। আপনার 1000 বছরের মধ্যে কমপক্ষে একটির মূল্য থাকতে পারে এমন কমপক্ষে একটি মূল্য থাকতে আপনার কত বছরের ডেটা থাকতে হবে? নিখুঁত বিশ্বে আপনার কমপক্ষে 1000 টি নমুনা লাগবে। আসল বিশ্বটি অগোছালো, তাই আপনার আরও প্রয়োজন। আপনি প্রায় 4000 নমুনায় 50/50 মতভেদ পেতে শুরু করেন। আপনি প্রায় 20,000 নমুনায় 1 এর বেশি থাকার গ্যারান্টি পাওয়া শুরু করেন। নমুনার অর্থ "পরের তুলনায় জল এক সেকেন্ড" নয়, তবে পরিবর্তনের প্রতিটি অনন্য উত্সের জন্য একটি পরিমাপ - যেমন বছরের পর বছর পরিবর্তনের। এক বছরের উপরে এক পরিমাপ, অন্য বছরের সাথে আরও একটি পরিমাপ দুটি নমুনা গঠন করে। আপনার কাছে যদি 4,000 বছর ভাল ডেটা না থাকে তবে আপনার কাছে সম্ভবত ডেটাতে 1000 বছরের বন্যা নেই। ভাল জিনিসটি হ'ল - ভাল ফলাফল পেতে আপনার এত বেশি ডেটার দরকার নেই।
কম ডেটা দিয়ে কীভাবে আরও ভাল ফলাফল পাবেন তা এখানে:
আপনি যদি বার্ষিক ম্যাক্সিমার দিকে নজর দেন তবে আপনি বছরের সর্বোচ্চ-স্তরের 200 মানগুলিতে "চূড়ান্ত মান বিতরণ" ফিট করতে পারেন এবং আপনার কাছে 1000 বছরের বন্যার উপস্থিতি রয়েছে পর্যায়ের। এটি বীজগণিত হবে, আসল "এটি কত বড়" নয়। 1000 বছরের বন্যা কতটা বড় হবে তা নির্ধারণ করতে আপনি এই সমীকরণটি ব্যবহার করতে পারেন। তারপরে, সেই পরিমাণ পরিমাণ জল দেওয়া - আপনি এটি প্রতিরোধের জন্য আপনার সেতুটি তৈরি করতে পারেন। সঠিক মানের জন্য অঙ্কুর করবেন না, বড় অঙ্কুর, অন্যথায় আপনি এটি 1000 বছরের বন্যায় ব্যর্থ হওয়ার জন্য ডিজাইন করছেন। আপনি যদি সাহসী হন, তবে আপনি প্রতিরোধের জন্য এটি তৈরি করতে আপনাকে সঠিক 1000 বছরের মানের চেয়ে কত বেশি পরিমাণ নির্ধারণ করতে হবে তা বোঝার জন্য আপনি পুনরায় মডেলিং ব্যবহার করতে পারেন।
এখানে কেন ইভি / জিইভি প্রাসঙ্গিক বিশ্লেষণাত্মক ফর্ম:
সাধারণীকরণের চূড়ান্ত মান বিতরণ সর্বাধিক পরিমাণে পরিবর্তিত হয় is সর্বাধিকের ভিন্নতা গড়ের পরিবর্তনের চেয়ে সত্যই ভিন্ন আচরণ করে। সাধারণ বন্টন, কেন্দ্রীয় সীমা উপপাদ্য মাধ্যমে, অনেক "কেন্দ্রীয় প্রবণতা" বর্ণনা করে।
পদ্ধতি:
- নিম্নলিখিত 1000 বার করুন:
i। মানক সাধারণ বিতরণ থেকে 1000 নম্বর চয়ন করুন
ii। সেই গ্রুপের স্যাম্পলগুলির সর্বাধিক গণনা করুন এবং এটি সংরক্ষণ করুন
এখন ফলাফল বিতরণের পরিকল্পনা করুন
#libraries
library(ggplot2)
#parameters and pre-declarations
nrolls <- 1000
ntimes <- 10000
store <- vector(length=ntimes)
#main loop
for (i in 1:ntimes){
#get samples
y <- rnorm(nrolls,mean=0,sd=1)
#store max
store[i] <- max(y)
}
#plot
ggplot(data=data.frame(store), aes(store)) +
geom_histogram(aes(y = ..density..),
col="red",
fill="green",
alpha = .2) +
geom_density(col=2) +
labs(title="Histogram for Max") +
labs(x="Max", y="Count")
এটি "স্ট্যান্ডার্ড সাধারণ বিতরণ" নয়:
শিখরটি 3.2 এ রয়েছে তবে সর্বোচ্চটি 5.0 এর দিকে যায়। এটা স্কিউ আছে। এটি প্রায় 2.5 এর নিচে পাবেন না। যদি আপনার কাছে প্রকৃত ডেটা (মানক আদর্শ) থাকে এবং আপনি কেবল লেজটি বাছাই করেন, তবে আপনি অবিচ্ছিন্নভাবে এ বক্ররেখার সাথে কিছু বাছাই করছেন। আপনি যদি ভাগ্যবান হন তবে আপনি নীচের লেজের দিকে নয় বরং কেন্দ্রের দিকে। ইঞ্জিনিয়ারিং ভাগ্যের বিপরীত সম্পর্কে - এটি প্রতিটি সময় নিয়মিতভাবে কাঙ্ক্ষিত ফলাফল অর্জনের বিষয়ে। "সুযোগ এড়াতে এলোমেলো সংখ্যাগুলি খুব বেশি গুরুত্বপূর্ণ " (পাদটীকা দেখুন), বিশেষত ইঞ্জিনিয়ারের জন্য। বিশ্লেষণমূলক ফাংশন পরিবার যা এই ডেটার সাথে সবচেয়ে ভাল ফিট করে - বিতরণের চরম মূল্য পরিবার।
নমুনা ফিট: ধরা
যাক যে আমাদের কাছে স্ট্যান্ডার্ড সাধারণ বিতরণ থেকে বছরের সর্বোচ্চ সর্বোচ্চ 200 টি এলোমেলো মান রয়েছে এবং আমরা ভান করতে যাচ্ছি যে এটি আমাদের 200 বছরের সর্বোচ্চ পানির স্তরের ইতিহাস (যার অর্থ যাই হোক না কেন)। বিতরণ পেতে আমরা নিম্নলিখিতগুলি করব:
- "স্টোর" ভেরিয়েবল নমুনা (সংক্ষিপ্ত / সহজ কোড তৈরি করতে)
- একটি সাধারণীকরণ চরম মান বিতরণ ফিট
- বিতরণের মাধ্যমটি সন্ধান করুন
- গড়ের পরিবর্তনে 95% সিআই উচ্চতর সীমা জানতে বুটস্ট্র্যাপিং ব্যবহার করুন, যাতে আমরা তার জন্য আমাদের প্রকৌশলকে লক্ষ্য করতে পারি।
(উপরের কোডগুলি প্রথমে চালিত হয়েছে)
library(SpatialExtremes) #if it isn't here install it, it is the ev library
y2 <- sample(store,size=200,replace=FALSE) #this is our data
myfit <- gevmle(y2)
এটি ফলাফল দেয়:
> gevmle(y2)
loc scale shape
3.0965530 0.2957722 -0.1139021
20,000 নমুনা তৈরি করতে এগুলি উত্পাদক কার্যে প্লাগ করা যেতে পারে
y3 <- rgev(20000,loc=myfit[1],scale=myfit[2],shape=myfit[3])
নিম্নলিখিতটি নির্মাণে যে কোনও বছরে 50/50 টি ব্যর্থতার প্রতিক্রিয়া দেওয়া হবে:
গড় (y3)
3.23681
1000 বছরের "বন্যা" স্তরটি কী তা নির্ধারণ করার জন্য এখানে কোডটি দেওয়া হচ্ছে:
p1000 <- qgev(1-(1/1000),loc=myfit[1],scale=myfit[2],shape=myfit[3])
p1000
এই নিম্নলিখিতটি তৈরি করা আপনাকে 1000 বছরের বন্যায় ব্যর্থতার 50/50 মতবিরোধ দিতে হবে।
p1000
4.510931
95% উচ্চতর সিআই নির্ধারণ করতে আমি নিম্নলিখিত কোডটি ব্যবহার করেছি:
myloc <- 3.0965530
myscale <- 0.2957722
myshape <- -0.1139021
N <- 1000
m <- 200
p_1000 <- vector(length=N)
yd <- vector(length=m)
for (i in 1:N){
#generate samples
yd <- rgev(m,loc=myloc,scale=myscale,shape=myshape)
#compute fit
fit_d <- gevmle(yd)
#compute quantile
p_1000[i] <- qgev(1-(1/1000),loc=fit_d[1],scale=fit_d[2],shape=fit_d[3])
}
mytarget <- quantile(p_1000,probs=0.95)
ফলাফল ছিল:
> mytarget
95%
4.812148
এর অর্থ হ'ল, 1000 বছরের বন্যার বিশাল সংখ্যাগরিষ্ঠতা প্রতিরোধ করার জন্য, আপনার ডেটা নিখরচায় স্বাভাবিক (সম্ভবত নয়) এর জের ধরে, আপনার অবশ্যই এটি তৈরি করতে হবে ...
> out <- pgev(4.812148,loc=fit_d[1],scale=fit_d[2],shape=fit_d[3])
> 1/(1-out)
অথবা
> 1/(1-out)
shape
1077.829
... 1078 বছরের বন্যা।
নিন্ম রেখাগুলো:
- আপনার কাছে ডেটার একটি নমুনা রয়েছে, প্রকৃত মোট জনসংখ্যা নয়। তার মানে আপনার কোয়ান্টাইলগুলি অনুমান, এবং বন্ধ হতে পারে।
- সাধারণ চূড়ান্ত মান বিতরণের মতো বিতরণগুলি প্রকৃত লেজগুলি নির্ধারণ করতে নমুনাগুলি ব্যবহার করতে নির্মিত হয়। আপনার কাছে ক্লাসিক পদ্ধতির জন্য পর্যাপ্ত নমুনা না থাকলেও নমুনার মানগুলি ব্যবহার করার চেয়ে তারা খুব কম খারাপভাবে অনুমান করে।
- আপনি যদি দৃust় হন তবে সিলিংটি উচ্চতর, তবে এর ফলাফলটি - আপনি ব্যর্থ হন না।
ভাগ্য সুপ্রসন্ন হোক
পুনশ্চ:
PS: আরও মজা - একটি ইউটিউব ভিডিও (আমার নয়)
https://www.youtube.com/watch?v=EACkiMRT0pc
পাদটীকা: কোভ্যউ, রবার্ট আর। "এলোমেলো সংখ্যার জেনারেশনকে সুযোগ থেকে দূরে রাখা খুব গুরুত্বপূর্ণ" " প্রয়োগিত সম্ভাবনা এবং মন্টে কার্লো পদ্ধতি এবং গতিবিদ্যার আধুনিক দিক। প্রয়োগ গণিত 3 (1969) অধ্যয়ন: 70-111।
extreme value distribution
চেয়ে ব্যবহার করুনthe overall distribution
এবং 98.5% মান পাবেন।