কেন চরম মান তত্ত্ব ব্যবহার?


18

আমি সিভিল ইঞ্জিনিয়ারিং থেকে আসছি, যার মধ্যে আমরা জিইভি বিতরণের মতো সর্বাধিক বায়ুর গতি যেমন বাতাসের গতিবেগের 98.5% কম হবে তার মান পূর্বাভাস দিতে জিইভি বিতরণের মতো এক্সট্রিম মান তত্ত্ব ব্যবহার করি ।

আমার প্রশ্ন হ'ল কেন এমন চরম মূল্য বন্টন ব্যবহার করবেন ? যদি আমরা কেবল সামগ্রিক বিতরণটি ব্যবহার করি এবং 98.5% সম্ভাবনার মান পাই তবে এটি কী সহজ হবে না ?

উত্তর:


24

দাবি অস্বীকার: নিম্নলিখিত পয়েন্টগুলিতে, এই গুরুতরভাবে অনুমান করা হয় যে আপনার ডেটা সাধারণত বিতরণ করা হয়। আপনি যদি প্রকৃতপক্ষে কোনও ইঞ্জিনিয়ারিং করছেন তবে শক্তিশালী পরিসংখ্যান পেশাদারের সাথে কথা বলুন এবং সেই স্তরটি কী হবে তা বলে সেই ব্যক্তিকে লাইনে সাইন ইন করুন let তাদের মধ্যে পাঁচজনের সাথে কথা বলুন বা তাদের 25 জনের সাথে কথা বলুন। এই উত্তরটি সিভিল ইঞ্জিনিয়ারিংয়ের শিক্ষার্থীদের জন্য "কেন" জিজ্ঞাসা করে ইঞ্জিনিয়ারিং পেশাদারদের জন্য জিজ্ঞাসা করা হয়নি "কীভাবে" asking

আমি মনে করি প্রশ্নের পিছনে প্রশ্নটি "চূড়ান্ত মান বিতরণ কী?" হ্যাঁ এটি কিছু বীজগণিত - চিহ্ন। তাতে কি? ঠিক আছে?

1000 বছরের বন্যার কথা ভাবা যাক। তারা বিস্তৃত.

যখন তারা ঘটবে, তখন তারা প্রচুর লোককে হত্যা করবে। প্রচুর সেতু নেমে যাচ্ছে।
তুমি জানো কোন ব্রিজটি নামছে না? আমি করি. আপনি না ... এখনও।

প্রশ্ন: 1000 বছরের বন্যায় কোন সেতুটি নামছে না?
উত্তর: সেতুটি এটি সহ্য করার জন্য ডিজাইন করা হয়েছে।

আপনার এটি উপায়ে আপনার করার দরকার ডেটা:
সুতরাং আসুন ধরে নেওয়া যাক আপনার কাছে 200 বছরের দৈনিক জলের ডেটা রয়েছে। 1000 বছরের বন্যা কি সেখানে আছে? দূর থেকে নয়। আপনার কাছে বিতরণের একটি লেজের নমুনা রয়েছে। আপনার লোকসংখ্যা নেই। আপনি যদি বন্যার ইতিহাসের সমস্ত কিছু জানতেন তবে আপনার মোট উপাত্তের জনসংখ্যা থাকবে। এই সম্পর্কে চিন্তা করা যাক। আপনার 1000 বছরের মধ্যে কমপক্ষে একটির মূল্য থাকতে পারে এমন কমপক্ষে একটি মূল্য থাকতে আপনার কত বছরের ডেটা থাকতে হবে? নিখুঁত বিশ্বে আপনার কমপক্ষে 1000 টি নমুনা লাগবে। আসল বিশ্বটি অগোছালো, তাই আপনার আরও প্রয়োজন। আপনি প্রায় 4000 নমুনায় 50/50 মতভেদ পেতে শুরু করেন। আপনি প্রায় 20,000 নমুনায় 1 এর বেশি থাকার গ্যারান্টি পাওয়া শুরু করেন। নমুনার অর্থ "পরের তুলনায় জল এক সেকেন্ড" নয়, তবে পরিবর্তনের প্রতিটি অনন্য উত্সের জন্য একটি পরিমাপ - যেমন বছরের পর বছর পরিবর্তনের। এক বছরের উপরে এক পরিমাপ, অন্য বছরের সাথে আরও একটি পরিমাপ দুটি নমুনা গঠন করে। আপনার কাছে যদি 4,000 বছর ভাল ডেটা না থাকে তবে আপনার কাছে সম্ভবত ডেটাতে 1000 বছরের বন্যা নেই। ভাল জিনিসটি হ'ল - ভাল ফলাফল পেতে আপনার এত বেশি ডেটার দরকার নেই।

কম ডেটা দিয়ে কীভাবে আরও ভাল ফলাফল পাবেন তা এখানে:
আপনি যদি বার্ষিক ম্যাক্সিমার দিকে নজর দেন তবে আপনি বছরের সর্বোচ্চ-স্তরের 200 মানগুলিতে "চূড়ান্ত মান বিতরণ" ফিট করতে পারেন এবং আপনার কাছে 1000 বছরের বন্যার উপস্থিতি রয়েছে পর্যায়ের। এটি বীজগণিত হবে, আসল "এটি কত বড়" নয়। 1000 বছরের বন্যা কতটা বড় হবে তা নির্ধারণ করতে আপনি এই সমীকরণটি ব্যবহার করতে পারেন। তারপরে, সেই পরিমাণ পরিমাণ জল দেওয়া - আপনি এটি প্রতিরোধের জন্য আপনার সেতুটি তৈরি করতে পারেন। সঠিক মানের জন্য অঙ্কুর করবেন না, বড় অঙ্কুর, অন্যথায় আপনি এটি 1000 বছরের বন্যায় ব্যর্থ হওয়ার জন্য ডিজাইন করছেন। আপনি যদি সাহসী হন, তবে আপনি প্রতিরোধের জন্য এটি তৈরি করতে আপনাকে সঠিক 1000 বছরের মানের চেয়ে কত বেশি পরিমাণ নির্ধারণ করতে হবে তা বোঝার জন্য আপনি পুনরায় মডেলিং ব্যবহার করতে পারেন।

এখানে কেন ইভি / জিইভি প্রাসঙ্গিক বিশ্লেষণাত্মক ফর্ম:
সাধারণীকরণের চূড়ান্ত মান বিতরণ সর্বাধিক পরিমাণে পরিবর্তিত হয় is সর্বাধিকের ভিন্নতা গড়ের পরিবর্তনের চেয়ে সত্যই ভিন্ন আচরণ করে। সাধারণ বন্টন, কেন্দ্রীয় সীমা উপপাদ্য মাধ্যমে, অনেক "কেন্দ্রীয় প্রবণতা" বর্ণনা করে।

পদ্ধতি:

  1. নিম্নলিখিত 1000 বার করুন:
    i। মানক সাধারণ বিতরণ থেকে 1000 নম্বর চয়ন করুন
    ii। সেই গ্রুপের স্যাম্পলগুলির সর্বাধিক গণনা করুন এবং এটি সংরক্ষণ করুন
  2. এখন ফলাফল বিতরণের পরিকল্পনা করুন

    #libraries
    library(ggplot2)
    
    #parameters and pre-declarations
    nrolls <- 1000
    ntimes <- 10000
    store <- vector(length=ntimes)
    
    #main loop
    for (i in 1:ntimes){
    
         #get samples
         y <- rnorm(nrolls,mean=0,sd=1)
    
         #store max
         store[i] <- max(y)
    }
    
    #plot
    ggplot(data=data.frame(store), aes(store)) + 
         geom_histogram(aes(y = ..density..),
                        col="red", 
                        fill="green", 
                        alpha = .2) + 
         geom_density(col=2) + 
         labs(title="Histogram for Max") +
         labs(x="Max", y="Count")
    

এটি "স্ট্যান্ডার্ড সাধারণ বিতরণ" নয়: এখানে চিত্র বর্ণনা লিখুন

শিখরটি 3.2 এ রয়েছে তবে সর্বোচ্চটি 5.0 এর দিকে যায়। এটা স্কিউ আছে। এটি প্রায় 2.5 এর নিচে পাবেন না। যদি আপনার কাছে প্রকৃত ডেটা (মানক আদর্শ) থাকে এবং আপনি কেবল লেজটি বাছাই করেন, তবে আপনি অবিচ্ছিন্নভাবে এ বক্ররেখার সাথে কিছু বাছাই করছেন। আপনি যদি ভাগ্যবান হন তবে আপনি নীচের লেজের দিকে নয় বরং কেন্দ্রের দিকে। ইঞ্জিনিয়ারিং ভাগ্যের বিপরীত সম্পর্কে - এটি প্রতিটি সময় নিয়মিতভাবে কাঙ্ক্ষিত ফলাফল অর্জনের বিষয়ে। "সুযোগ এড়াতে এলোমেলো সংখ্যাগুলি খুব বেশি গুরুত্বপূর্ণ " (পাদটীকা দেখুন), বিশেষত ইঞ্জিনিয়ারের জন্য। বিশ্লেষণমূলক ফাংশন পরিবার যা এই ডেটার সাথে সবচেয়ে ভাল ফিট করে - বিতরণের চরম মূল্য পরিবার।

নমুনা ফিট: ধরা
যাক যে আমাদের কাছে স্ট্যান্ডার্ড সাধারণ বিতরণ থেকে বছরের সর্বোচ্চ সর্বোচ্চ 200 টি এলোমেলো মান রয়েছে এবং আমরা ভান করতে যাচ্ছি যে এটি আমাদের 200 বছরের সর্বোচ্চ পানির স্তরের ইতিহাস (যার অর্থ যাই হোক না কেন)। বিতরণ পেতে আমরা নিম্নলিখিতগুলি করব:

  1. "স্টোর" ভেরিয়েবল নমুনা (সংক্ষিপ্ত / সহজ কোড তৈরি করতে)
  2. একটি সাধারণীকরণ চরম মান বিতরণ ফিট
  3. বিতরণের মাধ্যমটি সন্ধান করুন
  4. গড়ের পরিবর্তনে 95% সিআই উচ্চতর সীমা জানতে বুটস্ট্র্যাপিং ব্যবহার করুন, যাতে আমরা তার জন্য আমাদের প্রকৌশলকে লক্ষ্য করতে পারি।

(উপরের কোডগুলি প্রথমে চালিত হয়েছে)

library(SpatialExtremes) #if it isn't here install it, it is the ev library
y2 <- sample(store,size=200,replace=FALSE)  #this is our data

myfit <- gevmle(y2)

এটি ফলাফল দেয়:

> gevmle(y2)    
       loc      scale      shape     
 3.0965530  0.2957722 -0.1139021     

20,000 নমুনা তৈরি করতে এগুলি উত্পাদক কার্যে প্লাগ করা যেতে পারে

y3 <- rgev(20000,loc=myfit[1],scale=myfit[2],shape=myfit[3])

নিম্নলিখিতটি নির্মাণে যে কোনও বছরে 50/50 টি ব্যর্থতার প্রতিক্রিয়া দেওয়া হবে:

গড় (y3)
3.23681

1000 বছরের "বন্যা" স্তরটি কী তা নির্ধারণ করার জন্য এখানে কোডটি দেওয়া হচ্ছে:

p1000 <- qgev(1-(1/1000),loc=myfit[1],scale=myfit[2],shape=myfit[3])
p1000

এই নিম্নলিখিতটি তৈরি করা আপনাকে 1000 বছরের বন্যায় ব্যর্থতার 50/50 মতবিরোধ দিতে হবে।

p1000
4.510931

95% উচ্চতর সিআই নির্ধারণ করতে আমি নিম্নলিখিত কোডটি ব্যবহার করেছি:

myloc <- 3.0965530
myscale <- 0.2957722
myshape <- -0.1139021

N <- 1000
m <- 200
p_1000 <- vector(length=N)
yd <- vector(length=m)

for (i in 1:N){

      #generate samples
    yd <- rgev(m,loc=myloc,scale=myscale,shape=myshape)

    #compute fit
    fit_d <- gevmle(yd)

    #compute quantile
    p_1000[i] <- qgev(1-(1/1000),loc=fit_d[1],scale=fit_d[2],shape=fit_d[3])

}

mytarget <- quantile(p_1000,probs=0.95)

ফলাফল ছিল:

> mytarget
     95% 
4.812148

এর অর্থ হ'ল, 1000 বছরের বন্যার বিশাল সংখ্যাগরিষ্ঠতা প্রতিরোধ করার জন্য, আপনার ডেটা নিখরচায় স্বাভাবিক (সম্ভবত নয়) এর জের ধরে, আপনার অবশ্যই এটি তৈরি করতে হবে ...

> out <- pgev(4.812148,loc=fit_d[1],scale=fit_d[2],shape=fit_d[3])
> 1/(1-out)

অথবা

> 1/(1-out)
   shape 
1077.829 

... 1078 বছরের বন্যা।

নিন্ম রেখাগুলো:

  • আপনার কাছে ডেটার একটি নমুনা রয়েছে, প্রকৃত মোট জনসংখ্যা নয়। তার মানে আপনার কোয়ান্টাইলগুলি অনুমান, এবং বন্ধ হতে পারে।
  • সাধারণ চূড়ান্ত মান বিতরণের মতো বিতরণগুলি প্রকৃত লেজগুলি নির্ধারণ করতে নমুনাগুলি ব্যবহার করতে নির্মিত হয়। আপনার কাছে ক্লাসিক পদ্ধতির জন্য পর্যাপ্ত নমুনা না থাকলেও নমুনার মানগুলি ব্যবহার করার চেয়ে তারা খুব কম খারাপভাবে অনুমান করে।
  • আপনি যদি দৃust় হন তবে সিলিংটি উচ্চতর, তবে এর ফলাফলটি - আপনি ব্যর্থ হন না।

ভাগ্য সুপ্রসন্ন হোক

পুনশ্চ:

  • শুনেছি কিছু সিভিল ইঞ্জিনিয়ারিং ডিজাইন 98.5 তম পার্সেন্টাইলকে লক্ষ্য করে। আমরা যদি সর্বাধিকের পরিবর্তে 98.5 তম পার্সেন্টাইল গণনা করি, তবে আমরা বিভিন্ন পরামিতিগুলির সাথে একটি পৃথক বক্ররেখা পেয়েছি। আমি মনে করি এটি 67 বছরের ঝড় তুলতে চাই। এখানে অভিব্যক্তিটি 67 বছরের ঝড়ের জন্য বিতরণ সন্ধান করা হবে, তারপরে গড়ের পার্থক্যটি নির্ধারণ করা হবে এবং প্যাডিংটি পাবেন যাতে এটি 67 তম বছরে সফল হওয়ার জন্য ইঞ্জিনিয়ার হয় is এতে ব্যর্থ হওয়ার পরিবর্তে ঝড়।
    1/(1-0,985)67
  • পূর্ববর্তী পয়েন্টটি দেওয়া, গড়ে প্রতি 67 বছর অন্তর সিভিল লোকদের পুনর্নির্মাণ করতে হবে। নাগরিক কাঠামোর অপারেশনাল জীবন দেওয়া (তাই আমি জানি না যে এটি কী তা) প্রতি 67 বছর পরে ইঞ্জিনিয়ারিং এবং নির্মাণের পুরো ব্যয়ে, কোনও কোনও সময় এটি আন্তঃ-ঝড়ের জন্য ইঞ্জিনিয়ারের জন্য কম ব্যয়বহুল হতে পারে। একটি টেকসই নাগরিক অবকাঠামো হ'ল ব্যর্থতা ছাড়াই কমপক্ষে একজন মানুষের জীবনকাল স্থায়ী করার জন্য ডিজাইন করা হয়েছে, তাই না?

PS: আরও মজা - একটি ইউটিউব ভিডিও (আমার নয়)
https://www.youtube.com/watch?v=EACkiMRT0pc

পাদটীকা: কোভ্যউ, রবার্ট আর। "এলোমেলো সংখ্যার জেনারেশনকে সুযোগ থেকে দূরে রাখা খুব গুরুত্বপূর্ণ" " প্রয়োগিত সম্ভাবনা এবং মন্টে কার্লো পদ্ধতি এবং গতিবিদ্যার আধুনিক দিক। প্রয়োগ গণিত 3 (1969) অধ্যয়ন: 70-111।


2
আমি যথেষ্ট পরিষ্কার হতে পারে না। আমার মূল উদ্বেগ হ'ল কেন ডেটা ফিট করার extreme value distributionচেয়ে ব্যবহার করুন the overall distributionএবং 98.5% মান পাবেন।
cqcn1991

সামগ্রিক জনসংখ্যা বলতে কী বোঝ?
কেজেটিল বি হালওয়ারসেন


2
@ এঙ্গারস্টুডেন্ট দুর্দান্ত উত্তর, তবে আপনি চিত্র প্রদর্শন করার পাশাপাশি সাধারণ বিতরণ ব্যবহারের চেয়ে এখানে কীভাবে ইভিটি কাজ করে তা আরও ভাল দেখানো হবে be
টিম

2
কিছু মডেলিংয়ের কাজ করার পরে, আমি বলব যে পিতামাতাকে বিতরণ করা কেবল বিপজ্জনক, কারণ চূড়ান্ত ইভেন্টগুলির মডেলিংয়ের জন্য ডেটা খুব কম, এবং এক্সট্রাপোলেশন কেবল বিপজ্জনক এবং অস্থির। এবং সেভাবে আমাদের পরিবর্তে ইভি থিওরিটি ব্যবহার করা উচিত।
cqcn1991

7

আপনি পর্যবেক্ষণ করা ডেটা থেকে এক্সট্রপোলেট করতে চরম মান তত্ত্ব ব্যবহার করেন । প্রায়শই, আপনার কাছে থাকা ডেটা যথেষ্ট পরিমাণে বড় নয় আপনাকে একটি লেজ সম্ভাবনার বুদ্ধিমান অনুমান সরবরাহ করতে। @ ইনগ্রস্টুডেন্টের 1-ইন-1000 বছরের ইভেন্টের উদাহরণ গ্রহণ করা: এটি একটি বিতরণের 99.9% কোয়ান্টাইল সন্ধানের সাথে মিলে যায়। তবে যদি আপনার কাছে কেবল 200 বছরের ডেটা থাকে তবে আপনি কেবল 99.5% পর্যন্ত অনুমিত পরিমাণের হিসাব গণনা করতে পারেন।

চরম মান তত্ত্ব আপনাকে লেজের মধ্যে আপনার বিতরণের আকার সম্পর্কে বিভিন্ন ধরণের ধারণা অনুমান করে 99.9% কোয়ান্টাইলের অনুমান করতে দেয় : এটি মসৃণ, এটি একটি নির্দিষ্ট প্যাটার্ন দিয়ে ক্ষয় করে, ইত্যাদি।

আপনি ভাবছেন যে 99.5% এবং 99.9% এর মধ্যে পার্থক্যটি সামান্য; এটি সর্বোপরি কেবল 0.4%। তবে এটি সম্ভাবনার পার্থক্য এবং আপনি যখন লেজে থাকবেন তখন এটি কোয়ান্টাইলগুলিতে একটি বিশাল পার্থক্যে অনুবাদ করতে পারে । গামা বিতরণের জন্য এটি দেখতে কেমন লাগে তার একটি চিত্র এখানে দেওয়া হয়েছে, যার জিনিসগুলির মতো খুব দীর্ঘ লেজ নেই। নীল রেখাটি 99.5% কোয়ান্টাইলের সাথে মিলে যায় এবং লাল রেখাটি 99.9% কোয়ান্টাইল। এইগুলির মধ্যে পার্থক্যটি উল্লম্ব অক্ষের সাথে সামান্য হলেও, অনুভূমিক অক্ষের বিভাজন যথেষ্ট। এই বিচ্ছেদটি কেবল সত্যিকারের দীর্ঘ-লেজযুক্ত বিতরণের জন্য আরও বড় হয়; গামা আসলে একটি মোটামুটি নির্দোষ ঘটনা।

এখানে চিত্র বর্ণনা লিখুন


আপনার উত্তরটি ভুল। একটি বার্ষিক স্বাভাবিক মৃত্যুর 99.9% পয়েন্ট 1000 বছরের ইভেন্টে 1 এর সাথে মিলে যায় না। সর্বাধিক 1000 নরমালগুলির একটি আলাদা বিতরণ রয়েছে। আমি মনে করি এটি অন্য উত্তরে সম্বোধিত।
মার্ক এল স্টোন

@ মার্কএল.স্টোন কোথাও সর্বাধিক 1000 নরমাল সম্পর্কে আমি কিছু বলিনি।
হংক ওওই

1
এটাই আমার বক্তব্য। 1000 বছরের ইভেন্টে 1 টি সর্বোচ্চ 1000 বার্ষিক স্বাভাবিকের উপর ভিত্তি করে হওয়া উচিত। এটি একটি বার্ষিক সাধারণের 99.9 $ পয়েন্টের থেকে খুব আলাদা। নীচে কারেল ম্যাসেকের উত্তরটি সম্পর্কে আমার মন্তব্য দেখুন।
মার্ক এল। স্টোন

@ মার্কএল.স্টোন গ্রাফের বিন্দুটি কেবলমাত্র এটি দেখানোর জন্য যে আপনি যখন লেজটিতে থাকবেন তখন সম্ভাবনার ক্ষেত্রে ছোট পরিবর্তনগুলি কোয়ান্টাইলগুলিতে বড় পরিবর্তনের সাথে মিলে যায়। আপনি একটি জিইভি, বা একটি জিপিডি, বা অন্য কোনও বিতরণের 99% কোয়ান্টাইল প্রতিস্থাপন করতে পারেন। (এবং আমি সাধারণ
বিতরণটির

এছাড়াও, জিইভি দিয়ে ম্যাক্সিমার অনুমান করা লেজ কোয়ান্টাইলগুলি পাওয়ার একমাত্র উপায়। অন্য উপায়টি হ'ল জিপিডির মাধ্যমে সরাসরি কোয়ান্টাইলগুলি অনুমান করা (ভারী লেজযুক্ত বিতরণ অনুমান করে)।
হংক ওয়

7

আপনি যদি কেবল কোনও লেজের প্রতি আগ্রহী হন তবে এটি আপনার কাছে ডেটা সংগ্রহ এবং লেজের উপর বিশ্লেষণের প্রচেষ্টাকে ফোকাস করে তোলে sense এটি করার জন্য এটি আরও দক্ষ হওয়া উচিত। আমি ডেটা সংগ্রহের উপর জোর দিয়েছি কারণ ইভিটি বিতরণের পক্ষে যুক্তি উপস্থাপন করার সময় এই দিকটি প্রায়শই উপেক্ষা করা হয়। আসলে, আপনি কিছু ক্ষেত্রে সামগ্রিক বিতরণ কী বলে তা অনুমান করার জন্য প্রাসঙ্গিক ডেটা সংগ্রহ করা অপরিহার্য হতে পারে । আমি নীচে আরও বিস্তারিত ব্যাখ্যা করব।

যদি আপনি @ এঞ্জারস্টুডেন্টের উদাহরণের মতো 1000 বছরের বন্যার দিকে তাকিয়ে থাকেন তবে সাধারণ বিতরণটির বডিটি তৈরি করতে আপনার পর্যবেক্ষণগুলি পূরণ করার জন্য প্রচুর ডেটা প্রয়োজন। বিগত কয়েকশো বছর ধরে সংঘটিত প্রতিটি বন্যার সম্ভাব্য আপনার প্রয়োজন।

এবার এক সেকেন্ডের জন্য থামুন এবং ভাবুন ঠিক বন্যা আসলে কী? আমার বাড়ির উঠোন যখন ভারী বৃষ্টির পরে প্লাবিত হয় তখন কি এটি বন্যা হয়? সম্ভবত না, তবে ঠিক এমন রেখাটি যেখানে একটি বন্যা নয় এমন কোনও ঘটনা থেকে বন্যাকে বর্ণিত করে? এই সাধারণ প্রশ্নটি ডেটা সংগ্রহের মাধ্যমে বিষয়টি হাইলাইট করে। আপনি কীভাবে নিশ্চিত করতে পারেন যে আমরা কয়েক দশক ধরে বা শতাব্দী এমনকি শতাব্দী ধরে একই মান অনুসরণ করে শরীরের সমস্ত ডেটা সংগ্রহ করি? বন্যার বিতরণের শরীরে ডেটা সংগ্রহ করা কার্যত অসম্ভব।

তাই, এটি শুধুমাত্র একটি ব্যাপার দক্ষতা এর বিশ্লেষণ কিন্তু একটি ব্যাপার সম্ভাব্যতা ডেটার সংগ্রহ : পুরো বন্টন বা শুধু একটি লেজ মডেল কিনা?

স্বাভাবিকভাবেই, লেজগুলির সাহায্যে ডেটা সংগ্রহ খুব সহজ is যদি আমরা বিশাল বন্যার জন্য উচ্চ পর্যায়ে প্রান্তিক সংজ্ঞা নির্ধারণ করি তবে আমাদের আরও বেশি সম্ভাবনা থাকতে পারে যে সমস্ত বা প্রায় সমস্ত ঘটনা সম্ভবত কোনওভাবে রেকর্ড করা আছে। একটি বিধ্বংসী বন্যা মিস করা কঠিন, এবং যদি কোনও ধরণের সভ্যতা উপস্থিত থাকে তবে ইভেন্টটি সম্পর্কে কিছু স্মৃতি সংরক্ষণ করা হবে। সুতরাং এটি বিশ্লেষণমূলক সরঞ্জামগুলি তৈরি করার একটি ধারণা তৈরি করে যা লেজগুলিতে বিশেষভাবে ফোকাস করে যে ডেটা সংগ্রহের ক্ষেত্রে নির্ভরযোগ্যতা অধ্যয়নের মতো অনেক ক্ষেত্রে অ-চূড়ান্ত বিষয়গুলির চেয়ে চূড়ান্ত ইভেন্টগুলিতে বেশি শক্তিশালী।


+1 আকর্ষণীয় এবং সমন্বিত পয়েন্টগুলি, বিশেষত শেষে মন্তব্যে।
whuber

(+1) আপনার শেষ পয়েন্ট সম্পর্কিত (সংরক্ষিত স্মৃতি) সম্পর্কিত, স্যাডলার এফেক্টটি আগ্রহী হতে পারে।
জিওম্যাটট 22

@ জিওম্যাটট 22, আমি প্রথমবারের মতো কাগজটি এবং স্যাডলার এফেক্ট শব্দটি দেখলাম। লিঙ্কটির জন্য ধন্যবাদ
আকসকল

এটি একটি সত্যই চমৎকার পয়েন্ট। এটি একটি সিস্টেম, তাই পদ্ধতিগত পদ্ধতির দুর্দান্ত ফলন হতে পারে। বিশ্বের সেরা বিশ্লেষণে জাঙ্ক ডেটা দিয়ে বিষ প্রয়োগ করা যায়। একটি মোটামুটি সহজ বিশ্লেষণ, যখন ভাল ডেটা খাওয়ানো হয়, দুর্দান্ত ফলাফল পেতে পারে। ভাল দিক!
এনগ্রিস্টুডেন্ট - মনিকা

6

সাধারণত, অন্তর্নিহিত ডেটা বিতরণ (উদাহরণস্বরূপ, গাউসিয়ান বায়ুর গতি) একক নমুনা বিন্দুর জন্য। 98 তম পার্সেন্টাইল আপনাকে বলবে যে কোনও এলোমেলোভাবে নির্বাচিত পয়েন্টের জন্য 98 % পার্সেন্টাইলের চেয়ে বড় হওয়ার 2% সম্ভাবনা রয়েছে।

আমি কোনও সিভিল ইঞ্জিনিয়ার নই, তবে আমি কল্পনা করছিলাম যে আপনি কী জানতে চান যে কোনও দিন একটি নির্দিষ্ট সংখ্যার উপরে বায়ু গতির সম্ভাবনা নয়, তবে সবচেয়ে বড় সম্ভাব্য ঝাঁকুনির বন্টন বলে, বছরের অবশ্যই। সেক্ষেত্রে, যদি প্রতিদিনের বায়ু আস্তানা সর্বাধিক হয়, বলুন, তাত্পর্যপূর্ণভাবে বিতরণ করা হয়, তবে আপনি যা চান তা হ'ল 365 দিনের মধ্যে সর্বাধিক বায়ু অভ্যাসের বিতরণ ... চূড়ান্ত মান বন্টন সমাধানের জন্য এটিই ছিল।


1

কোয়ান্টাইলের ব্যবহার আরও গণনা সহজ করে তোলে। সিভিল ইঞ্জিনিয়াররা তাদের প্রথম-নীতি সূত্রে মানটির (বাতাসের গতি, উদাহরণস্বরূপ) প্রতিস্থাপন করতে পারে এবং তারা 98.5% কোয়ান্টিলের সাথে সঙ্গতিপূর্ণ এমন চরম অবস্থার জন্য সিস্টেমের আচরণ অর্জন করে।

পুরো বিতরণটির ব্যবহার আরও তথ্য সরবরাহ করে বলে মনে হতে পারে তবে গণনাগুলিকে জটিল করে তুলবে। তবে, এটি উন্নত ঝুঁকি-পরিচালনা পদ্ধতির ব্যবহারের অনুমতি দিতে পারে যা (i) নির্মাণের সাথে সম্পর্কিত ব্যয়কে যথাযথভাবে ভারসাম্য বানাবে এবং (ii) ব্যর্থতার ঝুঁকি।


ঠিক আছে ... আমি যথেষ্ট পরিষ্কার হতে পারে না। আমি কেবল জানতে চাই যে আমরা সাধারণত ব্যবহৃত সাধারণ বিতরণ (পুরো বিতরণ?) এর চেয়ে চরম মান তত্ত্বটি কেন ব্যবহার করি?
cqcn1991

1
যদি দৈনিক সর্বাধিক বায়ুর গতির মতো কোনও এক ইনস্ট্যান্টেশনের জন্য সংশ্লেষিত বিতরণ ফাংশনটি F (x) হয়, তবে সর্বাধিক n স্বতন্ত্র ইনস্ট্যানটিশনগুলির জন্য संचयी বিতরণ ফাংশন (যেমন, দৈনিক সর্বাধিক বাতাসের গতি সহ এক বছরের জন্য এন = 365) ) হ'ল F ^ n (x)। এটি এফ (এক্স) এর চেয়ে পৃথক।
মার্ক এল। স্টোন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.