আমি ডেটা থেকে ওয়েবেল পরামিতিগুলি কীভাবে নির্ধারণ করতে পারি?


10

আমার কাছে বায়ু গতির ডেটাগুলির একটি হিস্টোগ্রাম রয়েছে যা প্রায়শই একটি ওয়েবেল বিতরণ ব্যবহার করে প্রতিনিধিত্ব করা হয়। আমি ওয়েইবুল আকার এবং স্কেল ফ্যাক্টরগুলি গণনা করতে চাই যা হিস্টোগ্রামকে সেরা ফিট করে।

আমার একটি সংখ্যাসূচক সমাধান প্রয়োজন ( গ্রাফিক সমাধানগুলির বিপরীতে ) কারণ লক্ষ্যটি হ'ল ওয়েবুল ফর্মটি প্রোগ্রামিকভাবে নির্ধারণ করা।

সম্পাদনা করুন: প্রতি 10 মিনিটে নমুনা সংগ্রহ করা হয়, বাতাসের গতি 10 মিনিটেরও বেশি গড়ে হয়। নমুনাগুলিতে প্রতিটি ব্যবধানে রেকর্ড করা সর্বাধিক এবং সর্বনিম্ন বায়ুর গতি অন্তর্ভুক্ত থাকে যা বর্তমানে উপেক্ষা করা হয় তবে আমি পরে যুক্ত করতে চাই। বিন প্রস্থ 0.5 মি / সে

1 মাসের ডেটা হিস্টোগ্রাম


1
যখন আপনি বলছেন যে আপনার কাছে হিস্টোগ্রাম রয়েছে - আপনার অর্থ কি পর্যবেক্ষণগুলি সম্পর্কে তথ্য রয়েছে বা আপনি কেবল বিন প্রস্থ এবং উচ্চতা জানেন?
সানকুলসু

@ সানকুলসু আমার কাছে সমস্ত ডেটা পয়েন্ট রয়েছে। 5,000 থেকে 50,000 রেকর্ড পর্যন্ত ডেটাসেট।
ক্লোনক

আপনি কি ডেটাটির এলোমেলো নমুনা নিতে এবং পরামিতিগুলির একটি এমএলই সম্পাদন করতে পারবেন না?
শেইনকেটাদি

2
অনুমানের উদ্দেশ্য কী? পূর্ববর্তী অবস্থার বৈশিষ্ট্যকে ফিরিয়ে আনতে? ভবিষ্যতে বিদ্যুৎ উৎপাদনের এক জায়গায় ভবিষ্যদ্বাণী করতে? টার্বাইনগুলির একটি গ্রিডের মধ্যে বিদ্যুত্ উত্পাদনের পূর্বাভাস দিতে? একটি আবহাওয়া মডেল ক্যালিব্রেট করতে? ইত্যাদি এই প্রশ্নের জন্য, একটি উপযুক্ত সমাধান নির্ধারণ এটি কীভাবে ব্যবহৃত হবে তার উপর সমালোচনা নির্ভর করে।
হোবার

@ বর্তমানে এই ধারণাটি হ'ল একটি বায়ু ডেটা সেটগুলি সংক্ষিপ্ত করে ফর্মের মধ্যে যা পর্যায়ক্রমে এবং / অথবা সাইট থেকে অন্য স্থানে তুলনা করে। পরে লক্ষ্যটি ট্রেন্ডগুলির সাথে তুলনা করা হবে এবং আপনি যেমন ভবিষ্যতের উত্পাদন ইত্যাদি হিসাবে রায় গঠনের কথা বলছেন, আমি পরিসংখ্যানের জন্য খুব বেশি নবাগত কিন্তু আমার কাছে ডেটা পর্বত রয়েছে (যা আমি ভাগ করতে পারছি না) এবং এটির মত বের করতে চাই এটি থেকে অনেক তথ্য সম্ভব। আপনি যদি আমাকে এই বিষয়ে কোনও পড়ার দিকে নির্দেশ করতে পারেন তবে এটি অনেক প্রশংসা হবে।
ক্লোনক

উত্তর:


11

ওয়েইবুল প্যারামিটারগুলির সর্বাধিক সম্ভাবনার অনুমান আপনার ক্ষেত্রে ভাল ধারণা হতে পারে। ওয়েইবুল বিতরণের একটি ফর্ম এর মতো দেখাচ্ছে:

(γ/θ)(x)γ1exp(xγ/θ)

যেখানে পরামিতি। দেওয়া হয়েছে , লগ-সম্ভাবনা ফাংশনθ,γ>0X1,,Xn

L(θ,γ)=i=1nlogf(Xi|θ,γ)

একটি "প্রোগ্রামিং ভিত্তিক" সমাধান সীমাবদ্ধ অপ্টিমাইজেশন ব্যবহার করে এই ফাংশনটি অনুকূল করা হবে। সর্বোত্তম সমাধানের জন্য সমাধান:

logLγ=nγ+1nlogxi1θ1nxiγlogxi=0
logLθ=nθ+1θ21nxiγ=0

বর্জন করার সময় আমরা পাই:θ

[1nxiγlogxi1nxiγ1γ]=1n1nlogxi

এমএল অনুমান জন্য এখন এটি সমাধান করা যেতে পারে । এটি স্ট্যান্ডার্ড পুনরাবৃত্তির প্রক্রিয়াগুলির সাহায্যে সম্পন্ন করা যায় যা সমাধানগুলি সমীকরণের সমাধান যেমন - নিউটন-রেফসন বা অন্যান্য সংখ্যাসহ প্রক্রিয়াগুলির সমাধান খুঁজতে ব্যবহৃত হয়।γ^

এখন ক্ষেত্রে পাওয়া যাবে :θγ^

θ^=1nxiγ^n

একটি জিনিস সম্পর্কে আমি সতর্ক থাকব তা হ'ল আমাদের কাছে সময়-সিরিজের ডেটা রয়েছে বলে মনে হচ্ছে। যদি অল্প সময়ের মধ্যে ডেটা নমুনা করা হয় তবে ধরে নেওয়া স্বাধীনতা বিপজ্জনক হতে পারে। বলেছে, (+1)।
কার্ডিনাল

@ কার্ডিনাল দয়া করে ব্যাখ্যা করুন। ডেটা এক মাস বা এক বছরের বেশি সময় ধরে থাকে তবে নিয়মিত (10 মিনিট) নমুনা দেওয়া হয়। এটি কি বোঝাতে পারে?
ক্লোনক

এটি দেখানোর জন্য @ কার্ডিনালাল ধন্যবাদ। স্বাধীনতার অনুমান যথাযথ কিনা তা আমি নিশ্চিত ছিলাম না।
সানকুলসু

1
@ ক্লোনক, নমুনা কীভাবে নেওয়া হয়? রেকর্ডিংয়ের মধ্যে দশ মিনিটের মধ্যে এটি কি গড় গতি? রেকর্ডিংয়ের এক মিনিটেরও আগে? রেকর্ডিংয়ের সময় তাত্ক্ষণিক গতি? বেশিরভাগ ক্ষেত্রে আমি ক্রমিক সম্পর্কিত সম্পর্কগুলি খুঁজছি যা আপনার কার্যকর নমুনার আকারকে যথেষ্ট পরিমাণে হ্রাস করতে পারে। স্বাধীন নমুনাগুলির অনুমানের ভিত্তিতে এমএল অনুমান ব্যবহার করা আপনাকে সেই প্রসঙ্গে এখনও একটি ভাল অনুমান দিতে পারে বা নাও পারে এবং অনুমানের ভিত্তিতে কোনও অনুমানের বিষয়ে বিশেষ যত্ন নেওয়া উচিত । যদিও সানকুলসু এর পন্থা অবশ্যই আক্রমণটির প্রথম লাইন সরবরাহ করে।
কার্ডিনাল

@ ক্লোনক - যদি সম্ভব হয় তবে আপনি কীভাবে আপনার নমুনা সংগ্রহ করেছিলেন তা বর্ণনা করতে পারবেন? ডেটা দেখতে কেমন?
সানকুলসু

12

ফিটডিজারপ্লাস ব্যবহার করুন:

এর হিস্টোগ্রাম দ্বারা একটি বিতরণ সনাক্তকরণে সহায়তা প্রয়োজন

ওয়েইবুল বিতরণ কীভাবে উপযুক্ত এটির একটি উদাহরণ এখানে:

library(fitdistrplus)

#Generate fake data
shape <- 1.9
x <- rweibull(n=1000, shape=shape, scale=1)

#Fit x data with fitdist
fit.w <- fitdist(x, "weibull")
summary(fit.w)
plot(fit.w)


Fitting of the distribution ' weibull ' by maximum likelihood 
Parameters : 
       estimate Std. Error
shape 1.8720133 0.04596699
scale 0.9976703 0.01776794
Loglikelihood:  -636.1181   AIC:  1276.236   BIC:  1286.052 
Correlation matrix:
          shape     scale
shape 1.0000000 0.3166085
scale 0.3166085 1.0000000

এখানে চিত্র বর্ণনা লিখুন


ধন্যবাদ, তবে আমি জাভাতে একটি সমাধান সন্ধান করার চেষ্টা করছি।
ক্লোনক

আকৃতি এবং স্কেল ফ্যাক্টরগুলি পেতে কোডিংয়ের কোনও পয়েন্টার? ধন্যবাদ।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.