আপনি গণনা ডেটা ব্যবহার করতে পারেন তার জন্য বেশ কয়েকটি যথাযথ এবং কঠোরভাবে সঠিক স্কোরিং নিয়ম রয়েছে। স্কোরিং নিয়মগুলি হ'ল জরিমানা সাথে ভবিষ্যদ্বাণীমূলক বিতরণ এবং পর্যবেক্ষণকৃত মান হিসাবে প্রবর্তিত । তাদের বেশ কয়েকটি পছন্দসই বৈশিষ্ট্য রয়েছে, প্রথম এবং সর্বাগ্রে যে সত্য সম্ভাবনার কাছাকাছি অবস্থিত একটি পূর্বাভাস সর্বদা কম শাস্তি প্রাপ্ত হবে এবং একটি (অনন্য) সর্বোত্তম পূর্বাভাস রয়েছে এবং এটি যখন ভবিষ্যদ্বাণী করা সম্ভাবনাটি সত্য সম্ভাবনার সাথে মিলিত হয়। সুতরাং প্রত্যাশা হ্রাস করার অর্থ সত্য সম্ভাবনার প্রতিবেদন করা। উইকিপিডিয়াও দেখুন ।s(y,P)Pys(y,P)
প্রায়শই সমস্ত হিসাবে পূর্বাভাসিত মানগুলির মধ্যে একটি গড় হয়
S=1n∑ni=1s(y(i),P(i))
কোন নিয়মটি গ্রহণ করা হবে তা আপনার উদ্দেশ্যের উপর নির্ভর করে তবে যখন প্রতিটি ব্যবহার করা ভাল তখন আমি একটি মোটামুটি বৈশিষ্ট্য দেব।
এরপরে আমি ভবিষ্যদ্বাণীমূলক সম্ভাব্য ভর ফাংশন এবং এর পূর্বাভাসমূলক संचयी বিতরণ ফাংশনের জন্য ব্যবহার করি । A গণনা বিতরণের পুরো সমর্থনের উপরে চলে (যেমন, )। একটি সূচক ফাংশন বোঝায়। এবং ভবিষ্যদ্বাণীমূলক বিতরণের গড় এবং মানক বিচ্যুতি (যা সাধারণত গণনা ডেটা মডেলগুলিতে সরাসরি অনুমান পরিমাণ হয়)। f(y)Pr(Y=y)F(y)∑k0,1,…,∞Iμσ
কঠোরভাবে সঠিক স্কোরিংয়ের নিয়ম
- ব্রিয়ার স্কোর : (শ্রেণিবদ্ধ ভবিষ্যদ্বাণীগুলিতে আকারের ভারসাম্যের জন্য স্থিতিশীল)s(y,P)=−2f(y)+∑kf2(k)
- দাউদ-সেবাস্তানী স্কোর : (সাধারণ ভবিষ্যদ্বাণীপূর্ণ মডেল নির্বাচনের জন্য ভাল; বিভাগীয় পূর্বাভাসকারীদের আকারের ভারসাম্যহীনতার জন্য স্থিতিশীল)s(y,P)=(y−μσ)2+2logσ
- ডিভ্যান্স স্কোর : ( ) একটি নরমালাইজেশন টার্ম যা কেবল উপর নির্ভর করে , মডেলগুলিতে এটি সাধারণত স্যাচুরেটেড ডিভ্যান্স হিসাবে গৃহীত হয়; থেকে অনুমানের সাথে ব্যবহারের জন্য ভাল একটি এমএল কাঠামো)s(y,P)=−2logf(y)+gygyy
- লোগারিদমিক স্কোর : (খুব সহজেই গণনা করা হয়; শ্রেণিবদ্ধ ভবিষ্যদ্বাণীগুলিতে আকারের ভারসাম্যের জন্য স্থিতিশীল)s(y,P)=−logf(y)
- সম্ভাব্যতার স্কোর : (খুব উচ্চমানের বিভিন্ন পূর্বাভাসের বিপরীতে ভাল; শ্রেণিবদ্ধ ভবিষ্যদ্বাণীগুলিতে আকারের ভারসাম্যহীনতায় সংবেদনশীল)s(y,P)=∑k{F(k)−I(y≤k)}2
- গোলাকার স্কোর : (শ্রেণিবদ্ধ ভবিষ্যদ্বাণীগুলিতে আকারের ভারসাম্যের জন্য স্থিতিশীল)s(y,P)=f(y)∑kf2(k)√
অন্যান্য স্কোরিং বিধি (এতটা সঠিক না তবে প্রায়শই ব্যবহৃত হয়)
- পরম ত্রুটি স্কোর :(সঠিক নয়)s(y,P)=|y−μ|
- স্কোয়ারড ত্রুটি স্কোর : (কঠোরভাবে যথাযথ নয়; বহিরাগতদের কাছে সংবেদনশীল; বিভাগীয় ভবিষ্যদ্বাণীকারীদের আকারের ভারসাম্যহীনতায় সংবেদনশীল)s(y,P)=(y−μ)2
- পিয়ারসন সাধারণ স্কোয়ার ত্রুটির স্কোর : (কঠোরভাবে যথাযথ নয়; বহিরাগতদের কাছে সংবেদনশীল); গড় স্কোর কিনা তা পরীক্ষা করার জন্য মডেল পরীক্ষা করতে ব্যবহার করা যেতে পারে 1 থেকে খুব আলাদা; শ্রেণিবদ্ধ পূর্বাভাসকারীদের আকারের ভারসাম্যের জন্য স্থিতিশীল)s(y,P)=(y−μσ)2
কঠোরভাবে সঠিক নিয়মের জন্য আর কোডের উদাহরণ:
library(vcdExtra)
m1 <- glm(Freq ~ mental, family=poisson, data=Mental)
# scores for the first observation
mu <- predict(m1, type="response")[1]
x <- Mental$Freq[1]
# logarithmic (equivalent to deviance score up to a constant)
-log(dpois(x, lambda=mu))
# quadratic (brier)
-2*dpois(x,lambda=mu) + sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) })
# spherical
- dpois(x,mu) / sqrt(sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) }))
# ranked probability score
sum(ppois((-1):(x-1), mu)^2) + sum((ppois(x:10000,mu)-1)^2)
# Dawid Sebastiani
(x-mu)^2/mu + log(mu)