টি এল; ডিআর
যথার্থতা একটি অযৌক্তিক স্কোরিং নিয়ম। এটি ব্যবহার করবেন না।
সামান্য দীর্ঘ সংস্করণ
আসলে, নির্ভুলতা এমনকি একটি স্কোরিং নিয়ম নয়। সুতরাং এটি (কঠোরভাবে) যথাযথ কিনা তা জিজ্ঞাসা করা বিভাগের ত্রুটি। সর্বাধিক আমরা বলতে পারি অতিরিক্ত অনুমানের অধীনে নির্ভুলতা একটি স্কোরিং নিয়মের সাথে সামঞ্জস্যপূর্ণ যা অনুচিত, বিচ্ছিন্ন এবং বিভ্রান্তিকর। (এটি ব্যবহার করবেন না।)
আপনার বিভ্রান্তি
আপনার বিভ্রান্তিটি এই সত্যটি থেকে উদ্ভূত হয়েছে যে আপনি যে কাগজটি উদ্ধৃত করেছেন তার অনুসারে ভুল শংসাপত্রের ক্ষতি কোনও স্কোরিং নিয়ম নয়।
বিশদ: স্কোরিং বিধি বনাম শ্রেণিবদ্ধকরণ মূল্যায়ন
আসুন পরিভাষা ঠিক করি। আমরা বাইনারি ফলাফলের জন্য interested তে আগ্রহী , এবং আমাদের একটি সম্ভাব্য ভবিষ্যদ্বাণী রয়েছে । আমরা জানি যে , তবে আমাদের মডেল তা জানতে পারে বা নাও পারে।থ = পি ( ওয়াই = 1 ) ∈ ( 0 , 1 ) পি ( ওয়াই = 1 ) = η > 0.5 কুইy∈{0,1}qˆ=Pˆ(Y=1)∈(0,1)P(Y=1)=η>0.5qˆ
একটি স্কোরিং নিয়ম এমন একটি ম্যাপিং যা একটি সম্ভাব্য ভবিষ্যদ্বাণী an এবং ক্ষতি পরিণতি গ্রহণ করে, Yqˆy
s:(qˆ,y)↦s(qˆ,y).
কুই = η গুলি কুই = ηs নয় সঠিক যদি এটি দ্বারা মনে মনে আশা অপ্টিমাইজ করা হয় । ( "অনুকূল" সাধারণত এর অর্থ "মিনিমাইজ", কিন্তু কিছু লেখক উল্টানো আমার নিদর্শনাবলী ও স্কোরিং নিয়ম বাড়ানোর লক্ষ্যে চেষ্টা করুন।) হল কঠোরভাবে সঠিক যদি এটা মনে আশা অপ্টিমাইজ করা হয় শুধুমাত্র দ্বারা ।qˆ=ηsqˆ=η
আমরা সাধারণত মূল্যায়ন করবে অনেক ভবিষ্যৎবাণী উপর এবং সংশ্লিষ্ট ফলাফল এবং গড় এই প্রত্যাশা অনুমান করার জন্য।sqˆiyi
এখন, সঠিকতা কি ? যথার্থতা একটি যুক্তি হিসাবে কোনও সম্ভাব্য ভবিষ্যদ্বাণী গ্রহণ করে না। এটিyˆ∈{0,1} এবং একটি ফলাফলের একটি শ্রেণিবদ্ধকরণ takes নেয় :
a:(yˆ,y)↦a(yˆ,y)={1,0,yˆ=yyˆ≠y.
অতএব, নির্ভুলতা কোনও স্কোরিং নিয়ম নয় । এটি একটি শ্রেণিবিন্যাস মূল্যায়ন। (এটি একটি শব্দ যা আমি সবেমাত্র উদ্ভাবন করেছি; সাহিত্যে এটি সন্ধান করবেন না))
এখন, অবশ্যই আমরা আমাদের মত একটি সম্ভাব্য ভবিষ্যদ্বাণী নিতে পারেন এবং এটি একটি শ্রেণীবিন্যাস পরিণত । তবে এটি করার জন্য আমাদের উপরে অতিরিক্ত অনুমানের প্রয়োজন হবে। উদাহরণস্বরূপ, একটি থ্রেশহোল্ড এবং শ্রেণিবদ্ধকরণ ব্যবহার করা খুব সাধারণ :qˆyˆθ
yˆ(qˆ,θ):={1,0,qˆ≥θqˆ<θ.
একটি খুব সাধারণ প্রান্তিক মান । মনে রাখবেন যে আমরা যদি এই প্রান্তিকতাটি ব্যবহার করি এবং তারপরে অনেকগুলি পূর্বাভাস (উপরে হিসাবে) এবং এর সাথে সম্পর্কিত ফলাফলগুলি সাথে মূল্যায়ন করি, তবে আমরা বুজা এট আল অনুসারে ভুল সংশোধন ক্ষতির কাছে এসে পৌঁছেছি। সুতরাং, ভুল শ্রেণিবদ্ধকরণ ক্ষতি এছাড়াও একটি স্কোরিং নিয়ম নয়, তবে একটি শ্রেণিবিন্যাস মূল্যায়ন।θ=0.5qˆiyi
যদি আমরা উপরের মতো একটি শ্রেণিবিন্যাস অ্যালগরিদম গ্রহণ করি, তবে আমরা একটি শ্রেণিবিন্যাস মূল্যায়নকে স্কোরিং নিয়মে পরিণত করতে পারি। বিষয়টি হ'ল আমাদের শ্রেণিবদ্ধের অতিরিক্ত অনুমানের প্রয়োজন। এবং সেই নির্ভুলতা বা ভুল শ্রেণিবদ্ধকরণ ক্ষতি বা অন্য যে কোনও শ্রেণিবিন্যাসের মূল্যায়ন আমরা বেছে নিই তারপরে সম্ভাব্যতা পূর্বাভাস on এর উপর নির্ভর করে এবং কে আমরা একটি শ্রেণিবদ্ধকরণে পরিণত করি । সুতরাং শ্রেণীবিন্যাস মূল্যায়ন নিখুঁত একটি লাল হেরিং পর পশ্চাদ্ধাবন হতে পারে যদি আমরা সত্যিই মূল্যায়নের আগ্রহী ।qˆqˆyˆ=yˆ(qˆ,θ)qˆ
এখন, এই স্কোরিং-বিধিগুলি-অধীনে-অতিরিক্ত-অনুমানগুলি সম্পর্কে কী অনুচিত? কিছুই নেই, বর্তমান ক্ষেত্রে। , অন্তর্নিহিত অধীনে , যথাসম্ভবকে সর্বাধিকীকরণ করবে এবং সমস্ত সম্ভাব্য উপরে ভুল গতিবিধি ক্ষতি হ্রাস করবে । সুতরাং এই ক্ষেত্রে, আমাদের স্কোরিং-নিয়ম-অতিরিক্ত-অতিরিক্ত অনুমানগুলি যথাযথ।qˆ=ηθ=0.5qˆ∈(0,1)
দ্রষ্টব্য যে নির্ভুলতা বা ভুল শ্রেণিবদ্ধেরyˆ ক্ষতির জন্য যা গুরুত্বপূর্ণ তা কেবল একটি প্রশ্ন: আমরা কি ( ) সবকিছুকে সংখ্যাগরিষ্ঠ শ্রেণি হিসাবে শ্রেণিবদ্ধ করি বা করি না? যদি আমরা এটি করি, নির্ভুলতা বা ভুল শংসাপত্র ক্ষতি খুশি। যদি না হয়, তারা না। কি এই প্রশ্নের সম্পর্কে গুরুত্বপূর্ণ এটা মান একমাত্র একটি খুব স্থায়ী সংযোগ রয়েছে ।qˆ
ফলস্বরূপ, আমাদের স্কোরিং-বিধিগুলি-অতিরিক্ত-অতিরিক্ত অনুমানগুলি কঠোরভাবে যথাযথ নয়, কারণ কোনও একই শ্রেণিবিন্যাসের মূল্যায়নের দিকে পরিচালিত করবে। আমরা স্ট্যান্ডার্ড ব্যবহার করতে পারি , বিশ্বাস করি যে সংখ্যাগরিষ্ঠ শ্রেণি এবং সমস্ত কিছুকে সংখ্যাগরিষ্ঠ শ্রেণি হিসাবে শ্রেণিবদ্ধকরণ করে কারণ । যথার্থতা উচ্চ, কিন্তু আমরা আমাদের উন্নত করতে কোন উদ্দীপক আছে সঠিক মান ।θ=0.5 কুই =0.99 কুই ≥θ কুই ηqˆ≥θθ=0.5qˆ=0.99qˆ≥θqˆη
অথবা আমরা ভুল বিভাজন সম্পর্কিত অসামান্য ব্যয়ের একটি বিস্তৃত বিশ্লেষণ করেছি এবং সিদ্ধান্ত নিয়েছি যে সর্বোত্তম শ্রেণিবিন্যাসের সম্ভাবনার প্রান্তটি আসলে হওয়া উচিত । উদাহরণস্বরূপ, যদি অর্থ আপনি কোনও রোগে ভুগছেন তবে এটি ঘটতে পারে । আপনার চিকিত্সা করা আরও ভাল হতে পারে যদি আপনি এই রোগের ( ) এর আশেপাশে অন্য উপায়ের চেয়ে না তবে এটি কম অনুমানিত সম্ভাবনা (ছোট থাকলেও লোকদের চিকিত্সা করা বুদ্ধিমান হতে পারে ) তারা এতে ভোগে। আমাদের তখন ভয়াবহরূপে ভুল মডেল থাকতে পারে যা বিশ্বাস করে যে প্রকৃত সংখ্যাগরিষ্ঠ শ্রেণি কেবলমাত্র দিয়ে ঘটেY = 1 Y = 0 কুই কুই = 0.25 কুই ≥ θθ=0.2y=1y=0qˆqˆ=0.25- তবে ভুল শ্রেণিবদ্ধকরণের ব্যয়ের কারণে আমরা এখনও সবকিছুকে এটিকে (ধরে নেওয়া) সংখ্যালঘু শ্রেণি হিসাবে শ্রেণিবদ্ধ করি, কারণ আবার । যদি আমরা এটি করি, নির্ভুলতা বা ভুল শ্রেণিবিন্যাস ক্ষতি আমাদের বিশ্বাস করে যে আমরা সবকিছু ঠিকঠাক করছি, এমনকি আমাদের ভবিষ্যদ্বাণীমূলক মডেলটি যদি আমাদের দুটি শ্রেণির মধ্যে কোনটি সংখ্যাগরিষ্ঠ এক, তা নাও পায়।qˆ≥θ
অতএব, নির্ভুলতা বা ভুল শ্রেণিবদ্ধকরণ ক্ষতি বিভ্রান্তিকর হতে পারে।
উপরন্তু, সঠিকতা এবং misclassification ক্ষতি হয় আরো জটিল পরিস্থিতিতে অতিরিক্ত অনুমানের যেখানে ফলাফল IID নেই অধীনে অনুপযুক্ত। ফ্র্যাঙ্ক হ্যারেল, তার ব্লগ পোস্টে শ্রেণিবদ্ধতার যথাযথতা এবং অন্যান্য অনিচ্ছাকৃত যথাযথ স্কোরিং বিধি দ্বারা ক্ষয়ক্ষতির ফলে তার কোনও একটি বইয়ের উদাহরণ তুলে ধরে যেখানে সঠিকতা বা ভুল শংসাপত্র ক্ষতি হ'ল একটি ভুল বর্ণিত মডেলের দিকে পরিচালিত করবে, যেহেতু তারা সঠিক শর্তাধীন ভবিষ্যদ্বাণীকে অনুকূল নয় সম্ভাবনা.
সঠিকতা এবং misclassification ক্ষতি সঙ্গে আরেকটি সমস্যা হল তারা থ্রেশহোল্ড এর কার্যকারিতা হিসেবে সান্তার হয় । ফ্র্যাঙ্ক হ্যারেলও এর মধ্যে চলে যায়।θ
আরও তথ্যের সন্ধান করা যেতে পারে কেন শ্রেণিবদ্ধকরণের মডেলগুলি মূল্যায়নের জন্য নির্ভুলতা সেরা মাপকাঠি নয় কেন? ।
তলদেশের সরুরেখা
নির্ভুলতা ব্যবহার করবেন না। না ভুল শৃঙ্খলা ক্ষতি।
নীটপিক: "কঠোর" বনাম "কঠোরভাবে"
আমাদের কি "কঠোর" যথাযথ স্কোরিং বিধি সম্পর্কে কথা বলা উচিত, বা "কঠোরভাবে" সঠিক স্কোরিং আইন সম্পর্কে? "কঠোর" "যথাযথ" সংশোধন করে, "স্কোরিং নিয়ম" নয়। (এখানে "সঠিক স্কোরিং নিয়ম" এবং "কঠোরভাবে সঠিক স্কোরিংয়ের নিয়ম আছে" তবে কোনও "কঠোর স্কোরিং বিধি" নেই।) এর মতো, "কঠোরভাবে" একটি বিশেষণ নয়, বিশেষণ হওয়া উচিত এবং "কঠোরভাবে" ব্যবহার করা উচিত। যেমনটি সাহিত্যে প্রচলিত রয়েছে যেমন, তিলমান গ্নাইটিংয়ের কাগজপত্র।