উদ্দেশ্যটি পূর্বাভাস দেওয়ার সময় কোনও অনুচিত স্কোরিং নিয়ম ব্যবহার করা উপযুক্ত, তবে অনুমান নয়। যখন আমি পূর্বাভাসটি করতে যাচ্ছি তখন আমি অন্য একজন পূর্বাভাসকারী প্রতারণা করছে কিনা তা আমি সত্যিই যত্নশীল নই।
যথাযথ স্কোরিংয়ের বিধিগুলি নিশ্চিত করে যে প্রাক্কলন প্রক্রিয়া চলাকালীন মডেলটি সত্য উপাত্ত তৈরির প্রক্রিয়া (ডিজিপি) এর কাছে আসে। এটি আশাব্যঞ্জক বলে মনে হচ্ছে কারণ আমরা সত্য ডিজিপির কাছে যাওয়ার সাথে সাথে কোনও ক্ষতি কর্মের অধীনে পূর্বাভাসের ক্ষেত্রেও আমরা ভাল করব। ক্যাচটি হ'ল বেশিরভাগ সময় (বাস্তবে প্রায় সবসময় বাস্তবে) আমাদের মডেল অনুসন্ধানের জায়গাতে সত্য ডিজিপি থাকে না। আমরা প্রস্তাবিত কিছু কার্যকরী ফর্মের সাথে সত্য ডিজিপিকে আনুমানিকভাবে শেষ করি।
আরও বাস্তবসম্মত বিন্যাসে, সত্যিকারের ডিজিপির সম্পূর্ণ ঘনত্ব নির্ধারণের চেয়ে যদি আমাদের পূর্বাভাসের কাজটি আরও সহজ হয় তবে আমরা সম্ভবত আরও ভাল করতে পারি। এটি শ্রেণিবিন্যাসের জন্য বিশেষভাবে সত্য। উদাহরণস্বরূপ সত্যিকারের ডিজিপি খুব জটিল হতে পারে তবে শ্রেণিবিন্যাসের কাজটি খুব সহজ হতে পারে।
ইয়ারোস্লাভ বুলাটোভ তার ব্লগে নিম্নলিখিত উদাহরণ প্রদান করেছেন:
http://yaroslavvb.blogspot.ro/2007/06/log-loss-or-hinge-loss.html
আপনি নীচে দেখতে পাচ্ছেন সত্য ঘনত্বটি খুব কম। তবে এটি দ্বারা উত্পন্ন ডেটা পৃথক পৃথক করে শ্রেণীবদ্ধকারী তৈরি করা খুব সহজ। কেবলমাত্র আউটপুট ক্লাস 1 এবং যদি আউটপুট শ্রেণি 2 হয়।x ≥ 0x < 0
উপরে সঠিক ঘনত্বের সাথে মিলে না গিয়ে আমরা নীচের অপরিশোধিত মডেলটির প্রস্তাব করি, যা সত্য ডিজিপি থেকে অনেক দূরে। তবে এটি নিখুঁত শ্রেণিবিন্যাস করে। এটি কবজ ক্ষতি ব্যবহার করে পাওয়া যায়, যা সঠিক নয়।
অন্যদিকে আপনি যদি লগ-ক্ষতি সহ সত্য ডিজিপি সন্ধান করার সিদ্ধান্ত নেন (যা যথাযথ) তবে আপনি কিছু কার্যকারিতা ফিট করতে শুরু করেন, কারণ আপনি জানেন না যে সঠিক ফাংশনাল ফর্মটি আপনার কী দরকার prior এটির সাথে মেলে যাবার জন্য আপনি আরও কঠোর এবং কঠোর প্রচেষ্টা করার সাথে সাথে আপনি জিনিসগুলিকে ভুল সংকলন শুরু করেন।
মনে রাখবেন যে উভয় ক্ষেত্রেই আমরা একই কার্যকরী ফর্মগুলি ব্যবহার করেছি। অনুপযুক্ত লোকসানের ক্ষেত্রে এটি একটি পদক্ষেপ ফাংশনে অবনতি ঘটে যা ফলস্বরূপ নিখুঁত শ্রেণিবিন্যাস করে। যথাযথ ক্ষেত্রে এটি ঘনত্বের প্রতিটি অঞ্চলকে সন্তুষ্ট করার চেষ্টা করছে।
মূলত নির্ভুল পূর্বাভাস দেওয়ার জন্য আমাদের সবসময় সত্যিকারের মডেল অর্জন করার প্রয়োজন হয় না। বা কখনও কখনও আমাদের ঘনত্বের পুরো ডোমেনটিতে সত্যিই ভাল করার দরকার পড়ে না তবে কেবলমাত্র এর নির্দিষ্ট কিছু অংশে খুব ভাল হওয়া উচিত।