ক্রস এনট্রপি সূত্র দুই ডিস্ট্রিবিউশন, লাগে সত্য বিতরণ, এবং , আনুমানিক বিতরণ, ওভার বিযুক্ত পরিবর্তনশীল সংজ্ঞায়িত এবং দেওয়া হয়p(x)q(x)x
H(p,q)=−∑∀xp(x)log(q(x))
নিউরাল নেটওয়ার্কের জন্য, গণনাটি নিম্নলিখিতগুলির থেকে পৃথক:
কী ধরণের স্তর ব্যবহৃত হত।
কী ধরণের অ্যাক্টিভেশন ব্যবহৃত হয়েছিল - যদিও অনেকগুলি সক্রিয়করণ গণনার সাথে সামঞ্জস্যপূর্ণ হবে না কারণ তাদের ফলাফলগুলি সম্ভাব্যতা হিসাবে ব্যাখ্যাযোগ্য নয় (যেমন, তাদের আউটপুটগুলি নেতিবাচক, 1 এর চেয়ে বেশি, বা 1 এর সমষ্টি নয়)। সফটম্যাক্স প্রায়শই মাল্টিক্লাস শ্রেণিবিন্যাসের জন্য ব্যবহৃত হয় কারণ এটি একটি ভাল আচরণের সম্ভাব্যতা বিতরণ ফাংশনটির গ্যারান্টি দেয়।
নিউরাল নেটওয়ার্কের জন্য, আপনি সাধারণত একটি ফর্মটিতে সমীকরণটি দেখতে পাবেন যেখানে the গ্রাউন্ড ট্রুথ ভেক্টর এবং (বা শেষ স্তর আউটপুট থেকে সরাসরি নেওয়া অন্য কোনও মান) হ'ল অনুমান। একটি একক উদাহরণের জন্য, এটি দেখতে এরকম হবে:yy^
L=−y⋅log(y^)
যেখানে ⋅ হ'ল ভেক্টর ডট পণ্য।
আপনার উদাহরণের স্থল সত্য y the প্রথম মানটির সমস্ত সম্ভাবনা দেয় এবং অন্যান্য মানগুলি শূন্য হয়, তাই আমরা সেগুলি উপেক্ষা করতে পারি, এবং কেবলমাত্র আপনার অনুমানগুলি থেকে ম্যাচিং শব্দটি ব্যবহার করব y^
L=−(1×log(0.1)+0×log(0.5)+...)
L=−log(0.1)≈2.303
মন্তব্য থেকে একটি গুরুত্বপূর্ণ পয়েন্ট
তার অর্থ, ভবিষ্যদ্বাণীগুলি বা হলে ক্ষতিটি সমান হবে ?[0.1,0.5,0.1,0.1,0.2][0.1,0.6,0.1,0.1,0.1]
হ্যাঁ, এটি মাল্টিক্লাস লগলসের একটি মূল বৈশিষ্ট্য, এটি কেবল সঠিক শ্রেণীর সম্ভাব্যতার পুরষ্কার / দণ্ড দেয়। কীভাবে অবশিষ্ট সম্ভাবনা ভুল শ্রেণীর মধ্যে বিভক্ত হয় তার থেকে মানটি পৃথক।
আপনি প্রায়শই ব্যয়ের কাজ হিসাবে সমস্ত উদাহরণের চেয়ে গড় এই সমীকরণটি দেখতে পাবেন । এটি বর্ণনায় সর্বদা কঠোরভাবে অনুসরণ করা হয় না, তবে সাধারণত একটি ক্ষতির ফাংশন নিম্ন স্তরের হয় এবং বর্ণনা করে যে কোনও একক উদাহরণ বা উপাদান কীভাবে ত্রুটির মান নির্ধারণ করে, যখন একটি ব্যয় ফাংশন উচ্চ স্তরের হয় এবং বর্ণনা করে যে কীভাবে একটি সম্পূর্ণ সিস্টেমটি অপ্টিমাইজেশনের জন্য মূল্যায়ন করা হয়। মাপ এর ডেটা সেট করার জন্য মাল্টিক্লাস লগ ক্ষয়ের উপর ভিত্তি করে একটি ব্যয় ফাংশনটি দেখতে দেখতে এটি দেখতে পারে:N
J=−1N(∑i=1Nyi⋅log(y^i))
অনেকগুলি বাস্তবায়নের জন্য আপনার গ্রাউন্ড সত্যের মানগুলি এক-হট এনকোড হওয়া প্রয়োজন (একক সত্য শ্রেণীর সাথে), কারণ এটি কিছু অতিরিক্ত অপ্টিমাইজেশনের অনুমতি দেয়। যাইহোক, নীতিগতভাবে ক্রস এনট্রপি লোকসান গণনা করা যায় - এবং অনুকূলিত - যখন এটি হয় না।