আমি এখানে ক্রস-এনট্রপি ক্ষতি কীভাবে প্রকাশ করব তা এখানে :
এল (এক্স, Y) = - 1এনΣi = 1এনY( i )Lna ( x( i )) + ( 1 - y)( i )) ln( 1 - ক ( এক্স)( i )) )
এখানে, প্রশিক্ষণ ডেটাসেটে ইনপুট উদাহরণ সেট, এবং ওয়াই = { Y ( 1 ) , ... , Y ( এন ) } লেবেলের সংশ্লিষ্ট সেট এই ইনপুট উদাহরণগুলির জন্য। একটি ( এক্স ) এর স্নায়ুর নেটওয়ার্ক প্রদত্ত ইনপুট আউটপুট প্রতিনিধিত্ব করে এক্স ।এক্স= { x( 1 ), … , এক্স( এন )}ওয়াই= { y( 1 ), … , Y( এন )}ক ( এক্স )এক্স
প্রতিটি ( i ) হয় 0 বা 1 হয় এবং আউটপুট অ্যাক্টিভেশন a ( x ) সাধারণত লজিস্টিক সিগময়েড ব্যবহার করে খোলা ব্যবধানে (0, 1) সীমাবদ্ধ থাকে । উদাহরণস্বরূপ, এক-স্তর নেটওয়ার্কের জন্য (যা লজিস্টিক রিগ্রেশনের সমতুল্য), অ্যাক্টিভেশনটি একটি ( x ) = 1 দ্বারা দেওয়া হবেY( i )ক ( এক্স ) যেখানেডাব্লুএকটি ওজন ম্যাট্রিক্স এবংখএকটি পক্ষপাতিত্ব ভেক্টর। একাধিক স্তরের জন্য, আপনি ভালো কিছু করার জন্য অ্যাক্টিভেশন ফাংশন প্রসারিত করতেএকটি(এক্স)=1
a ( x ) = 11 + ই- ডাব্লুx - খ
ওয়াটখ যেখানে
ভিএবং
সিহ'লপ্রথম স্তরের ওজন ম্যাট্রিক্স এবং পক্ষপাত, এবং
জেড(এক্স)হল নেটওয়ার্কে লুকানো স্তরটির সক্রিয়করণ।
a ( x ) = 11 + ই- ডাব্লুz- র( এক্স ) - খz- র( এক্স ) = 11 + ই- ভিx - গ
ভীগz- র( এক্স )
উদাহরণগুলি বোঝাতে আমি (i) সুপারস্ক্রিপ্ট ব্যবহার করেছি কারণ এন্ড্রু এনগের মেশিন লার্নিং কোর্সে এটি বেশ কার্যকর বলে আমি পেয়েছি; কখনও কখনও লোকেরা ম্যাট্রিক্সে কলাম বা সারি হিসাবে উদাহরণ প্রকাশ করে তবে ধারণাটি একই থাকে।