স্ট্যানফোর্ড এনএলপি গভীর শিক্ষার শ্রেণীর লিখিত কার্যনির্বাহী সমস্যাগুলির মধ্যে আমি যাচ্ছি http://cs224d.stanford.edu/assignment1/assignment1_soln
আমি 3a এর উত্তরটি বোঝার চেষ্টা করছি যেখানে তারা কেন্দ্রের শব্দের জন্য ভেক্টর থেকে ডাইরিভেটিভ খুঁজছেন।
ধরুন আপনাকে স্কিপগ্রামের কেন্দ্রের শব্দ সি এর সাথে সম্পর্কিত একটি পূর্বাভাসযুক্ত ভেক্টর given দেওয়া হয়েছে, এবং ওয়ার্ড টুভেক মডেলগুলিতে পাওয়া সফটম্যাক্স ফাংশন দিয়ে শব্দের পূর্বাভাস তৈরি করা হয়েছে।
কোথায় W -এর মানে W-তম শব্দ এবং (= W 1,।।।, ডব্লিউ) "আউটপুট" শব্দভান্ডার সমস্ত শব্দের জন্য শব্দ ভেক্টর হয়। ধরে ক্রস এনট্রপি খরচ এই ভবিষ্যদ্বাণী প্রয়োগ করা হয় এবং শব্দ ণ প্রত্যাশিত শব্দ।
যেখানে সমস্ত আউটপুট ভেক্টরগুলির ম্যাট্রিক্স এবং words শব্দের নরমম্যাক্স পূর্বাভাসের কলাম ভেক্টর হতে দিন এবং y হ'ল হট লেবেল যা এটি একটি কলাম ভেক্টরও।
ক্রস এনট্রপি যেখানে
সুতরাং কেন্দ্র ভেক্টরের গ্রেডিয়েন্টের উত্তর
কেউ কি আমাকে এইটিতে পৌঁছানোর পদক্ষেপগুলি দেখাতে পারে? আমি এই প্রশ্নটি ওয়ার্ড টুভেচে ক্রস এন্ট্রপি ক্ষয়ের ডেরিভেটিভ হিসাবে এই প্রশ্নটি ব্যবহার করছি তবে আমি বিশেষতউপস্থাপনা।