স্কিপগ্রাম ওয়ার্ড 2 ওয়েভের জন্য গ্রেডিয়েন্টস


9

স্ট্যানফোর্ড এনএলপি গভীর শিক্ষার শ্রেণীর লিখিত কার্যনির্বাহী সমস্যাগুলির মধ্যে আমি যাচ্ছি http://cs224d.stanford.edu/assignment1/assignment1_soln

আমি 3a এর উত্তরটি বোঝার চেষ্টা করছি যেখানে তারা কেন্দ্রের শব্দের জন্য ভেক্টর থেকে ডাইরিভেটিভ খুঁজছেন।

ধরুন আপনাকে স্কিপগ্রামের কেন্দ্রের শব্দ সি এর সাথে সম্পর্কিত একটি পূর্বাভাসযুক্ত ভেক্টর given দেওয়া হয়েছে, এবং ওয়ার্ড টুভেক মডেলগুলিতে পাওয়া সফটম্যাক্স ফাংশন দিয়ে শব্দের পূর্বাভাস তৈরি করা হয়েছে।vc

y^o=p(o|c)=exp(uoTvc)w=1Wexp(uwTvc)

কোথায় W -এর মানে W-তম শব্দ এবং (= W 1,।।।, ডব্লিউ) "আউটপুট" শব্দভান্ডার সমস্ত শব্দের জন্য শব্দ ভেক্টর হয়। ধরে ক্রস এনট্রপি খরচ এই ভবিষ্যদ্বাণী প্রয়োগ করা হয় এবং শব্দ প্রত্যাশিত শব্দ।uw

যেখানে সমস্ত আউটপুট ভেক্টরগুলির ম্যাট্রিক্স এবং words শব্দের নরমম্যাক্স পূর্বাভাসের কলাম ভেক্টর হতে দিন এবং y হ'ল হট লেবেল যা এটি একটি কলাম ভেক্টরও।U=[u1,u2,···,uW]y^

ক্রস এনট্রপি যেখানেCE(y,y^)=iyilog(y^i)

সুতরাং কেন্দ্র ভেক্টরের গ্রেডিয়েন্টের উত্তরJvc=UT(y^y).

কেউ কি আমাকে এইটিতে পৌঁছানোর পদক্ষেপগুলি দেখাতে পারে? আমি এই প্রশ্নটি ওয়ার্ড টুভেচে ক্রস এন্ট্রপি ক্ষয়ের ডেরিভেটিভ হিসাবে এই প্রশ্নটি ব্যবহার করছি তবে আমি বিশেষতউপস্থাপনা।UT(y^y).

উত্তর:


15

প্রথমে আসুন আমরা কী পেয়েছি এবং বিভিন্ন ভেক্টরগুলির আকার সম্পর্কে আমাদের অনুমানগুলি রেখেছি। দিন,

  1. |W|ভোকাবের শব্দের সংখ্যা হও
  2. y এবং shape আকৃতির কলাম ভেক্টর হোনx 1y^|W|
  3. ui এবং এক্স 1 আকৃতির কলাম ভেক্টর ( = মাত্রা)vjDD
  4. y আকারের ওয়ান-হট এনকোডেড কলামের ভেক্টর হোনx 1|W|
  5. y^ shape আকারের নরমম্যাক্স পূর্বাভাস কলাম ভেক্টরx 1|W|
  6. y^i=P(i|c)=exp(uiTvc)w=1Wexp(uwTvc)
  7. ক্রস এনট্রপি ক্ষতি:J=i=1Wyilog(yi^)
  8. U=[u1,u2,...,uk,...uW] কলামের ভেক্টরগুলির একটি ম্যাট্রিক্স ।uk

এখন, আমরা , এখন, আমরা জানি যে এক-হট , সুতরাং এর সমস্ত উপাদান বলুন, সূচক বাদে শূন্য । যার অর্থ, সাথে সম্পর্কিত সংমিশ্রণের মধ্যে একটিমাত্র শূন্য শর্ত রয়েছে এবং সংক্ষেপে অন্য সমস্ত শর্তগুলি শূন্য। সুতরাং এইভাবে লেখা যেতে পারে: দ্রষ্টব্য: উপরে 1

J=i=1Wyilog(exp(uiTvc)w=1Wexp(uwTvc))
J=i=1Wyi[uiTvclog(w=1Wexp(uwTvc))]
ykthyk
J=yk[ukTvclog(w=1Wexp(uwTvc))]
yk

এর সমাধান : Jvc

Jvc=[ukw=1Wexp(uwTvc)uwx=1Wexp(uxTvc)]

যা পুনরায় সাজানো যেতে পারে: সংজ্ঞা ()) ব্যবহার করে আমরা উপরের সমীকরণটি আবার লিখতে পারি:

Jvc=w=1W(exp(uwTvc)x=1Wexp(uxTvc)uw)uk
Jvc=w=1W(y^wuw)uk

এখন আসুন দেখুন ম্যাট্রিক্স নোটেশনে এটি কীভাবে লেখা যেতে পারে ote দ্রষ্টব্য:

  1. uk ম্যাট্রিক্স ভেক্টর গুণ হিসাবে লেখা যেতে পারে:U.y
  2. আর ভেক্টর একটি রৈখিক রূপান্তর হয় মধ্যে দ্বারা ছোটো যথাক্রমে। এটি আবার as হিসাবে লেখা যেতে পারেw=1W(y^wuw)uwUy^wU.y^

সুতরাং পুরো জিনিসটি সংক্ষিপ্তভাবে লেখা যেতে পারে:

U[y^y]

অবশেষে, নোট করুন যে আমরা গুলি কলাম ভেক্টর হিসাবে ধরে । যদি আমরা সারি ভেক্টর দিয়ে শুরু করে থাকতাম তবে আমরা আপনি যে সন্ধান করছিলেন তার সমতুল্য পেতাম ।uiUT[y^y]


1
কেবল এটিই বলতে চেয়েছিলেন যে এটি আবিষ্কারের জন্য একটি দুর্দান্ত ব্যাখ্যা! এটি আমার মতো গণিত-সফলদের জন্য সত্যই সহায়তা করে। ধন্যবাদ!
এরিক কিম

1
আশ্চর্যজনক ব্যাখ্যা জন্য +1!
দাম্ভিক

কেন এই
BATB=A
ব্যয়টি আমি গুরুত্ব

@ পার্থটামনে দয়া করে এটি দেখুন - math.stackexchange.com/Qestions/3270789/…
শচীন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.