আরবিএম এর একটি আকর্ষণীয় জন্তু। আপনার প্রশ্নের উত্তর দিতে এবং সেগুলিতে আমার স্মৃতি জাগ্রত করতে আমি আরবিএমগুলি গ্রহণ করব এবং ডেরাইভেশনটির মাধ্যমে কথা বলব। আপনি উল্লেখ করেছেন যে আপনি সম্ভাবনা নিয়ে বিভ্রান্ত হয়ে পড়েছেন, সুতরাং আমার বিকাশ সম্ভাবনা সর্বাধিক করার চেষ্টা করার দৃষ্টিকোণ থেকে হবে। সুতরাং শুরু করা যাক।
আরবিএমগুলিতে নিউরনের দুটি পৃথক সেট রয়েছে, দৃশ্যমান এবং লুকানো, আমি তাদের যথাক্রমে এবং বোঝাতে চাই । এবং এর একটি নির্দিষ্ট কনফিগারেশন দেওয়া , আমরা এটি সম্ভাবনার স্থানটি ম্যাপ করি।vhvh
p(v,h)=e−E(v,h)Z
সংজ্ঞা দেওয়ার মতো আরও কয়েকটি জিনিস রয়েছে। সম্ভাব্য স্থানটিতে একটি নির্দিষ্ট কনফিগারেশন থেকে মানচিত্রের জন্য আমরা যে সারোগেট ফাংশনটি ব্যবহার করি তাকে এনার্জি ফাংশন । ধ্রুবক একটি নিয়মমাফিককরণ ফ্যাক্টর তা নিশ্চিত করার জন্য আমরা আসলে সম্ভাব্যতা স্থান থেকে মানচিত্র। এখন আসুন আমরা যা খুঁজছি তা পাওয়া যাক; দৃশ্যমান নিউরনগুলির সেটগুলির সম্ভাবনা, অন্য কথায়, আমাদের ডেটার সম্ভাবনা।
E(v,h)Z
Z=∑v∈V∑h∈He−E(v,h)
p(v)=∑h∈Hp(v,h)=∑h∈He−E(v,h)∑v∈V∑h∈He−E(v,h)
যদিও এই সমীকরণে প্রচুর পদ রয়েছে তবে এটি সঠিক সম্ভাবনার সমীকরণগুলি লেখার ক্ষেত্রে নেমে আসে। আশা করা যায়, এ পর্যন্ত, এটি আপনাকে উপলব্ধি করতে সহায়তা করেছে যে আমাদের সম্ভাবনা গণনা করার জন্য কেন শক্তি ফাংশন প্রয়োজন হয়, বা সাধারণভাবে অস্বাভাবিক সম্ভাবনা । অস্বাভাবিক সম্ভাবনা ব্যবহার করা হয় কারণ পার্টিশন ফাংশন জেড গণনা করা খুব ব্যয়বহুল।p(v)∗ZZ
এবার আসুন আরবিএমের আসল শেখার পর্যায়ে। সম্ভাব্যতা বাড়ানোর জন্য, প্রতিটি ডেটা পয়েন্টের জন্য, আমাদের তৈরির জন্য গ্রেডিয়েন্ট পদক্ষেপ নিতে হবে । গ্রেডিয়েন্ট এক্সপ্রেশন পেতে এটি কিছু গাণিতিক অ্যাক্রোব্যাটিকস লাগে। প্রথম জিনিসটি আমরা পি ( ভি ) এর লগ গ্রহণ করি । গণিতকে সম্ভাব্য করে তোলার জন্য আমরা এখন থেকে লগ সম্ভাব্যতার জায়গাতে কাজ করব।p(v)=1p(v)
আসুন সম্মান সঙ্গে গ্রেডিয়েন্ট নেওয়া পি মধ্যে প্যারামিটার ( v )
log(p(v))=log[∑h∈He−E(v,h)]−log[∑v∈V∑h∈He−E(v,h)]
p(v)
∂log(p(v))∂θ=−1∑h′∈He−E(v,h′)∑h′∈He−E(v,h′)∂E(v,h′)∂θ+1∑v′∈V∑h′∈He−E(v′,h′)∑v′∈V∑h′∈He−E(v′,h′)∂E(v,h)∂θ
এখন আমি কাগজে এটি করেছি এবং সেমিফাইনাল সমীকরণটি লিখেছিলাম যাতে এই সাইটে প্রচুর জায়গা নষ্ট না হয়। আমি আপনাকে এই সমীকরণগুলি নিজেই উত্সাহিত করার পরামর্শ দিচ্ছি। এখন আমি কিছু সমীকরণ লিখে রাখব যা আমাদের উপার্জন অব্যাহত রাখতে সহায়তা করবে। দ্রষ্টব্য: , পি ( ভি ) = ∑ এইচ ∈ এইচ পি ( ভি , এইচ ) এবং যে পি ( এইচ | ভি ) =Zp(v,h)=e−E(v,h′)p(v)=∑h∈Hp(v,h)p(h|v)=p(v,h)p(h)
∂log(p(v))∂θ∂log(p(v))∂θ=−1p(v)∑h′∈Hp(v,h′)∂E(v,h′)∂θ+∑v′∈V∑h′∈Hp(v′,h′)∂E(v′,h′)∂θ=−∑h′∈Hp(h′|v)∂E(v,h′)∂θ+∑v′∈V∑h′∈Hp(v′,h′)∂E(v′,h′)∂θ
এবং সেখানে আমরা চলেছি, আমরা আরবিএম-এর সর্বাধিক সম্ভাবনা অনুমান করেছি, যদি আপনি চান তবে আপনি তাদের সংশ্লিষ্ট শর্তাদি (শর্তসাপেক্ষ, এবং যৌথ সম্ভাবনা) প্রত্যাশার মাধ্যমে শেষ দুটি পদ লিখতে পারেন।
শক্তি ফাংশন এবং নিউরনের stochasticity নোটস।
আপনি আমার ডাইরিভেশনটিতে উপরে দেখতে পাচ্ছেন, আমি শক্তি ফাংশনটির সংজ্ঞাটি অস্পষ্ট রেখে দিয়েছি। এবং এটি করার কারণটি হ'ল আরবিএমের বিভিন্ন সংস্করণ বিভিন্ন শক্তি ফাংশন প্রয়োগ করে। উপরে লিঙ্কিত বক্তৃতায় হিন্টন যে বর্ণনা করেছেন এবং @ লরেনস-মিয়াস দেখিয়েছেন তা হল:
E(v,h)=−aTv−bTh−vTWh.
প্রত্যাশা ফর্মের মাধ্যমে উপরে গ্রেডিয়েন্ট শর্তাদি সম্পর্কে যুক্তি করা সহজ হতে পারে।
∂log(p(v))∂θ=−Ep(h′|v)∂E(v,h′)∂θ+Ep(v′,h′)∂E(v′,h′)∂θ
প্রথম পদটির প্রত্যাশাটি গণনা করা সত্যই সহজ এবং এটি ছিল আরবিএমগুলির পিছনে বুদ্ধিমান। সংযোগটি সীমাবদ্ধ করে শর্তসাপেক্ষ প্রত্যাশা কেবল দৃশ্যমান ইউনিটগুলি ক্ল্যাম্প সহ আরবিএমের সামনের দিকে এগিয়ে যায় becomes এটি বল্টজম্যান মেশিনগুলির তথাকথিত ওয়েক ফেজ। এখন দ্বিতীয় পদটি গণনা করা আরও শক্ত এবং সাধারণত মন্টি কার্লো পদ্ধতিগুলি এটি ব্যবহার করতে ব্যবহৃত হয়। মন্টি কার্লো গড় দিয়ে গ্রেডিয়েন্ট রচনা:
∂log(p(v))∂θ≈−⟨∂E(v,h′)∂θ⟩p(h′|v)+⟨∂E(v′,h′)∂θ⟩p(v′,h′)
প্রথম শব্দটির গণনা করা শক্ত নয়, যেমন উপরে বর্ণিত হয়েছে, সুতরাং মন্টে-কার্লো দ্বিতীয় মেয়াদে সম্পন্ন হয়। মন্টি কার্লো পদ্ধতিগুলি প্রত্যাশা (যোগফল বা অখণ্ড) গণনা করতে বন্টনটির এলোমেলোভাবে ক্রমাগত নমুনা ব্যবহার করে। ক্লাসিকাল আরবিএম-এর এই এলোমেলো নমুনাটিকে একটি ইউনিটকে তার সম্ভাব্যতার উপর ভিত্তি করে 0 বা 1 হিসাবে সেট করা হিসাবে সংজ্ঞায়িত করা হয়, অন্য কথায়, এটি এলোমেলো ইউনিফর্ম নম্বর পান, যদি এটি নিউরনের সম্ভাবনার চেয়ে কম হয় তবে এটি সেট করে 1 এটি 0 তে সেট করার চেয়ে বড়।