আমি কীভাবে বোল্টজম্যান মেশিনগুলি কাজ করে তা বোঝার চেষ্টা করছি, তবে আমি কীভাবে ওজন শিখি তা পুরোপুরি নিশ্চিত নই, এবং এর একটি পরিষ্কার বিবরণ পাইনি been নিম্নলিখিতটি কি সঠিক? (এছাড়াও, যে কোনও ভাল বল্টজমান মেশিনের ব্যাখ্যার দিকে নির্দেশকগুলিও দুর্দান্ত।
আমাদের কাছে দৃশ্যমান ইউনিটগুলির একটি সেট রয়েছে (উদাহরণস্বরূপ, কোনও ছবিতে কালো / সাদা পিক্সেলের সাথে সম্পর্কিত) এবং লুকানো ইউনিটের একটি সেট। ওজনগুলি কোনওভাবে শুরু করা হয় (উদাহরণস্বরূপ, [-0.5, 0.5] থেকে অভিন্নভাবে), এবং তারপরে কিছু থামার নিয়ম না পৌঁছানো পর্যন্ত আমরা নিম্নলিখিত দুটি পর্যায়ের মধ্যে পর্যায়ক্রমে:
ক্ল্যাম্পড ফেজ - এই পর্যায়ে দৃশ্যমান ইউনিটগুলির সমস্ত মানগুলি স্থির থাকে, সুতরাং আমরা কেবল লুকানো ইউনিটগুলির রাজ্য আপডেট করি (বোল্টজম্যান স্টোকাস্টিক অ্যাক্টিভেশন নিয়ম অনুসারে)। নেটওয়ার্কটি ভারসাম্যহীন না হওয়া পর্যন্ত আমরা আপডেট করি। একবার আমরা সুস্থিতি পৌঁছানোর, আমরা আপডেট অবিরত আরো কয়েকবার (কিছু পূর্বনির্ধারিত জন্য এন ), গড় সম্পর্কে অবগত থাকার এক্স আমি এক্স ঞ (যেখানে এক্স আমি , এক্স ঞ নোড রাজ্য আমি এবং ঞ )। এই এন ভারসাম্য আপডেটের পরে , আমরা w i j = w i j + আপডেট করি i, যেখানেসিকিছু শেখার হার। (বা, শেষে ব্যাচ আপডেট করার পরিবর্তে, আমরা সাম্যাবসিত পদক্ষেপের পরে আপডেট করব?)
ফ্রি ফেজ - এই পর্যায়ে, সমস্ত ইউনিটের রাজ্য আপডেট করা হয়। একবার আমরা ভারসাম্য অর্জন করার পরে, একইভাবে আমরা আরও বেশি বার এন'কে আপডেট করা চালিয়ে যাই, তবে শেষে পারস্পরিক সম্পর্ক যুক্ত করার পরিবর্তে, আমরা বিয়োগ করি: ।
সুতরাং আমার প্রধান প্রশ্নগুলি হ'ল:
যখনই আমরা ক্ল্যাম্পড পর্যায়ে আছি, আমরা কী শিখতে চাই সেই ধরণের এককগুলিতে আমরা দৃশ্যমান ইউনিটগুলিকে পুনরায় সেট করব (কিছুটা ফ্রিকোয়েন্সি যা সেই প্যাটার্নটির গুরুত্ব উপস্থাপন করে), বা আমরা যে অবস্থায় ছিল দৃশ্যমান ইউনিটগুলি সেগুলিতে ছেড়ে দেই? মুক্ত পর্ব শেষে?
আমরা কি প্রতিটি পর্বের শেষে ওজনের একটি ব্যাচ আপডেট করি, বা পর্যায়ের প্রতিটি ভারসাম্য পদক্ষেপে ওজন আপডেট করি? (বা, হয় এক জরিমানা?)