প্রশ্ন ট্যাগ «q-learning»

1
"অভিজ্ঞতা রিপ্লে" কী এবং এর সুবিধা কী?
আমি গুগলের ডিপমাইন্ড আতারি কাগজটি পড়ছি এবং আমি "অভিজ্ঞতার পুনরায় খেলা" ধারণাটি বোঝার চেষ্টা করছি। অভিজ্ঞতার পুনরায় খেলা আরও অনেক সংহতকরণ শেখার কাগজপত্র আসে (বিশেষত, আলফাগো পেপার), সুতরাং এটি কীভাবে কাজ করে তা আমি বুঝতে চাই। নীচে কিছু অংশ রয়েছে। প্রথমত, আমরা একটি জৈবিকভাবে অনুপ্রাণিত মেকানিজমযুক্ত অভিজ্ঞতা ব্যবহার করি যা …
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.