ডিপ কিউ লার্নিংয়ে পর্ব এবং যুগের মধ্যে পার্থক্য কী?


14

আমি বিখ্যাত কাগজটি "ডিপ রেইনফোর্সমেন্ট লার্নিংয়ের সাথে আতারি বাজানো" ( পিডিএফ ) বোঝার চেষ্টা করছি । একটি যুগ এবং পর্বের মধ্যে পার্থক্য সম্পর্কে আমি অস্পষ্ট । অ্যালগরিদম , বাইরের লুপটি এপিসোডের ওপরে রয়েছে , যখন চিত্র এ এক্স-অ্যাক্সিসকে যুগের লেবেলযুক্ত রয়েছে । শক্তিবৃদ্ধি শেখার প্রসঙ্গে, আমি একটি যুগের অর্থ কী তা পরিষ্কার নয়। কোন পর্বটি পর্বের লুপটির চারপাশে বাইরের লুপ হয়? 12

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন


1
সুতরাং ... কতটি পর্বের একটি পর্ব তৈরি?
লুইন

উত্তর:


10
  • একটি পর্ব = এক রাজ্যের ক্রম এবং ক্রিয়াকলাপ, যা টার্মিনাল অবস্থার সাথে শেষ হয়। উদাহরণস্বরূপ, পুরো গেমটি খেলে একটি পর্ব হিসাবে বিবেচনা করা যেতে পারে, যখন একজন খেলোয়াড় হারান / জিতেন / ড্র করেন তখন টার্মিনাল অবস্থা পৌঁছে যায়। একসময়, কেউ একটি পর্বকে বেশ কয়েকটি গেম হিসাবে সংজ্ঞায়িত করতে পছন্দ করতে পারে ( উদাহরণস্বরূপ : "প্রতিটি পর্ব কয়েক ডজন গেমস, কারণ গেমগুলি উভয় খেলোয়াড়ের জন্য 21 স্কোর পর্যন্ত যায়")।
  • নিউ ইউরাল টার্মিনোলজিতে একটি প্রশিক্ষণ, সমস্ত প্রশিক্ষণের উদাহরণের একটি যুগ = একটি ফরোয়ার্ড পাস এবং একটি পিছিয়ে পাস।

আপনি যে কাগজটির কথা উল্লেখ করেছেন তাতে তারা যুগের অর্থ সম্পর্কিত আরও নমনীয় বলে মনে হয়, কারণ তারা কেবলমাত্র একটি যুগকে নির্দিষ্ট পরিমাণ ওজন আপডেটের হিসাবে সংজ্ঞায়িত করে। আপনি প্রশ্নটিতে উল্লিখিত হিসাবে আপনি পর্বের লুপের চারপাশে একটি বহিরাগত লুপ হিসাবে একটি যুগকে দেখতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.