প্রশ্ন ট্যাগ «policy-gradients»

1
কি-লার্নিং এবং নীতি গ্রেডিয়েন্ট পদ্ধতির মধ্যে কী সম্পর্ক?
যতদূর আমি বুঝতে পেরেছি, কি-লার্নিং এবং পলিসি গ্রেডিয়েন্টস (পিজি) হ'ল দুটি প্রধান পন্থা যা আরএল সমস্যাগুলি সমাধান করার জন্য ব্যবহৃত হয়। যদিও কি-লার্নিংয়ের উদ্দেশ্য একটি নির্দিষ্ট রাজ্যে গৃহীত কোনও নির্দিষ্ট পদক্ষেপের পুরষ্কারের পূর্বাভাস দেওয়া হয়, নীতি গ্রেডিয়েন্টগুলি সরাসরি ক্রিয়াটি নিজেই পূর্বাভাস দেয়। যাইহোক, উভয় পদ্ধতিই আমার কাছে অভিন্ন বলে মনে …
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.