আমি পুনর্বহাল শেখার অ্যালগরিদমগুলি ব্যবহার করে রোবটকে অনুসরণ করে একটি লাইন প্রোগ্রামিংয়ের বিষয়ে বিবেচনা করছি। আমি যে প্রশ্নটি উদ্বিগ্ন করছি তা হ'ল আমি কীভাবে কোনও স্বেচ্ছাচারী পথের মাধ্যমে নেভিগেট শিখতে অ্যালগরিদম পেতে পারি?
শক্তিবৃদ্ধি শেখার জন্য সাটন এবং বার্তো বুক অনুসরণ করার পরে , আমি একটি রেসট্র্যাকের সাথে জড়িত একটি অনুশীলনের সমস্যাটি সমাধান করেছি যেখানে গাড়ী এজেন্ট ট্র্যাকটি না গিয়ে এবং তার গতি নিয়ন্ত্রণ করতে শিখেছে। যাইহোক, সেই অনুশীলনের সমস্যাটি এজেন্টকে প্রশিক্ষণ প্রাপ্ত ট্র্যাকটি কীভাবে নেভিগেট করতে হয় তা শিখেছে।
স্বেচ্ছাসেবীর পথে চলাচল করার জন্য কোনও রোবট পেতে কি এটি শক্তিবৃদ্ধি শেখার সুযোগে রয়েছে? এজেন্টের কি একেবারে রেস সার্কিট বা পাথের মানচিত্র থাকতে হবে? আমি আমার রাষ্ট্রের জায়গার জন্য কোন পরামিতিগুলি ব্যবহার করতে পারি?