ওপেনএইজিআইএম- তে লুনার ল্যান্ডারের মতো সমস্যার সমাধানের নকশা করার সময় , রিইনফোর্সমেন্ট লার্নিং হ'ল এজেন্টকে পর্যাপ্ত অ্যাকশন নিয়ন্ত্রণ দেওয়ার একটি লোভনীয় মাধ্যম যাতে সাফল্যের সাথে অবতরণ করতে পারে।
কিন্তু এমন কী কী উদাহরণ রয়েছে যেখানে নিয়ন্ত্রণ ব্যবস্থা অ্যালগরিদম, যেমন পিআইডি কন্ট্রোলাররা কেবল একটি পর্যাপ্ত কাজ করবে যেমন, রিইনফোর্সমেন্ট লার্নিং এর চেয়ে ভাল না?
যেমন প্রশ্ন এই এক এই প্রশ্নের তত্ত্ব অ্যাড্রেসিং এ মহান কাজ, কিন্তু ব্যবহারিক উপাদান খুব কমই সম্বোধন করতে না।
একটি কৃত্রিম বুদ্ধিমত্তা প্রকৌশলী হিসাবে, কোনও সমস্যা ডোমেনের কোন উপাদানগুলি আমাকে পরামর্শ দেয় যে কোনও পিআইডি নিয়ন্ত্রক কোনও সমস্যা সমাধানের জন্য অপর্যাপ্ত, এবং একটি রিইনফোর্সমেন্ট লার্নিং অ্যালগরিদম পরিবর্তে ব্যবহার করা উচিত (বা বিপরীতে)?