শক্তিবৃদ্ধি শেখার উপর বই

10

আমি বেশ কিছুদিন ধরেই রিইনফোর্সমেন্ট লার্নিং বোঝার চেষ্টা করছি তবে কোনওভাবেই গ্রিড ওয়ার্ল্ড সমস্যা সমাধানের জন্য কীভাবে রিইনফোর্সমেন্ট লার্নিংয়ের জন্য একটি প্রোগ্রাম লিখতে হবে তা কল্পনা করতে পারছি না। আপনি কি আমাকে এমন কিছু পাঠ্য বইয়ের পরামর্শ দিতে পারেন যা আমাকে শক্তিবৃদ্ধি শেখার একটি পরিষ্কার ধারণা তৈরি করতে সহায়তা করবে?

machine-learning books reinforcement-learning

— girl101
সূত্র

stats.stackexchange.com/questions/130130/…

— আন্তন

মূলত অজগর থেকে পুনর্বহাল শিক্ষা শেখার জন্য ওপেনই এটির একটি ভাল জায়গা দেখুন

— ভিনিত কোঠারি

7

এখানে আপনার কাছে রিইনফোর্সমেন্ট লার্নিং সম্পর্কে কিছু ভাল রেফারেন্স রয়েছে:

সর্বোত্তম

সাটন আরএস, বার্তো এজি। শক্তিবৃদ্ধি শিক্ষা: একটি ভূমিকা। কেমব্রিজ, গণ: একটি ব্র্যাডফোর্ড বই; 1998. 322 পি।

দ্বিতীয় সংস্করণের খসড়া বিনামূল্যে পাওয়া যায়: http://incompleteideas.net/book/the-book-2nd.html

রাসেল / নরভিগ অধ্যায় 21:

রাসেল এসজে, নরভিগ পি, ডেভিস ই কৃত্রিম বুদ্ধিমত্তা: একটি আধুনিক পদ্ধতি। আপার স্যাডল রিভার, এনজে: প্রেন্টাইস হল; 2010।

আরও প্রযুক্তিগত

জেস্পেসরি সি। অ্যালগরিদম পুনর্বহাল শেখার জন্য। কৃত্রিম বুদ্ধিমত্তা এবং মেশিন লার্নিং উপর সংশ্লেষ বক্তৃতা। 2010; 4 (1): 1-103। http://www.ualberta.ca/~szepesva/RLBook.html

বার্টসেকাস ডিপি। ডায়নামিক প্রোগ্রামিং এবং সর্বোত্তম নিয়ন্ত্রণ। চতুর্থ সংস্করণ। বেলমন্ট, ভর: অ্যাথেনা বৈজ্ঞানিক; 2007. 1270 পি। অধ্যায়,, দ্বিতীয় খণ্ডটি বিনামূল্যে পাওয়া যায়: http://web.mit.edu/dimitrib/www/dpchapter.pdf

আরও সাম্প্রতিক উন্নয়নের জন্য

ওয়্যারিং এম, ভ্যান ওটার্লো এম, সম্পাদক। শক্তিবৃদ্ধি শেখা। বার্লিন, হাইডেলবার্গ: স্প্রিঞ্জার বার্লিন হাইডেলবার্গ; 2012 থেকে উপলব্ধ: http://link.springer.com/10.1007/978-3-642-27645-3

কোচেনডেরফার এমজে, আমাতো সি, চৌধারী জি, হাও জেপি, রেনল্ডস এইচজেডি, থর্টন জেআর, ইত্যাদি। অনিশ্চয়তার অধীনে সিদ্ধান্ত গ্রহণ: তত্ত্ব এবং প্রয়োগ। 1 সংস্করণ। কেমব্রিজ, ম্যাসাচুসেটস: এমআইটি প্রেস; 2015. 352 পি।

মাল্টি এজেন্ট পুনর্বহাল শেখা

বুওনিউ এল, বাবুউকা আর, শুটার বিডি। মাল্টি এজেন্ট শক্তিবৃদ্ধি শিক্ষা: একটি ওভারভিউ। ইন: শ্রীনিবাসন ডি, জৈন এলসি, সম্পাদকগণ। মাল্টি-এজেন্ট সিস্টেম এবং অ্যাপ্লিকেশনগুলিতে উদ্ভাবন - 1। স্প্রিঞ্জার বার্লিন হাইডেলবার্গ; 2010 পি। 183-221। থেকে উপলব্ধ: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

শোয়ার্জ এইচএম। মাল্টি এজেন্ট মেশিন লার্নিং: একটি পুনর্বহাল পদ্ধতি approach হোবোকেন, নিউ জার্সি: উইলি; 2014।

ভিডিও / কোর্স

আমি ইউটিউবে ডেভিড সিলভার কোর্সের পরামর্শও দেব: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2O6262Ofa

— জুয়ান লেনি
সূত্র

7

রিডফোর্সমেন্ট লার্নিং বাই উদাসিটির জন্য একটি নিখরচায় অনলাইন কোর্স রয়েছে। চেক করুন: মেশিন লার্নিং: রিনফোর্সমেন্ট লার্নিং

— Sreejithc321
সূত্র

উল্লেখযোগ্য যে গ্রিড ওয়ার্ল্ড সমস্যাটি সেই কোর্সের অংশ হিসাবে উপস্থাপিত হয়েছে।

— নিল স্লেটার

হ্যাঁ, এটি দেখেছেন, তবে একই কোড করার জন্য যথেষ্ট নয়

— girl101

4

আমি রিইনফোর্সমেন্ট ল্যারানিংটি সত্যিই উপভোগ করেছি: রিচার্ড সাটন দ্বারা পরিচিতি । এটি আরএলটিতে খুব সুন্দর একত্রীকরণের ভিউ সরবরাহ করে, যদিও এটিতে নতুন পদ্ধতির কথা উল্লেখ করা হয়নি (এটি 1998 সালের) from

— মার্টিন Modrák
সূত্র

আসলে আমি গ্রিড ওয়ার্ল্ড সমস্যাটি কলম এবং কাগজে গণনা করে সমাধান করা দেখতে চেয়েছিলাম, কারণ এটি আমাকে ধারণাটি বুঝতে সহায়তা করবে, যদি না আমি যে ধারণাটি কোড করতে পারি না বুঝতে পারি (বিশেষত মান পুনরাবৃত্তি)

— girl101

1

আপনি আমার বইটি দেখতে পাচ্ছেন - হ্যান্ডস-অন রিইনফোর্সমেন্ট লার্নিং উইথ পাইথন যা স্ক্র্যাচ থেকে আর্ট ডিপ রিইনফোর্সমেন্ট লার্নিং অ্যালগরিদমগুলির উন্নত স্থানে পুনর্বহাল শেখার ব্যাখ্যা করে।

ব্যাখ্যা সহ সমস্ত কোড আমার গিথুব রেপোতে ইতিমধ্যে উপলব্ধ। https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python

— Sudharsan
সূত্র