শক্তিবৃদ্ধি শেখার পাঠ্যপুস্তক


12

আমি শক্তিবৃদ্ধি শেখার জন্য একটি পাঠ্যপুস্তক / বক্তৃতা নোটগুলির সন্ধান করছি। আমি "পরিসংখ্যান শিক্ষার ভূমিকা" এর প্রতি অনুরাগী , তবে দুর্ভাগ্যক্রমে তারা এই বিষয়টি কভার করে না। আমি জানি যে সাটন এবং বার্তোর একটি বই একটি প্রমিত রেফারেন্স, এবং সম্ভবত এনডিপিও ভাল তবে তারা ১৯৯9 -৯৮ তারিখের, এবং আমি আরও একটি আধুনিক প্রদর্শনী প্রত্যাশা করছিলাম যেহেতু সাম্প্রতিক সময়ে এই ক্ষেত্রটি বেশ কিছুটা বিকাশ লাভ করবে সময়।

উত্তর:


15

আমি মনে করি স্টটন এবং বার্তো এখনও মানক। অনলাইনে এআই ক্লাসের স্লাইড ডেক এবং নোটগুলি প্রচুর পরিমাণে রয়েছে তবে তারা সাধারণত খুব বেশি বিশদে যায় না।

সাটন এবং বার্তো একটু পুরাতন তবে তারা তাদের পাঠ্যপুস্তকের ২ য় সংস্করণ প্রস্তুত করছে। জানুয়ারী 2018 তারিখের একটি খসড়া এখানে উপলভ্য ; এটি সুতনের ওয়েবপৃষ্ঠা থেকে লিঙ্কযুক্ত, এটিতে প্রথম সংস্করণের সম্পূর্ণ পাঠ্যও রয়েছে।

আমি কোচেন্ডারফার এট আল-এর মোকাবেলা করার আগে এটিকে লক্ষ্য করব সিদ্ধান্ত অনিশ্চয়তার। এই বইটিতে কিছু আকর্ষণীয় অ্যাপ্লিকেশন রয়েছে (বেশিরভাগ বিমানের ক্ষেত্রে) তবে এটি দ্রুত চলে এবং অনেকগুলি কাছাকাছি আসে। রিজফোর্সমেন্ট লার্নিংয়ের জন্য সাজেপেস্বিরীর অ্যালগোরিদমগুলি ভাল, তবে পিথি - এটিপেতে প্রায় বিশ পৃষ্ঠাগুলি লাগে takes: TD (λ)

এগুলি ছাড়াও, আপনি কয়েকটি কাগজপত্রগুলিতে ডাইভিং চেষ্টা করতে পারেন - শক্তিবৃদ্ধি শেখার জিনিসগুলি বেশ অ্যাক্সেসযোগ্য হতে পারে।


ধন্যবাদ, আমি নতুন সংস্করণটি একবার দেখেছি, তবে আমি এটি বলব না যে এটি খুব বেশি আপডেট হয়েছে। আমি এখনও আরও আধুনিক যুগের এক্সপোজারে আগ্রহী।
ইউলিসেস

হ্যাঁ, এটি অবশ্যই একটি সম্পূর্ণ ওভারহল নয়, তবে স্প্রিংজারের "লেকচার নোটস" এর কিছু খণ্ডগুলি ছাড়া অন্য কিছু আসলেই মনে আসে না, যা মূলত কেবলমাত্র কাগজপত্রের সংগ্রহ। যদি আপনি অন্য কিছু খুঁজে পান তবে দয়া করে একটি আপডেট পোস্ট করুন; আমি এটি পরীক্ষা করতে পছন্দ করি।
ম্যাট ক্রাউস

আমি দেখছি, অবশ্যই আমি করব
ইউলিসেস

1
@ চার্লিপার্কার, আমি নিশ্চিত নই সর্বাধিক সাম্প্রতিক খসড়া (19 জুন 2017) মোটামুটি সম্পূর্ণ দেখায় এবং এমআইটি প্রেসের উল্লেখ করে, তবে এমআইটি প্রেস সাইটটি এখনও প্রথম সংস্করণটি বিক্রি করছে বলে মনে হয়। এটির জন্য মূল্যবান, খসড়াটি সরাসরি লেখকদের পাবলিক ওয়েবসাইট থেকে হয়, সুতরাং "ফাঁস" সংস্করণ বা এর মতো কিছু ব্যবহার করার বিষয়ে উদ্বিগ্ন হওয়ার দরকার নেই।
ম্যাট ক্রাউস

1
@ থমাস, আমি একটি নতুন খসড়া সহ লিঙ্কটি আপডেট করেছি।
ম্যাট ক্রাউস

6

আপনি চেক আউট করতে পারেন 2010 সালে প্রকাশিত সিএসবা সাজেপেসওয়ারি দ্বারা পুনর্বহাল শেখার জন্য অ্যালগরিদমগুলি PDF পিডিএফ ওয়েব সাইট থেকে ডাউনলোডযোগ্য। আমার মতে, এটি সাটন এবং বার্তোর চেয়ে কিছুটা বেশি প্রযুক্তিগত তবে এতে কম উপাদান রয়েছে।


6

এখানে আপনার কয়েকটি ভাল পাঠ্যপুস্তক / রেফারেন্স রয়েছে:

সর্বোত্তম

সাটন আরএস, বার্তো এজি। শক্তিবৃদ্ধি শিক্ষা: একটি ভূমিকা। কেমব্রিজ, গণ: একটি ব্র্যাডফোর্ড বই; 1998. 322 পি।

দ্বিতীয় সংস্করণের খসড়া বিনামূল্যে পাওয়া যায়: https://webdocs.cs.ualberta.ca/~sutton/book/the-book.html

রাসেল / নরভিগ অধ্যায় 21:

রাসেল এসজে, নরভিগ পি, ডেভিস ই কৃত্রিম বুদ্ধিমত্তা: একটি আধুনিক পদ্ধতি। আপার স্যাডল রিভার, এনজে: প্রেন্টাইস হল; 2010।

আরও প্রযুক্তিগত

জেস্পেসরি সি। অ্যালগরিদম পুনর্বহাল শেখার জন্য। কৃত্রিম বুদ্ধিমত্তা এবং মেশিন লার্নিং উপর সংশ্লেষ বক্তৃতা। 2010; 4 (1): 1-103। http://www.ualberta.ca/~szepesva/RLBook.html

বার্টসেকাস ডিপি। ডায়নামিক প্রোগ্রামিং এবং সর্বোত্তম নিয়ন্ত্রণ। চতুর্থ সংস্করণ। বেলমন্ট, ভর: অ্যাথেনা বৈজ্ঞানিক; 2007. 1270 পি। অধ্যায় 6, দ্বিতীয় খণ্ডটি বিনামূল্যে পাওয়া যায়: http://web.mit.edu/dimitrib/www/dpchapter.pdf

আরও সাম্প্রতিক উন্নয়নের জন্য

ওয়্যারিং এম, ভ্যান ওটার্লো এম, সম্পাদক। শক্তিবৃদ্ধি শেখা। বার্লিন, হাইডেলবার্গ: স্প্রিঞ্জার বার্লিন হাইডেলবার্গ; 2012 থেকে উপলব্ধ: http://link.springer.com/10.1007/978-3-642-27645-3

কোচেনডেরফার এমজে, আমাতো সি, চৌধারী জি, হাও জেপি, রেনল্ডস এইচজেডি, থর্টন জেআর, ইত্যাদি। অনিশ্চয়তার অধীনে সিদ্ধান্ত গ্রহণ: তত্ত্ব এবং প্রয়োগ। 1 সংস্করণ। কেমব্রিজ, ম্যাসাচুসেটস: এমআইটি প্রেস; 2015. 352 পি।

মাল্টি এজেন্ট পুনর্বহাল শেখা

বুওনিউ এল, বাবুউকা আর, শুটার বিডি। মাল্টি এজেন্ট শক্তিবৃদ্ধি শিক্ষা: একটি ওভারভিউ। ইন: শ্রীনিবাসন ডি, জৈন এলসি, সম্পাদকগণ। মাল্টি-এজেন্ট সিস্টেম এবং অ্যাপ্লিকেশনগুলিতে উদ্ভাবন - 1। স্প্রিঞ্জার বার্লিন হাইডেলবার্গ; 2010 পি। 183-221। থেকে উপলব্ধ: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

শোয়ার্জ এইচএম। মাল্টি এজেন্ট মেশিন লার্নিং: একটি পুনর্বহাল পদ্ধতি approach হোবোকেন, নিউ জার্সি: উইলি; 2014।

ভিডিও / কোর্স

আমি ইউটিউবে ডেভিড সিলভার কোর্সের পরামর্শও দেব: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2O6262Ofa


3

এমএন সিএস 229-এ স্ট্যানফোর্ডের কোর্সে অ্যান্ড্রু এনগের কাছ থেকে রিইনফোর্সমেন্ট লার্নিংয়ে আমার প্রিয় লেকচারের নোটগুলি হ'ল:

সংশোধন শেখার স্ট্যানফোর্ড CS229 নোট করে

আপনি আইটিউনসে বক্তৃতা ভিডিওগুলি ডাউনলোড করতে পারেন। বা ইউটিউবে, তারা নীচের লিঙ্কে শুরু:

বক্তৃতা 16 CS229

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.