আমার এআই-তে একটি তত্ত্ব রয়েছে যা আমি একটি "হোয়াইটপেপার" লিখতে চাই। আমি এআই-তে যে পার্থক্যটি সন্ধান করতে চাই তা হ'ল বনাম কৌশল শেখা। আমার প্রশ্ন, আমি এই বিষয় সম্পর্কে অন্যান্য উপাদানটি কোথায় পড়তে পারি?
আমি একটি দাবার উদাহরণ দিতে দিন। আসুন একটি দাবা এআইকে সর্বাধিক গাছ হিসাবে দেখি, যেখানে শত্রু ইউনিট ক্যাপচারিং সেই সিদ্ধান্তের জন্য "মুভ স্কোর" এ সেই ইউনিটের মান যুক্ত করে (এবং একইভাবে কোনও টুকরো হারানোও সেই স্কোরের মানকে বিয়োগ করে)। একটি পদ্ম ক্যাপচারটি 1 পয়েন্ট, একটি নাইট 4 পয়েন্ট, রোক 5 পয়েন্ট ইত্যাদির নেট হতে পারে net
কৌশলগুলি এই পয়েন্টগুলি প্রয়োগ করতে এবং পরবর্তী পদক্ষেপটি নির্ধারণ করতে এআই হবে; যেমন। দশটি সম্ভাব্য পদক্ষেপ দেওয়া হয়েছে, তিনটি মুভের শেষে সেরা (সর্বোচ্চ স্কোর) বাছুন।
শিক্ষাগুলি সেই মানগুলি নির্ধারণের জন্য পরিসংখ্যান পর্যবেক্ষণ প্রয়োগ করবে। আপনি যদি 100 টি গেম খেলেন, তবে এআই সিদ্ধান্ত নিতে পারে যে একটি পদ্ম ক্যাপচারটি 2 পয়েন্ট এবং একটি নাইটের মূল্য 7 পয়েন্ট, যখন একটি রোকটির মূল্য 3 পয়েন্ট (100 গেমপ্লের উপর ভিত্তি করে)।
এই পার্থক্য কি ইতিমধ্যে সাহিত্যে বিদ্যমান আছে এবং যদি তাই হয় তবে আমি এটি সম্পর্কে কোথায় পড়তে পারি ?
সম্পাদনা করুন: কেউ কি কোনও দাবা খেলা জানেন (উত্স-কোড সহ সর্বাধিক) যা এই পদ্ধতিকে কাজে লাগায়? সম্ভবত দাবা960 @ হোম ?