প্রশ্ন ট্যাগ «combinatorial-games»

4
শক্তিবৃদ্ধি শেখার ক্ষেত্রে কীভাবে অবৈধ পদক্ষেপগুলি পরিচালনা করবেন?
আমি এমন একটি এআই তৈরি করতে চাই যা পাঁচ-ইন-এ-সারি / গোমোকু খেলতে পারে। আমি শিরোনামে যেমন উল্লেখ করেছি, আমি এর জন্য পুনর্বহাল শেখার ব্যবহার করতে চাই। আমি বেসলাইন সহ পলিসি গ্রেডিয়েন্ট পদ্ধতি, যথা নাম REINFORCE ব্যবহার করি । মান এবং নীতি ফাংশন আনুমানিক জন্য, আমি একটি নিউরাল নেটওয়ার্ক ব্যবহার করি …

1
টিক টেক টের মতো খেলায় জেনেটিক অ্যালগরিদম বনাম নিউরাল নেটওয়ার্কগুলি?
বর্তমানে আমি এমন একটি প্রকল্প করছি যা গেমোকু গেমটি খেলতে একটি এআই তৈরি করতে চলেছে (এটি টিক টেক টোয়ের মতো, তবে 15 * 15 বোর্ডে খেলেছে এবং জয়ের জন্য পরপর 5 টি প্রয়োজন)। আমি ইতিমধ্যে সফলভাবে কিউ শিখতে এবং গেমের স্টেটগুলি / টেবিলের মধ্যে সঞ্চিত গেম স্টেটস / ক্রিয়াকলাপগুলি ব্যবহার …

1
দাবাড়ির মতো গেমগুলিতে শক্তিবৃদ্ধি শেখার প্রয়োগ সম্পর্কিত কয়েকটি সন্দেহ
আমি দাবা জাতীয় বোর্ড গেমটি আবিষ্কার করেছি। আমি একটি ইঞ্জিন তৈরি করেছি যাতে এটি স্বায়ত্তশাসিতভাবে খেলতে পারে। ইঞ্জিনটি মূলত একটি সিদ্ধান্ত গাছ। এটি রচনা করেছেন: একটি অনুসন্ধান ফাংশন যা প্রতিটি নোডে সমস্ত সম্ভাব্য আইনী পদক্ষেপ খুঁজে পায় একটি মূল্যায়ন ফাংশন যা বোর্ডের পজিশনে একটি সংখ্যাসূচক মূল্য নির্ধারণ করে (ইতিবাচক অর্থ …
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.