টিক টেক টের মতো খেলায় জেনেটিক অ্যালগরিদম বনাম নিউরাল নেটওয়ার্কগুলি?


9

বর্তমানে আমি এমন একটি প্রকল্প করছি যা গেমোকু গেমটি খেলতে একটি এআই তৈরি করতে চলেছে (এটি টিক টেক টোয়ের মতো, তবে 15 * 15 বোর্ডে খেলেছে এবং জয়ের জন্য পরপর 5 টি প্রয়োজন)। আমি ইতিমধ্যে সফলভাবে কিউ শিখতে এবং গেমের স্টেটগুলি / টেবিলের মধ্যে সঞ্চিত গেম স্টেটস / ক্রিয়াকলাপগুলি ব্যবহার করে একটি নিখুঁত টিক টাক টো এআই কার্যকরভাবে প্রয়োগ করেছি, তবে একটি 15 * 15 বোর্ডের জন্য সম্ভাব্য গেমের রাজ্যগুলিও এই প্রকল্পটি বাস্তবায়ন করে।

আমার প্রশ্ন হ'ল, আমি কি এই সমস্যার জন্য নিউরাল নেটওয়ার্ক বা জেনেটিক অ্যালগরিদম ব্যবহার করব? এবং আরও বিশেষভাবে, আমি কীভাবে এটি বাস্তবায়ন করব?


2
এআই তে আপনাকে স্বাগতম! দুর্দান্ত প্রশ্ন ইমো।
ডিউকঝো

উত্তর:


7

গোমোকুর ক্ষেত্রে, নিউরাল নেটওয়ার্ক বা জেনেটিক অ্যালগরিদম ব্যবহার করা কিছুটা ওভারকিলের কিছুটা মনে হয় কারণ এটি উভয়কে কিছুটা সময় নেয় এবং না হয়, আপনি কীভাবে চান তা যান না। গোমোকু গেম ট্রিটি বরং বড়, তবে ম্যাপিংয়ের বিপরীতে আপনি মিনিম্যাক্স, গেম ট্রি গাছের ছাঁটাই এবং একটি ভাল হিউরিস্টিক ফাংশন (যার মধ্যে অর্ধেক এবং পূর্ণ 2s, 3s, 4s, ... ইত্যাদি গণনা অন্তর্ভুক্ত রয়েছে) থেকে একটি শালীন এআই পেতে পারেন পুরো জায়গা খুঁজে।

আপনি যদি আলফা বিটা ছাঁটাই এবং মিনিম্যাক্সের সাথে অপরিচিত হন তবে https://www.cs.cornell.edu/courses/cs312/2002sp/lectures/rec21.htm দেখুন

আপনি যদি সত্যই নিউরাল নেটওয়ার্ক বা জেনেটিক অ্যালগরিদম ব্যবহার করতে চান তবে শেখার অভিজ্ঞতার জন্য আপনি পারেন। নিউরাল নেটওয়ার্কগুলি সম্পর্কে, এটি করার একটি উপায় নিম্নলিখিত:

  • একটি হিউরিস্টিক ফাংশন সংজ্ঞায়িত করুন যা বোর্ড স্টেট ইনপুট (খালি, কালো, সাদা জন্য 0,1,2 এর অনুক্রম) প্রাপ্ত করে এবং বোর্ডের রাজ্যের একটি 'সদর্থকতা' মান আউটপুট করে। নিউরাল নেটওয়ার্কটি আমাদের হিউরিস্টিক ফাংশন।
  • এই গেমের চালগুলি সর্বোত্তম কিনা তা ধরে নিলে, বর্তমানে সেরা পদক্ষেপের (আপনার বর্তমান পরামিতি দ্বারা) এবং আপনার ডেটা যা বলে তা সবচেয়ে ভাল মধ্যে পার্থক্য থেকে সরিয়ে প্রশিক্ষণ দিন। এভাবেই আমরা আমাদের ত্রুটির কার্যকারিতা সংজ্ঞায়িত করি! সুতরাং আপনি এই পার্থক্যটিকে হ্রাস করছেন যাতে আপনার নিউরাল নেটওয়ার্কটি যা বলছে সবচেয়ে শক্তিশালী তা আপনার গেমের ডেটা সবচেয়ে শক্তিশালী বলে মনে হয় (ব্যাকপ্রপ্যাগেশন বা জেনেটিক অ্যালগোরিদমের মাধ্যমে এই ত্রুটি ফাংশনটির অপ্টিমাইজেশন করা যেতে পারে)।
  • আদর্শভাবে, এই মুহুর্তে আপনি এখন হার্ডকোডযুক্ত হিউরিস্টিক্সের পরিবর্তে আপনার গেম ট্রি ট্রি মুভিংয়ের জন্য আপনার ('শক্তিশালী') নিউরাল নেটওয়ার্ক ভিত্তিক মূল্যায়ন ফাংশনটি ব্যবহার করতে পারেন।

অবশ্যই এটি কেবল একটি উপায় এবং আপনার প্রথমে গেমের ডেটা খুঁজে পাওয়া দরকার।

একটি পার্শ্ব নোট, জেনেটিক অ্যালগরিদম প্রয়োগ করা কয়েকটি উপায়ে ঘটতে পারে যেমন উপরে বর্ণিত একটি নিউরাল নেটওয়ার্কে প্যারামিটার অপ্টিমাইজেশন বা গেম ট্রি সন্ধানের ফলে নিশ্চিত হয়ে নিন যে আপনি এটির সাথে কীভাবে সমস্যা নির্ধারণের সংজ্ঞা দিচ্ছেন তা স্পষ্ট! নিউরাল নেটওয়ার্ক প্রয়োগের বিকল্প উপায়গুলির ক্ষেত্রে এটি একই রকম।

পরিশেষে, গোমুকু সমাধান করা জেনে রাখা সহায়ক। অন্যের চিন্তাভাবনা এবং ধারণাগুলির জন্য /programming/6952607/ai-strategy-for-gomoku-a-variation-of-tic-tac-toe দেখুন ।


2
একটি সমাধান খেলা হিসাবে গোমোকু সম্পর্কে দুর্দান্ত পয়েন্ট। এটি এআইয়ের শক্তি যাচাই করা সহজ করে তোলে (যেমন এটি কী গেমটি সমাধান করে এবং নিখুঁত খেলা প্রকাশ করে, বা এটি কেবল প্রতিপক্ষের চেয়ে আরও ভাল খেলছে, যেমন আলফাগোয়ের ক্ষেত্রে of)
ডিউকঝো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.