এই প্রশ্নটি আমি তৈরি করেছি এবং বর্তমানে বেশিরভাগ কম্পিউটার গেমগুলিতে ব্যবহৃত হচ্ছে, বা ব্যবহার করার পরিকল্পনা রয়েছে এমন কম্পিউটার বিরোধীদের কাছে এমন একটি পদ্ধতির বিষয়ে।
পটভূমি
গত বছর, যখন "মাইনসুইপার ফ্ল্যাগস" নামে একটি গেমের জন্য কম্পিউটার প্রতিপক্ষকে উন্নত করার চেষ্টা করার সময় (সংক্ষিপ্ত বিবরণ: মাইনসুইপারের একটি টার্ন-ভিত্তিক মাল্টিপ্লেয়ার সংস্করণ যেখানে আপনাকে আপনার প্রতিপক্ষের চেয়ে আরও খনি গ্রহণ করতে হবে ) , আমি আমার অ্যালগরিদমগুলি যেভাবে কাজ করেছি তার দৃ strongly়তার সাথে পরিবর্তন করেছি I । If-else-if-else এর মতো একটি পদ্ধতির ব্যবহার না করে, সেরা পদক্ষেপটি কী তা নির্ধারণ করতে আমি নির্দিষ্ট ওজনযুক্ত "স্কোরার" এর একটি সেট ব্যবহার করছি।
আপনি ভাবতে পারেন মাইনসুইপার ফ্ল্যাগগুলির মতো একটি খেলার জন্য, এটি কেবল এমন চালগুলি তৈরি করা যা আপনাকে খনি গ্রহণের সর্বোচ্চ সম্ভাবনা দেয় তবে এটি এতটা সহজ নয়। কম্পিউটারটি কোন পদক্ষেপটি তৈরি করবে তা বর্তমান গেমের স্থিতিতে নির্দিষ্ট পদক্ষেপের জন্য বেশ কয়েকটি বৈশিষ্ট্যের উপর নির্ভর করে। বৈশিষ্ট্যগুলির উদাহরণ:
- খনি চালানোর এই পদক্ষেপের সম্ভাবনা কী?
- এখানে আমার প্রতিপক্ষের কাছে কিছু প্রকাশ করার সম্ভাবনা কী?
সিস্টেমের বিবরণ
সিস্টেমটি মূলত এইভাবে কাজ করে:
- "প্রাক-স্কোরারস": বর্তমান গেমের রাজ্যের জন্য কিছু প্রাক-বিশ্লেষণ করা হয় (মাইনসুইপার পতাকাগুলির ক্ষেত্রে, এটি সাধারণত: সমস্ত সম্ভাবনার গণনা করা হয়)
- "স্কোরারস": সাধারণ স্কোরারদের একটি সেটকে প্রতিটি সম্ভাব্য পদক্ষেপের জন্য স্কোর নির্ধারণ করতে বলা হয়, প্রতিটি স্কোরার নিজস্ব মানদণ্ড অনুযায়ী স্কোর প্রয়োগ করে। স্কোরাররা তৈরি করা প্রাক-বিশ্লেষণের ফলাফলগুলি পরীক্ষা করতে পারে।
- উপরের ধাপে গণনা করা স্কোরগুলি একসাথে সংক্ষিপ্ত করে এবং সরানো জন্য স্কোর হিসাবে সেট করা হয়।
- চালগুলি তাদের স্কোর অনুসারে বাছাই করা হয় এবং র্যাঙ্ক করা হয় যাতে একই স্কোর সহ সমস্ত চাল একই র্যাঙ্ক পায়।
- "পোস্ট-স্কোরারস": উপরের ফলাফলটি "পোস্ট-স্কোরার "গুলিতে প্রেরণ করা যেতে পারে যা পোস্ট-স্কোরারের নিজস্ব নিয়ম অনুসারে যে কোনও ক্ষেত্রের স্কোরকে তারা যেভাবে চায় পরিবর্তন করতে পারে।
প্রাক স্কোরার, স্কোরার (তাদের ওজন সহ) এবং পোস্ট-স্কোরারদের একগুচ্ছ সংমিশ্রণের সময়, এটি আমি স্কোর কনফিগারেশন বলি ।
উদাহরণ ফলাফল
এটি মিনিসওয়েপার পতাকাগুলিতে প্রয়োগ করা স্কোরগুলির একটি উদাহরণ। এটি মানচিত্র যা স্কোর হয়েছিল:
এবং এটি একটি আসল স্কোর কনফিগারেশনের আউটপুট। এটি সম্ভাব্য পদক্ষেপের র্যাঙ্কটি দেখাচ্ছে, যেখানে 1 সেরা র্যাঙ্ক এবং সাদা রঙে হাইলাইট করা হয়েছে:
অত্যন্ত নমনীয় কোড রচনা করার জন্য ধন্যবাদ, এআই-তে এই পদ্ধতির পাশাপাশি অন্যান্য গেমগুলিতেও .োকানো যেতে পারে।
সুবিধাগুলি এবং অসুবিধাগুলি
এই সিস্টেমটির কিছু সুবিধা এবং অসুবিধাগুলি নীচে আমি নিজেকে ভাবতে পারি
সুবিধাদি
- এআইগুলির জন্য সম্পূর্ণ বিভিন্ন কনফিগারেশন তৈরি করা খুব সহজ।
- জেনেটিক অ্যালগরিদম দিয়ে এটি ব্যবহার করা সম্ভব: প্রতিটি স্কোরারের একটি যুক্ত ওজন থাকে, ওজন জিনে পরিণত হতে পারে।
- কিছু সরঞ্জাম ব্যবহার করে, একটি নির্দিষ্ট পদক্ষেপ কেন করা হয়েছিল এবং কোন স্কোরাররা মূলত এই পদক্ষেপের জন্য দায়ী ছিল তা পরীক্ষা করা সম্ভব
- সরঞ্জামগুলি ব্যবহার করে, সম্ভাব্য পদক্ষেপের সামগ্রিক স্কোর / র্যাঙ্কের একটি মানচিত্র তৈরি করা সম্ভব (উপরের স্ক্রিনশটের মতো)
- মানুষ যেভাবে খেলছে তাতে স্কোর প্রয়োগ করে, একটি "# এআই_আরর" তৈরি করা সম্ভব যা এমন পদক্ষেপের চেষ্টা করে যা মনে করে যে মানুষ তৈরি করবে
অসুবিধেও
- যতটা সম্ভব এআই খেলাকে ভাল করে তুলতে স্কোর কনফিগারেশনকে "সঠিকভাবে" সামঞ্জস্য করা অত্যন্ত কঠিন হতে পারে।
প্রশ্নাবলি
আমি এখানে নির্মিত সিস্টেমটি কি এআই বিশ্বে বহুল পরিচিত? এটিকে বাস্তব এআই পদে কী বলা হবে?
এই পদ্ধতির কোনও অর্থ রয়েছে কি না বা আপনার প্রস্তাব দেওয়ার মতো কোনও ভিন্ন পদ্ধতি রয়েছে?
এমন কোন উপায় রয়েছে যা স্কোর কনফিগারেশনটি টুইট করার প্রক্রিয়াটিকে সহজ করে তুলতে পারে?
শেষ প্রশ্নটি সম্পর্কে, আমি জেনেটিক অ্যালগরিদমগুলি ব্যবহারের সম্ভাবনা সম্পর্কে সচেতন, আমি সারসএ সম্পর্কেও হালকাভাবে সচেতন (এবং আমার মনে হয় যে আমার স্কোরারগুলি ওজনের সাথে সাইটের বৈশিষ্ট্যগুলির বর্ণনার সাথে সাদৃশ্যপূর্ণ, তবে আমার বোঝা থেকে আমি ঠিক এটি তৈরি করেছি না এখানে). আমি মনে করি যে সারসায় একটি সমস্যা হ'ল গেমটি শেষ না হওয়া পর্যন্ত আপনি পুরষ্কারটি জানেন না, সেরা পদক্ষেপটি প্রায়শই এমন একটি পদক্ষেপ যা কোনও পুরস্কার দেয় না (একটি খনি)। আপনার জয়ের সম্ভাবনাগুলি বর্তমান স্কোর উভয় (আপনি এবং আপনার প্রতিপক্ষের কতটি খনি নিয়েছেন) এবং বর্তমান মানচিত্রটি কেমন তা নির্ভর করে।
এই প্রশ্নটি মূলত একটি এখন অবরুদ্ধ কৃত্রিম বুদ্ধিমত্তা সাইটে পোস্ট করা হয়েছিল ।
এই পদ্ধতির জন্য ব্যবহৃত (জাভা) কোডটি এখন কোড পর্যালোচনাতে পোস্ট করা হয়েছে ।