একটি "অপ-নিখুঁত" এআই যোদ্ধা তৈরি করার ক্ষেত্রে কী আচরণ করা উচিত?


19

এনপিসি যোদ্ধা তৈরি করার সময়, যুদ্ধ কৌশল, সময় ও আক্রমণাত্মক ধরণের অনুকূলিতকরণের মাধ্যমে রোবট ডেথম্যাশিন পেতে কী করা সহজ , তবে একটি আইডিসিঙ্ক্র্যাটিক, অনিবার্য শত্রু পেতে আরও শক্ত (এবং লড়াইয়ে আরও আকর্ষণীয়) হওয়া সহজ obvious আরও জৈব, অপ্রচলিত শত্রু তৈরি করার জন্য কোন আচরণগুলি (অ্যালগোরিদম?) কার্যকর?

সম্পাদনা: আমার নির্দিষ্ট ব্যবহারের ঘটনাটি এমএমও-জাতীয় শত্রুদের সাথে রয়েছে, যেমন ওয়ার্ল্ড ওয়ার্ক অব ওয়ার্ল্ড, যদিও এতে কম গ্রাফিক যুক্ত রয়েছে। নোট করুন যে এর অর্থ মানব এবং অমানবিক দুশমন (প্রাণী, দানব ইত্যাদি)

উত্তর:


14

গামসূত্র সম্পর্কিত একটি আকর্ষণীয় নিবন্ধ আছে: বুদ্ধিমান ভুল: মিক ওয়েস্ট দ্বারা রচিত, আপনার এআই কোডে বোকামি কীভাবে অন্তর্ভুক্ত করা যায়

এই নিবন্ধটি একটি পুল গেম এআই সম্পর্কে আলোচনা করেছে। যেমন একটি এআই বাস্তবায়ন করার সময়, প্রতিটি শ্যুট এ এটি একটি বল পট করা বেশ সহজ। এআইকে কম "স্মার্ট" বানানোর একটি সহজ উপায় হ'ল অন্যান্য জবাবগুলিতে যেমন পরামর্শ দেওয়া হয়েছে তেমন একটি এলোমেলো ফ্যাক্টরকে গণনাতে যুক্ত করা, যাতে এআই বেশি মিস হয়।

তবে এ জাতীয় পদ্ধতির সাথে দুটি বড় ত্রুটি রয়েছে। প্রথমত, এটি অনির্দেশ্য। "ইজি" মোডে খেলছেন এমন কোনও খেলোয়াড়ের জন্য, এআই "ভাগ্যবান" হওয়ার পক্ষে এটি গ্রহণযোগ্য নয়। যদি আপনার এলোমেলো ফ্যাক্টর এআইকে আরও ভাল শট করতে, আরও মূল্যবান বলটি মারতে বা কম্বো করে তোলে? কী হতে চলেছে তা আপনি জানেন না এবং ভাগ্যবান হওয়া এআইয়ের পক্ষে সহজ মোডে বিকল্প হওয়া উচিত নয়।

অন্য ত্রুটিটি হ'ল প্লেয়ার এআই আচরণগুলির একটি প্যাটার্ন সনাক্ত করার চেষ্টা করবে। এবং একটি সাধারণ এলোমেলো ফ্যাক্টর সহ, কোনও প্যাটার্ন নেই। তবে এর অর্থ এই নয় যে প্লেয়ারটি আসলে কোনও বিপরীতে দেখতে পাবে না, এটি সম্পূর্ণ বিপরীতে। এআই ভাগ্যবান হওয়ার সাথে সাথেই প্লেয়ারটি তার আচরণের একটি কৌশল দেখতে পাবেন। নিবন্ধে, খেলোয়াড়রা এআই একটি অবস্থান কৌশল খেলে অভিযোগ করছে। যখন কৌণিক নির্ভুলতায় কেবল একটি এলোমেলো ফ্যাক্টর থাকে

আমার দৃষ্টিকোণ থেকে, এই চোখ খোলা নিবন্ধটি পড়ার পরে, একটি অ-নিখুঁত এআই কখনও সরলকরণের ফ্যাক্টর হিসাবে এলোমেলোকরণ ব্যবহার করা উচিত নয়। এটি সম্পূর্ণ বিপরীত। একটি সহজ এআই আরও স্মার্ট হওয়া উচিত, তবে প্লেয়ারকে সহায়তা করার চেষ্টা করা।

পুল গেম উদাহরণটি নিবন্ধে, "ইজি মোড" এআই বাস্তবায়নের সর্বোত্তম বিকল্পটি ছিল সমস্ত র্যান্ডম ফ্যাক্টর অপসারণ এবং অবস্থান নির্ধারণের কৌশল যুক্ত করা to খেলোয়াড়ের জন্য সহজ এবং দুর্দান্ত শট প্রস্তুত করার জন্য এআই বল হিট করার চেষ্টা করবে ।

এইভাবে, প্লেয়ার ভাবেন যে তিনি ভাগ্যবান হয়েছেন। আপনি যখন কোনও খেলা সহজ খেলেন তখন এটি প্রত্যাশা করে।


1
খেলোয়াড় কী কী সুবিধা নিতে সক্ষম তা এআইয়ের পক্ষে মনে রাখাও কার্যকর হবে। বিকাশকারীরা ভাবতে পারেন যে তাঁর একটি 'সহজ পাত্র' রয়েছে তবে তিনি যদি এটি পাত্র করতে না পারেন তবে কেস কৌশলটি এআই দ্বারা কম ব্যবহার করা উচিত। এটিও উপকারী, কারণ আপনি খেলোয়াড়কে প্রশিক্ষণ দিতে পারেন, তিনি কী করতে পারবেন না তা মনে রাখতে পারেন এবং উদ্দেশ্যমূলকভাবে যতবার না তিনি যতক্ষণ না এটি ব্যবহার করতে পারেন ততক্ষণ এইভাবে প্লেয়ার বিরক্ত হয় না, হতাশও হন না।
জোনাথন কনেল

যদিও আমি এলোমেলোকরণ ব্যবহার না করার সাথে একমত, আমি "প্লেয়ারকে সহায়তা করা" এর সাথে একমত নই: এটি প্রতারণার মতো হবে, তবে আরও খারাপ কারণ আপনি প্লেয়ারের সাথে মিথ্যা বলবেন ।
o0 '

@ লো'রিস: আচ্ছা, আমি এটিকে মিথ্যা বলে দেখছি না। খেলোয়াড়রা যখন খেলাটি তার উপর সহজ হতে বলে, তখন সে খেলাটি মৃদু হওয়ার প্রত্যাশা করে। আপনি যখন কোনও খেলা খেলেন যখন আপনি কেবল এমন এক বন্ধুর সাথে সত্যই ভাল আছেন যিনি এটি সন্ধান করছেন, তখন আমি তাকে সুযোগ দেওয়া ঠিক মনে করি। এটি গেমটি প্রত্যেকের জন্য আরও উপভোগ্য করে তুলেছে।
Tyn

1
এলোমেলোকরণের উপর শন হারগ্রিভসের একটি ভাল ব্লগ পোস্ট রয়েছে এবং এলোমেলোভাবে কোনও মানুষের নিদর্শন খুঁজে পাওয়ার ক্ষমতা রয়েছে। এটি টন অনুবাদ করবে, এক্ষেত্রে কোনও প্লেয়ার কোনও এআই খেলোয়াড়ের কৌশলকে ভুলভাবে বিচার করে।
জোনাথন কনেল

1
আসলে আমি মনে করি নির্ভুলতার উপর এলোমেলোকরণ হ'ল একটি ভাল উপায়। যারা যে মহান, কখনো কখনো তিনি ভুল করা এবং একটি ভাল বল আঘাত করবে না একটি বাস্তব খেলোয়াড় সঙ্গে।
AttackingHobo

10

মূল ধারণাটি হ'ল এনপিসিকে "নিখুঁত জ্ঞান" দেওয়া এড়ানো।

  • কোনও গণনা জড়িত যে কোনও সিদ্ধান্ত বা ক্রিয়ায় এলোমেলোভাবে ত্রুটির মার্জিন। সুস্পষ্ট উদাহরণ লক্ষ্য (যেমন স্ট্রাস্ট্রোপার স্নিপারস) ers যদি তারা সর্বদা আপনাকে আঘাত না করে তবে এটি আরও বাস্তবসম্মত।
  • দৃষ্টির রেখা ... যদি তারা আপনাকে না দেখতে পারে তবে এটি বিড়াল এবং মাউসের একটি আকর্ষণীয় খেলা করতে পারে।
  • আপনার খেলার ধরণের উপর নির্ভর করে দলগত কৌশল, পরিস্থিতিটির সাথে খাপ খাইয়ে নেওয়া শত্রুরা আরও আকর্ষণীয় হতে পারে। উদাহরণস্বরূপ, যদি আপনাকে গুলি করা হয়, তবে আপনি অন্ধভাবে চার্জ করবেন না, আগত আগুন না বের হওয়া পর্যন্ত আপনি কভারটি গ্রহণ করবেন। অথবা সম্ভবত আপনি যদি সতীর্থদের কাছাকাছি পেয়ে থাকেন তবে আপনি তাড়াহুড়ো করে আরও স্বাচ্ছন্দ্য বোধ করতে পারেন ... আপনি এই আচরণগুলি এনপিসিগুলিকে বেঁচে থাকার মতো করে এমন আচরণ করার জন্য অনুকরণ করতে পারেন।

আমি নিশ্চিত যে আরও একটি টনের আরও উদাহরণ দেওয়া হবে, সম্ভবত আপনি আপনার খেলা সম্পর্কে আমাদের বলতে পারেন এবং আমরা আরও নির্দিষ্ট পেতে পারি :-)


4

নিখুঁত এআই যুদ্ধসাপেক্ষ রেন্ডার করার একটি দ্রুত উপায় হ'ল এটির ইনপুট বা এর ফলাফলগুলিতে কিছু 'শব্দ' যুক্ত করে অনভিজ্ঞ সিদ্ধান্ত নেওয়া। আওয়াজ দ্বারা আমি কিছু এলোমেলো কারণগুলি বোঝাচ্ছি।

আউটপুট জন্য এখানে একটি ছোট উদাহরণ:

  • পারফেক্ট অ্যালগরিদম স্কোরের সাথে তিনটি সম্ভাব্য ক্রিয়াকলাপ দেয়।
  • প্রতিটি স্কোর এলোমেলো মান যোগ করুন।
  • সেরা স্কোর বাছাই করুন।

ইনপুট জন্য এখানে কিছু ধারণা দেওয়া হয়:

  • যদি ক্রিয়াগুলি প্রতিপক্ষের স্বাস্থ্যের উপর ভিত্তি করে থাকে তবে এআই দ্বারা অনুভূত অবস্থায় একটি এলোমেলো ফ্যাক্টর (0-100 স্বাস্থ্য বারের জন্য +/- 10 বলুন) যুক্ত করুন।
  • ক্রিয়াকলাপের রেটিংয়ের জন্য একই, যদি এআই জানেন যে কিছু আক্রমণ অন্যদের চেয়ে শক্তিশালী, এলোমেলোভাবে সেখানে কিছু মান যুক্ত / বিয়োগ করুন।

একটি স্পষ্ট বিষয় বিবেচনায় রাখা এআই এর গতি। বেশিরভাগ গেমগুলিতে, এআইরা মানুষের চেয়ে অনেক বেশি দ্রুত প্রতিক্রিয়া জানাতে পারে (বিশেষত যুদ্ধে) এবং স্পষ্টত মাল্টিটাস্কিং করতে পারে (আরটিএস গেমগুলিতে খুব দৃশ্যমান)। সুতরাং আপনাকে এআইকে কিছুটা ধীরে ধীরে (সম্ভবত অভিযোজিতভাবে তাই) রেখে, এবং এটি নির্ধারিত সময়ের মধ্যে কী পরিমাণ জিনিস করতে পারে তা সীমাবদ্ধ করে (অর্থাৎ প্রতি অর্ধ-সেকেন্ডে একটি ক্রিয়া) চালিয়ে যেতে হবে।

আশা করি এটি সাহায্য করে, এবং সৌভাগ্য!


3

আপনি ঠিক কী করার চেষ্টা করছেন তা না জেনে সরাসরি দরকারী উত্তর দেওয়া কঠিন।

এই বিষয়ে আমার কাছে দুটি কথা বলতে হবে যা আপনাকে সাহায্য করতে পারে।

প্রথম জিনিস (এবং এটি এখন পর্যন্ত সবচেয়ে গুরুত্বপূর্ণ একটি), আপনি যদি শত্রুকে আরও আকর্ষণীয় এবং মানবিক মনে করার চেষ্টা করছেন তবে আপনার যুদ্ধ কৌশল অপ্রাসঙ্গিক। খেলোয়াড়দের "বিশ্বাস" করার শত্রুটি জীবিত থাকার কৌশলটি হ'ল অ্যানিমেশন, শব্দ এবং মানুষের আচরণ বোঝাতে সামান্য বিবরণ ব্যবহার করা। নিখুঁত এআই কোনও কোণে ঘুরতে পারে, কোনও খেলোয়াড় দেখতে এবং গুলি করতে পারে। একটি মানব এআই কোনও কোণে ঘুরে বেড়াতে পারে, একজন খেলোয়াড়কে দেখতে পারে, তার মুখের দিকে আশ্চর্য নজর রাখে এবং শঙ্কায় চেঁচিয়ে চিৎকার করে এবং গুলি করতে পারে। প্রথমটি রোবোটিক বলে মনে হচ্ছে। দ্বিতীয়টি মানুষের মনে হয়। উভয়ই শ্যুটিংয়ের ঠিক আগে অ্যানিমেশন সন্নিবেশ ব্যতীত (বা, শ্যুটিংয়ের সময় কৌশলগত আচরণ একই রাখার জন্য ) প্রতিটি উপায়ে অভিন্ন অ্যাসি ব্যবহার করে ।

দ্বিতীয়ত, এলোমেলোভাবে এড়ানো। ডিজাইনাররা যতটা ভাবতে চায় তারা খেলোয়াড়রা এটাকে প্রশংসা করে না। প্লেয়াররা দেখতে পাচ্ছে না "কম্পিউটার 100 এর মধ্যে 1 জেনারেট করে, তার পরে 5, 3 এবং 4 হয়, সুতরাং শেষ চারটি শটের ত্রুটির কারণগুলি কেবল 1%, 5%, 3% এবং 4% ছিল এবং এটি ছিল আপনি কেন এই রাউন্ডে অর্ধেক সেকেন্ডে মারা গেছেন? " খেলোয়াড়েরা কেবল শত্রুদের দেখতে পান যা মাঝে মাঝে বুদ্ধিমানভাবে মিস হয়ে যায় এবং অন্যান্য সময়গুলি কোনও বোধগম্য কারণে বারবার পেরেক দেয়, যা অবিশ্বাস্যরকম হতাশাব্যঞ্জক। ভাল গেম ডিজাইন মূলত মানব প্লেয়ারগুলি যে নকশাগুলি তৈরি করতে পারে সেগুলি সম্পর্কেখেলোয়াড়ের ভাগ্যবান হয়েছে কিনা তা তৈরি করার পরিবর্তে তার নিজের রায় এবং দক্ষতা এবং স্বজ্ঞাততার ভিত্তিতে খেলোয়াড়ের সাফল্য অর্জন করা, শিখুন এবং মারধর করুন। র্যান্ডমাইজ করার তাগিদটি টেবিল-শীর্ষ গেমস এবং জুয়া গেমসের অভিজ্ঞতা থেকে আসে, যা উভয়ই ভিডিও গেমগুলির চেয়ে অবিশ্বাস্যরূপে ভিন্ন মাধ্যম (এবং যা একটি মাধ্যমের মধ্যে কাজ করে তা প্রায়শই অন্যটিতে বোঝা যায় না)।


1

আমার মনে আছে কলেজে আমাদের এআই কোর্সে এআইকে আরও "মানব" এবং কম নিখুঁত করার বিষয়ে একটি বিষয় ছিল। এটি বহু বছর আগে ছিল তাই আমার মনের শীর্ষ থেকে কয়েকটি বুলেট পয়েন্ট মাত্র মনে পড়ে।

  • "চালগুলির লাইব্রেরি" ব্যবহার করুন। যদি আপনি কোনও orc এর সাথে লড়াই করে চলেছেন তবে তাকে 3 টি যুদ্ধের রুটিন বলুন যা তারা এখন এবং পরে পুনরাবৃত্তি করে। এটি আরও অনুমানযোগ্য হয়ে লড়াইগুলিকে আরও সহজ করে তোলে, যা আপনি যা চান তার বিপরীত বলে মনে হয়, তবে এখনও এআইকে কম "নিখুঁত মেশিন" এবং আরও "একই পদক্ষেপটি বার বার" পুনরাবৃত্তি করে তোলে।
  • সম্ভব হলে সাবস্টিমাইজ করুন। যদি আপনি যেমনটি বলেন, আপনার এআই সেরা পদক্ষেপের গণনার উপর ভিত্তি করে এই গণনার উপর একটি কৃত্রিম সীমা রাখুন। অনুসন্ধান অগভীর করুন, বা পদক্ষেপের সংখ্যা সীমাবদ্ধ করুন। সর্বকালের সেরা পদক্ষেপের পরিবর্তে, এআই পরিবর্তে কেবল একটি ভাল পদক্ষেপ বেছে নেবে। এটি আপনার শত্রুদের আচরণে প্রচুর বৈচিত্র্য যুক্ত করতে পারে, যেহেতু সেরা পদক্ষেপের চেয়ে আরও অনেক ভাল রয়েছে।
  • উদ্দেশ্য ভুল করে। সেরা পদক্ষেপের পরিবর্তে দ্বিতীয় বা তৃতীয় সেরাটি বেছে নিন। অথবা এমন কোনও পদক্ষেপ বেছে নিন যা খারাপ ব্যবহার করে has এটি আপনার "অনাকাঙ্ক্ষিত" পয়েন্টটিকে সম্বোধন করতে পারে।

অবশ্যই এগুলি কেবলমাত্র সাধারণ পরামর্শ যা প্রতিটি কেসের জন্য অধ্যয়ন করা উচিত এবং প্লেস্টেড করা উচিত এবং এটি আপনার এআইকে উদ্দেশ্য থেকে আরও কৃত্রিম দেখায়। তবে আমি মনে করি এগুলি একটি ভাল সূচনা পয়েন্ট।


0

আমি এই পপ আপটি দেখেছি এবং একটি ধারণা ভাগ করতে চেয়েছিলাম যা আমি অতীতে ব্যবহার করেছি।

ধরা যাক চরিত্রটির তিনটি চাল আছে এবং প্রতিটি স্কোর হয়, উচ্চতর স্কোর একটি আরও ভাল চাল। (অন্যান্য উত্তরগুলি এই স্কোরটি তৈরিতে গোলমাল যোগ করার বিষয়ে কথা বলে))

  • একটি তরোয়াল দিয়ে আক্রমণ (30 পয়েন্ট)
  • ফায়ার স্পেল (50 পয়েন্ট)
  • বরফ বানান (20 পয়েন্ট)

মোট পয়েন্ট যোগ করুন (100)

এই স্ট্যাটাসের সর্বাধিক সম্ভাব্য মানটির বাইরে চরিত্রটির বুদ্ধিমত্তার স্ট্যাটাসটি ধরুন (আসুন 100 এর মধ্যে 60 বলুন)।

0 (বা অন্য কোনও তল) এবং বুদ্ধি অনুপাত (0.6) এর মধ্যে একটি এলোমেলো সংখ্যা তৈরি করুন, মোট পয়েন্টগুলি (100) দিয়ে গুণ করুন। আমাদের উদাহরণে, এর ফলাফলটি 45 বলে নেওয়া যাক।

এখন আপনি এই মানটি থেকে খারাপ পদক্ষেপগুলি বিয়োগ করা শুরু করবেন যতক্ষণ না আপনি শূন্য না হন। (ক্রমে বিয়োগ করুন।)

প্রথমে, আমরা আইস স্পেলটি বিবেচনা করি, যা একটি 20. 45 - 20 = 25 পেয়েছে। এটি শূন্যের উপরে, সুতরাং আমরা বরফের বানানটি ফেলে দেই।

দ্বিতীয়ত, 30 পয়েন্টের মূল্যযুক্ত তরোয়াল দিয়ে আক্রমণটি দেখুন। 25 - 30 = -5। আমরা আমাদের দোরগোড়ায় আঘাত করেছি, সুতরাং আমরা তরোয়াল ক্রিয়া সহ আক্রমণটিকে বেছে নিই।

এই সিস্টেমে, স্বল্প বুদ্ধিযুক্ত একটি চরিত্র সেরা পদক্ষেপ গ্রহণ করবে না। এবং উচ্চ বুদ্ধিযুক্ত একটি চরিত্র প্রায়শই সেরা পদক্ষেপটি বেছে নেবে। (এই উদাহরণে, নিখুঁত বুদ্ধিযুক্ত একটি অক্ষর সময়ের 50% সেরা পদক্ষেপ নিয়ে আসে move)

এলোমেলো সংখ্যায় একটি মেঝে প্রক্রিয়া যুক্ত করা আরও ভাল পদক্ষেপগুলি নির্বাচিত হওয়ার সুযোগ বাড়িয়ে তুলবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.