ন্যাশ ভারসাম্য গণনার জন্য অ্যালগরিদম।


10

আমি ফোরামটি অনুসন্ধান করেছি এটি আগে জিজ্ঞাসা করা হয়েছে কিনা তা দেখার জন্য, এবং অ্যালগরিদমিক গেম তত্ত্বটি আলোচিত হওয়ার পরেও আমি এই বিশেষ সমস্যাটির সমাধান করতে পারি না। আমি সীমাবদ্ধ এন-পার্সোনাল গেমের আনুমানিক (মিশ্র-কৌশল) ন্যাশ ভারসাম্য গণনা করার জন্য সর্বাধিক পরিচিত অ্যালগরিদম কী তা বের করার চেষ্টা করছি। অবশ্যই, এই অ্যালগরিদমটি পিপিএড হবে। আমি অ্যালগরিদমের নিখুঁত নির্ভুলতার চেয়ে গতি / দক্ষতায় আগ্রহী।

ধন্যবাদ, ফিলিপ


আপনি আরও বিশদ দিলে আমরা আপনাকে আরও ভালভাবে সহায়তা করতে পারি। উদাহরণস্বরূপ কোন মান আপনার মনে আছে? পেওফের কাজটির কোনও বিশেষ কাঠামো মাথায় রেখেছেন? আপনার কি সত্যিই কোনও ন্যাশ ভারসাম্য দরকার বা কোনও সংযুক্ত ভারসাম্যই যথেষ্ট হবে? আপনি কি ভাল প্রমাণযোগ্য সীমা সহ কিছু বা ভাল ব্যবহারিক পারফরম্যান্স সহ কিছু খুঁজছেন? এন
ওয়ারেন স্কুডি

উত্তর:


7

সংক্ষিপ্ত উত্তরটি হ'ল যদিও প্রায় ন্যাশ ভারসাম্যহীনভাবে সন্ধানের জন্য কিছু বহু-কালীন অ্যালগরিদম রয়েছে তবে তারা সকলেই তুলনামূলকভাবে খুব কম অনুমানের সন্ধান করে - সম্ভবত আপনি যদি কোনও খেলা খেলতে একটি অ্যালগরিদম সন্ধান করার চেষ্টা করছেন তবে সম্ভবত যথেষ্ট ভাল নয়। এন প্লেয়ার গেমসের চেয়ে 2 প্লেয়ার গেমের জন্য বেশি পরিচিত।

আপনি যা চেষ্টা করছেন তা যদি বাস্তবে কোনও (আনুমানিক) ন্যাশ ভারসাম্য খুঁজে পাওয়া যায়, তবে আপনি যা চেষ্টা করতে পারেন তার কোড করার সহজ উপায়টি গেম খেলার অনুকরণ করে, প্রতিটি খেলোয়াড় এলোমেলোভাবে ওজনযুক্ত সংখ্যাগরিষ্ঠ অ্যালগরিদম ব্যবহার করে (http://en.wikedia.org/ উইকি / Randomized_weighted_majority_algorithm)। এটি কাজের গ্যারান্টিযুক্ত নয়, তবে বেশিরভাগ ক্ষেত্রেই (এবং শূন্য-সম গেমগুলির মতো কয়েকটি নির্দিষ্ট গেমের গ্যারান্টিযুক্ত)। বিশেষত, যদি এই প্রক্রিয়াটি একেবারে রূপান্তরিত হয় তবে এটি ন্যাশ ভারসাম্যতে রূপান্তরিত হওয়ার গ্যারান্টিযুক্ত। বিপদটি হ'ল এটি চিরতরে একত্রিত হবে না, এবং চক্রটি চিরদিনের জন্য - তবে এই ক্ষেত্রেও, গেম খেলার অভিজ্ঞতাগত ইতিহাসটি মোটা সংযুক্ত সমান্তরালতার সেটে রূপান্তরিত করবে।


আমি উপরের উত্তরে উল্লিখিত কাগজটি একবার দেখে নেওয়া শুরু করলাম। আমি এগুলির সমস্ত কিছুই বুঝতে পারি নি (বা এর প্রথম অংশে এর বেশিরভাগ অংশ) ... আপনি কেন ব্যাখ্যা করতে পারবেন কেন অনুমানটি "তুলনামূলকভাবে দরিদ্র?" এছাড়াও, আপনি কীভাবে সংক্ষিপ্তভাবে ব্যাখ্যা করতে পারেন যে "মোটা তুলনামূলক ভারসাম্য" কী? আমি জানি যে একটি পারস্পরিক সম্পর্কযুক্ত ভারসাম্য কী, তবে এই জাতীয় একটিটির জন্য এটি কী বোঝায়। মোটা হতে। অবশেষে, "গেম প্লে-এর অভিজ্ঞতাবাদী ইতিহাস রূপান্তরিত হবে ... [ইত্যাদি।]" এর অর্থ কী? যে জিনিসটি কখনই রূপান্তর করে না সে কীভাবে সিসিই এর সেটগুলিতে রূপান্তর করতে পারে? আপনার উত্তরের জন্য ধন্যবাদ, আমি এখন উইকিপিডিয়া নিবন্ধটি সন্ধান করছি।
ফিলিপ হোয়াইট

আলগোরিদিমগুলির কিছু পটভূমির জন্য যেগুলি বিতরণগুলি উত্সর্গীকৃত
অ্যারন রথ

আপনি যদি কোনও মোটা পারস্পরিক সম্পর্কযুক্ত ভারসাম্যের চেয়ে কোনও পারস্পরিক সম্পর্কযুক্ত ভারসাম্য চান তবে আপনি কোনও অভ্যন্তরীণ-আফসোস শিখতে পারেন। উদাহরণস্বরূপ (নির্লজ্জ প্লাগ) cs.brown.edu/~ws/papers/regret.pdf । সরাসরি বহুবর্ষের সময় পারস্পরিক সম্পর্কযুক্ত ভারসাম্য রক্ষার জন্য অ্যালগরিদমও রয়েছে।
ওয়ারেন স্কুডি


4

আপনি যদি অ্যালগরিদমগুলিতে আগ্রহী হন যা প্রকৃতপক্ষে সফ্টওয়্যারটিতে প্রয়োগ করা হয়, তবে আমি জানি যে কয়েকটি রয়েছে:

  1. গ্যামবিট প্যাকেজ (http://www.gambit-project.org/doc/index.html) 2-প্লেয়ার এবং এন-প্লেয়ারের সাধারণ ফর্মের জন্য বেশ কয়েকটি ন্যাশ ভারসাম্য আলগোরিদিম প্রয়োগ করে এবং কিছু ক্ষেত্রে বিস্তৃত ফর্ম গেমস।

  2. গেমট্রেসার (http://dags.stanford.edu/Games/gametracer.html) এন-প্লেয়ারের নর্মাল ফর্ম গেমগুলির জন্য গোবিন্দন ও উইলসনের জিএনএম এবং আইপিএ আলগোরিদিমগুলি প্রয়োগ করে।

  3. বড় গেমগুলির জন্য, খেলোয়াড়ের সংখ্যায় আকার তাত্পর্যপূর্ণভাবে বাড়ার কারণে স্বাভাবিক ফর্মের প্রতিনিধিত্ব সমস্যাযুক্ত। পরিবর্তে, যদি আপনার গেমের ইউটিলিটি ফাংশনটির নির্দিষ্ট ধরণের কাঠামো থাকে তবে আপনি এটিকে খুব কম স্থান ব্যবহার করে প্রকাশ করার জন্য একটি "সংক্ষিপ্ত প্রতিনিধিত্ব" (উদাহরণস্বরূপ গ্রাফিকাল গেমস, প্রতিসামগ্রী গেমস, অ্যাকশন-গ্রাফ গেমস) ব্যবহার করতে পারেন; এবং তদ্ব্যতীত কাঠামোটি প্রায়শই গণনামূলক গতির জন্য ব্যবহার করা যেতে পারে। সফ্টওয়্যারের শর্তাবলী, এজিজি সলভার (http://agg.cs.ubc.ca) গেমট্রেসারের জিএনএম অ্যালগরিদম এবং গ্যাম্বিটের সিম্পিডিভ অ্যালগরিদমকে অ্যাকশন-গ্রাফ গেমের (এজিজি) উপস্থাপনায় রূপান্তর করে। (অস্বীকৃতি: আমি এই সফটওয়্যার প্যাকাকের উন্নয়নের সাথে জড়িত))

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.