ন্যাশ ভারসাম্য রচনামূলক গতির সংস্করণ?


14

আমি ভাবছি যে ন্যাশ ভারসাম্য ধারণার একটি কম্পিউটেশনাল সীমাবদ্ধ সংস্করণ আছে, নিম্নলিখিত লাইন বরাবর কিছু।

দুজন খেলোয়াড়ের মধ্যে নিখুঁত তথ্য খেলা যা একটি খেলা কিছু কল্পনা বোর্ড, এবং যা অর্থে জটিল যে অনুকূল খেলা EXPTIME-কঠিন। মনে করুন সরলতার জন্য যা আঁকানো সম্ভব নয়। একে অপরের বিপরীতে এই গেমটি খেলতে এলোমেলোভাবে বহুপদী-সময় টুরিং মেশিনগুলির একটি জোড়া ( , বি ) কল্পনা করুন । প্রত্যেকের জন্য এন যাক পি একটি , বি ( এন ) সম্ভাব্যতা যে হতে একটি beats বি order- এ এন গেম। (সংক্ষিপ্ততার জন্য, বলি যে n×n(A,B)npA,B(n)ABnAসম্ভাব্যতা 0.5 প্রথম খেলতে পায়।) আমি কি হবে শীতল যদি এক এক জোড়া অস্তিত্বের প্রমাণ পারে মনে সম্পত্তি যে কোন মেশিন টুরিং এলোমেলোভাবে বহুপদী-সময়ের সাথে সাথে একটি ' প্রাধান্য পায় একটি (যেখানে " একজন ' প্রাধান্য একজন "অর্থ পি একটি ' , বি ( এন ) > P একজন , বি ( এন ) সব ভালোই বড় জন্য এন ), এবং একইভাবে কোন এলোমেলোভাবে বহুপদী টাইম মেশিন টুরিং বি '(A,B)A AAApA,B(n)>pA,B(n)nB আধিপত্য বিস্তার করে (যেখানে " বি আধিপত্য বি " এর অর্থ পি , বি ( এন ) < পি , বি ( এন ) যথেষ্ট পরিমাণে বড় এন এর জন্য )।BBBpA,B(n)<pA,B(n)n

একরকম, আমার সন্দেহ হয় যে এটি আশা করা খুব বেশি, তবে কি এইরকম কিছু সত্য হওয়ার আশা রয়েছে, সম্ভবত একটি সীমিত ক্লাসের গেমসের জন্য?

এই প্রশ্নের জন্য একটি অনুপ্রেরণা হ'ল আমি প্রদত্ত দাবা অবস্থান "হোয়াইটের পক্ষে উপকারী" এই ধারণাটি আনুষ্ঠানিক করার উপায় খুঁজছি। ধ্রুপদীভাবে, কোনও পদ হ'ল হোয়াইটের পক্ষে জয়ের বা তা নয়। যাইহোক, দাবা খেলোয়াড়গণ, উভয়ই মানব এবং কম্পিউটার, হোয়াইটের পক্ষে সুবিধা অর্জনের অর্থ কী তা সম্পর্কে একটি অন্তর্জ্ঞানীয় ধারণা রয়েছে। খেলোয়াড়গণ গণনীয়ভাবে আবদ্ধ এবং সেরা পদক্ষেপে অনুমান করতে হবে যে, হোয়াইটের জয়ের সম্ভাবনাটি কিছুটা আছে বলে মনে হচ্ছে। এলোমেলোভাবে আলগোরিদিম একটি নির্দিষ্ট যুগল সম্ভাব্যতার যে হোয়াইট জিতবে, কিন্তু কি আমি ভাবছি করছি যদি থাকতে পারে, একটি হল কিছু অর্থে সম্পর্কে অবশ্যই আলাপ এক করতে পারেন ক্যানোনিকাল কম্পিউটেশনাল সীমাবদ্ধ খেলোয়াড়দের জুটি যার জয়ের সম্ভাবনা এমন পজিশনের জন্য একটি মূল্য অর্জন করে যা কেবল গেমের উপর নির্ভর করে এবং খেলোয়াড়দের আইডিসিঙ্ক্রেসিগুলি নয়।


হ্যাল্পার্ন, পাস, এবং সিমেন ফোক থিওরিমের মিথের পিছনে সত্য হিসাবে ভাবনা , 2014 - আমি জানি যে গণনাগতভাবে সীমাবদ্ধ ভারসাম্য ধারণাগুলি সম্পর্কে আমি জানি , সেখানে আমরা অনুমান করি না যে প্রদত্ত গেমটির জন্য একটি ভারসাম্যপূর্ণ কৌশল খুঁজে পাওয়া যায় finding হার্ড (কারণ প্রদত্ত গেমের জন্য, এটি হতে পারে বা নাও হতে পারে)। বরং যে কোনও খেলোয়াড়ের পক্ষে লাভজনক বিচ্যুতি গণনা করা যদি শক্ত হয় তবে আমরা কোনও কৌশলকে একটি ভারসাম্য হিসাবে মেনে চলি। (এটি ক্ষতিকারক কৌশল স্থান অনুমান করে নোট করুন, অন্যথায় আমরা সমস্ত বিচ্যুতি পরীক্ষা করতে পারি))
usul

উত্তর:


1

এই প্রশ্নের সহজ, সম্পূর্ণ মার্জিত / সন্তোষজনক উত্তর থাকতে পারে এমন কোনও উপায়ে আমি ভাবতে পারি না, বিশেষত কারণ শেষের বেতনটি গণনা করা খুব কঠিন; তবে আমার মতামত মন্তব্য হিসাবে পোস্ট করতে খুব দীর্ঘ।

আমার কাছে সর্বোত্তম ধারণাটি হ'ল: দাবায়ের ক্ষেত্রে, সেই যথাযথ পরিমাণের সাথে এলোমেলোভাবে অবস্থানগুলি নির্বাচন করে প্রদত্ত অবস্থার জন্য হোয়াইটের বস্তুগত সুবিধার ভিত্তিতে (যেমন, অতিরিক্ত প্যাঁক, নাইটস, ইত্যাদি) উপর ভিত্তি করে হোয়াইটের যে সম্ভাবনা রয়েছে তা অনুমান করার চেষ্টা করুন che - উপাদান কনফিগারেশন। সম্ভবত "অল-রুকস দাবা" -র ক্ষেত্রে আমরা বলতে পারি, "হোয়াইট ব্ল্যাকের ১ 17 টি রুকের সাথে ৮ টি রুক নিয়ে জয়ের সম্ভাবনা কতটা?" সম্ভবত এই সম্ভাবনা 4%; এটি গণনা করার জন্য, আমাদের 1000 এলোমেলোভাবে উত্পন্ন দাবা অবস্থানগুলিতে 8 টি সাদা রুকস এবং 17 টি কালো রুক রয়েছে যাচাই করতে হবে এবং তারপরে প্রতিটি কথায় 10 গতি এগিয়ে যেতে হবে (বলুন) এবং নতুন উপাদান কনফিগারেশনটি কী তা দেখুন । তারপরে, শেষে সামগ্রীর কনফিগারেশনের উপর ভিত্তি করে প্রত্যাশিত প্রতিক্রিয়াগুলি নিয়ে যান,

অবশ্যই, প্রতিটি প্রাসঙ্গিক সম্ভাবনার জন্য উপাদান কনফিগারেশনটি সন্ধান করা প্রয়োজন ( এম , এন ) এর এম সাদা rooks এন কালো rooks ... সম্ভবতঃ সর্বনিম্ন আদেশ যুগল থেকে শুরু ( এম = 1, এন = 1) এবং পরিশ্রমী সেখান থেকে উপরে

মূল অবস্থানের জন্য, আপনি যে পরিসংখ্যান পেয়েছেন তা নিয়ে চলুন না (যেমন, যদি মূল অবস্থানটি ( এম = 6, এন = 7) রুকস থাকে তবে কেবল ধরে নিবেন না যে হোয়াইটের জয়ের সম্ভাবনা আছে 25% কারণ এটি (,,7) এর জন্য জয়ের প্রত্যাশিত প্রতিকূলতা; পরিবর্তে, কারণ আপনি আরও সুনির্দিষ্ট হতে পারেন, ঠিক এই এক অবস্থানের সাথে যথারীতি 10 গতিপথটি দেখুন এবং প্রতিটি সম্ভাব্য সমাপ্তি অবস্থানটি সন্ধান করুন। তারপরে, 10-মুভস-গভীর-কনফিগারেশনের সঠিক পথটি (যার মধ্যে উভয় পক্ষের অনুকূল খেলনা জড়িত) সন্ধান করুন এবং এই অবস্থানটির প্রত্যাশিত প্রতিকূলগুলি মূল অবস্থানের প্রত্যাশিত প্রতিকূলতা হিসাবে নির্বাচন করুন।

আমি মনে করি এই প্রক্রিয়াটি বহুপাক্ষিক সময়ে করা যেতে পারে। খুঁজছি সংশোধন জন্য গভীর প্যাচসমূহ দাবা বোর্ডের আকার বহুপদী, এবং সাদা আর কালোর rooks মোট সংখ্যা ইউনারী প্রকাশ করা হয় (ক অর্থে) কারণ যে সংখ্যা বোর্ডের আকার চেয়ে ছোট হতে হবে।

যদি এটি জটিল এবং ব্যাখ্যা করা শক্ত মনে হয়, কারণ এটি। আমি যা বর্ণনা করছি তার আরও সংক্ষিপ্তসার সংক্ষিপ্তসারটি হ'ল: বোর্ডে শ্বেত প্রদত্ত এম হোয়াইট রুকস এবং এন ব্ল্যাক রুকসের বিজয়ের প্রতিক্রিয়া গণনা করতে পুনরাবৃত্তি এবং মৌলিক পরিসংখ্যান ব্যবহার করুন । তারপরে এই মানগুলিকে কে আরও সরানো দেখায় এবং হোয়াইট মূল অবস্থানটিতে যে প্রতিকূলতা অর্জন করবে তা নির্ধারণ করতে ব্যবহার করুন ।

চূড়ান্ত মন্তব্য: আমি মনে করি এই সমস্যাটি টিকিট্যাক-টো-এর মতো অ-এক্সপটাইম-সম্পূর্ণ গেমগুলির জন্যও আকর্ষণীয়, যা উইকিপিডিয়া অনুসারে পিএসপিএসিই-সম্পূর্ণ। আরও, আমি বিশ্বাস করি যে আমি উপরে বর্ণিত মত একটি প্রক্রিয়াও সেখানে কার্যকর হতে পারে, যদিও স্পষ্টতই টিক-ট্যাক-টোয় "উপাদান" সুবিধা পাওয়া অসম্ভব হবে; এক্স বা ও এর অবস্থানের শ্রেষ্ঠত্ব বিচারের জন্য আরও কিছু ভিত্তি থাকতে হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.