সীমাবদ্ধ-রাষ্ট্রের আংশিক তথ্য গেমগুলির জটিলতা


12

কেবলমাত্র চূড়ান্তভাবে অনেকগুলি রাজ্যের সাথে একটি নির্ণায়কীয় আংশিক-তথ্য শূন্য-সমষ্টি গেম দেওয়া হয়েছে,
যার সম্ভাব্য ফলাফল যথাক্রমে [হারান, আঁকুন, জয় করুন] সাথে মানগুলি [-1,0, + 1] যথাক্রমে,
এর মানটির কাছাকাছি যাওয়ার জটিলতা কী? একটি খেলা additively মধ্যে ?ϵ

বিশেষত, এটি করার জন্য আমি কোনও অ্যালগরিদম আসতে পারি না ।
এই পোস্টের বাকী অংশটি পুরোপুরি সমস্যার আরও বিশদ বিবরণ দেওয়ার জন্য উত্সর্গীকৃত
, সুতরাং যদি আপনি ইতিমধ্যে
এই পোস্টের শীর্ষে থাকা প্রশ্নটির অর্থ কী তা বুঝতে পারছেন তবে আপনার এই পোস্টের বাকী অংশটি পড়ার কোনও কারণ নেই।

যুক্তরাষ্ট্রের সঙ্গে রেফারির মেশিন দেওয়া , সঙ্গে একটি মনোনীত প্রাথমিক অবস্থায় গুলি 0 , একটি রাষ্ট্র গুলি একটি যার স্কোর জুড়ি [ - 1 , + + 1 ] , একটি রাষ্ট্র গুলি যার স্কোর জুড়ি [ + + 1 , - 1 ] , এবং ফর্ম রাজ্যের{1,2,3,...,S}s0sa[1,+1]sb[+1,1]

কোথায়:[p1_info,p2_info,num_of_choices,player_to_move,next_state_table]

  • player_to_move{1,2}
  • { 1 , 2 , 3 , থেকে একটি ফাংশন, Num_of_choices } { 1 , 2 , 3 , , এস }next_state_table{1,2,3,...,num_of_choices}{1,2,3,...,S}
  • p1_info,p2_info,num_of_choices1

যখন মেশিনটি সেই ফর্মের অবস্থায় থাকে:

  • পাঠায় Player_1 প্রয়োজন এবং পাঠায় p2_info Player_2 চাই,p1_infop2_info
  • num_of_choices{1,2,3,...,num_of_choices}
  • তারপরে দ্বারা নির্দেশিত রাজ্যে যায়next_state_table

sasb

  • তার আউটপুট হিসাবে সেই রাজ্যের স্কোর জুটি থামায়

s0=1





নিম্নলিখিত সমস্যার জটিলতা কী?
এই জাতীয় রেফারি মেশিন এবং ধনাত্মক পূর্ণসংখ্যার এন দেওয়া,
প্লেয়ার 1 এর জন্য প্রাকৃতিক গেমের মান 1 / N এর মধ্যে একটি যুক্তিযুক্ত সংখ্যার (যোগ করা) আউটপুট ।

এই প্রশ্নে আগেই উল্লেখ করা হয়েছে যে, এটি করার জন্য আমি
কোনও অ্যালগরিদম নিয়ে আসতে পারি না ।


খেলোয়াড়রা কি অভ্যন্তরীণ কাঠামো জানেন? অতিরিক্ত তথ্য থাকার সুবিধা কী, এটি আরও সম্ভাব্য পদক্ষেপ দেয়?
ডমোটরপ

হ্যাঁ. এটি তাদের বর্তমান অবস্থা কী সম্পর্কে আরও ভাল ধারণা দেয়।

দুঃখিত তবে আমি এখনও এটি পাই না। তারপরে তারা অভ্যন্তরীণ কাঠামো জানেন তবে তারা জানেন না এই মুহুর্তে তারা কোথায় আছেন? দয়া করে বর্ণনাটি পরিষ্কার করুন, আমি নিশ্চিত যে আমিই একমাত্র তিনিই নন যিনি সমস্যাটি বুঝতে পারবেন না।
ডোমোটরপ

3
আপনার মডেলটি কি "আংশিক তথ্য সহ জিরো-যোগ টার্ন-ভিত্তিক স্টোকাস্টিক গেম" এর মতো?
ক্রিস্টোফার আরনসফেল্ট হ্যানসেন

1
@ ক্রিস্টোফার: এটি স্পষ্ট নয় (অন্তত আমার কাছে) যে আমার মডেল কোডিংয়ের জন্য অনুমতি দেয় অযৌক্তিক সম্ভাবনা, যদিও আমার মডেল অন্যথায় এটির সাথে সমান।

উত্তর:


6

দ্রষ্টব্য: আমার উদ্দিষ্ট অ্যালগরিদমটি ভুল ছিল; আমি এটি মুছে ফেলেছি।

pp

একটি জটিলতার উপর আবদ্ধ নিম্ন, একটি মান approximating প্রশ্নে সহজ সম্ভাব্যতার সূত্রাবলি খেলা হয় পি হতে জানা যায় না । আমি উপরে যে র্যান্ডমাইজেশন ট্রিকটি দিয়েছি তা ব্যবহার করে, একটি বহুগুণ-আকারের অনুসন্ধানের টেবিলের সাথে একটি রেফার্ড গেম হিসাবে একটি সহজ স্টোকাস্টিক গেমটি লেখা সহজ।


এই র্যান্ডমাইজেশন ধারণা (অন্তত, আপনি এটি বর্ণনা হিসাবে) শুধুমাত্র যুক্তিসঙ্গত সম্ভাবনা দিতে পারে। এছাড়াও, আপনি সংযুক্ত দুটি প্রথম কাগজে যে সংজ্ঞা ব্যবহার করেছেন সেগুলিও বোঝায় যে তাদের গেমগুলির একটি সীমাবদ্ধ গেম ট্রি আছে, যেখানে আমি কেবল একটি সীমাবদ্ধ রাষ্ট্রীয় স্থান প্রয়োজন (যেখানে "রাষ্ট্র" গেমের ইতিহাস অন্তর্ভুক্ত করে না)।

আপনি ঠিক বলেছেন ... আমার উত্তরের প্রথম অংশটি ভুল। আমাকে এটি মুছে ফেলুন। আমি মোটামুটি নিশ্চিত যে সরল স্টোকাস্টিক গেমগুলির মান প্রায় অনুমান করা পি-তে জানা যায় না এমনকি সমস্ত মুদ্রা ফ্লিপ হওয়ার সম্ভাবনা ১/২ থাকে।
পিটার শর

1


ϵ0<ϵ

ইনপুট: আমার প্রশ্নে বর্ণিত একটি গেমের
অবশ্যই আউটপুট হ্যাঁ যদি: প্লেয়ার 1 এর জন্য গেমটির মান 1- এর চেয়ে বেশি হয়ϵ
ϵ

তখনও আর- ই-র অবশিষ্ট থাকে

player_to_move সবসময় 1 (অর্থাত, মাত্র 1 খেলোয়াড় প্রয়োজন হয়) হল
এবং
গুলি 0 ≠ গুলি একটি এবং S একটি বিন্যাস (next_state_table) নয়
(অর্থাত, এটা আক্ষরিক অসম্ভব খেলোয়াড় হারান জন্য)
এবং
p1_info এবং p2_info এবং number_of_choices রাষ্ট্রের থেকে স্বাধীন
(যেমন, প্লেয়ারের একমাত্র প্রতিক্রিয়া হ'ল এটি কেবল জিতেছে বা না)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.