যখন কোনও সংকেতকারী গেমটিতে কোনও প্রেরককে ক্রিয়াটি এলোমেলো করা উচিত?


10

মনে করুন একটি সীমাবদ্ধ বার্তা স্পেস M , সসীম অ্যাকশন স্পেস A এবং সসীম টাইপ স্পেস সহ একটি সংকেত খেলা রয়েছে T। এমনকি সহজ, সমস্ত প্রেরকের প্রকারের অভিন্ন পছন্দ রয়েছে (প্রাপক কেবল বিভিন্ন ধরণের প্রতিক্রিয়াতে বিভিন্ন ক্রিয়া পছন্দ করেন)। গ্রাহক প্রতিক্রিয়াগুলি জুড়ে এলোমেলো করে কি কখনও কঠোরভাবে আরও ভাল করতে পারেন? যখন একটি ভারসাম্য উপস্থিত থাকে যেখানে গ্রহীতা কেবল খাঁটি পদক্ষেপ নেয়?

সর্বব্যাপী আমার প্রশ্নের সংক্ষিপ্ত বিবরণ দিয়ে বলেছেন, "সর্বাধিক রিসিভার পেওফের সাথে ভারসাম্য মিশ্রিত কৌশলগতভাবে জড়িত তা কি কখনও এমন হয়?"

চলুন অনুক্রমিক ভারসাম্য নিয়ে। আপনি যদি কিছু সূচনা দিয়ে শুরু করতে চান।

σt(m) সম্ভাব্যতা যেtT পাঠায়mM

σRm(a) সম্ভাব্যতা যে রিসিভার সাড়াm সঙ্গেaA. এমμmΔT পর্যবেক্ষণের পরে রিসিভারের বিশ্বাস দেয়।m

অনুক্রমিক সুস্থিতি প্রয়োজন σt দেওয়া দিতে অনুকূল প্রতিক্রিয়া σR , σR অনুকূল দেওয়া μ এবং μ Bayesian দেওয়া σ । এটি সত্যই দুর্বল অনুক্রমের সংজ্ঞা, তবে সংকেত খেলায় কোনও পার্থক্য নেই।

আমার স্বজ্ঞাততা বলতে পারে না যখন সেখানে কোনও ভারসাম্য থাকে যেখানে গ্রহীতা কেবল খাঁটি ক্রিয়াকলাপ খেলেন তবে আমি এই ধরণের স্টাফ দিয়ে সর্বদা ভয়াবহ হয়েছি। হতে পারে আমাদের এটিও নির্ধারণ করতে হবে যে এটি কোনও শূন্য-সমষ্টি খেলা নয়, তবে আমি কেবল তাই বলছি কারণ আমি মনে করি খেলাগুলি games গেমগুলিতে এলোমেলো করার ক্ষমতা নিয়ে আরও ভাল ছিল। সম্ভবত এটি কোনও কাগজে পাদটীকা?

নীচের খেলাটি বিবেচনা করুন যেখানে প্রেরকের পছন্দগুলি অভিন্ন নয়। আমি নিম্ন মানের জন্য ক্ষমা চাই। তিনটি প্রেরকের প্রকার রয়েছে, প্রতিটির সমান সম্ভাবনা রয়েছে। আমি বিশ্বাস করি যা আমি গ্রহণ করি তা তৈরি করতে পারি (প্লেয়ার 2) অনুকূল ভারসাম্য কেবল তখনই যদি তারা বার্তা 1 পেয়ে র্যান্ডমাইজ করে তবে তারপরে 1 এবং 3 টি খেলবে , একটি পৃথক ভারসাম্য তৈরি করবে । যদি রিসিভার মি 1 এর প্রতিক্রিয়াতে একটি খাঁটি কৌশল ব্যবহার করে , তবে 1 বা 2 টাইপটি বিচ্যুত হয়ে রিসিভারটিকে আরও খারাপ করে দেবে।m2m1

σRm1(a)=.5=σRm1(r)=.5

এখানে চিত্র বর্ণনা লিখুন


এই ধরণের কোনও ফাংশন হিসাবে গ্রহণকারী কর্তৃক গৃহীত পদক্ষেপগুলি কি প্রেরকের প্রেরিত বার্তায় প্রভাব ফেলে বা এগুলি স্বতন্ত্র?
মার্টিন ভ্যান ডের লিন্ডেন

আপনার অর্থ কী তা আমি নিশ্চিত নই। এক রিসিভার টাইপ আছে। তাদের কৌশল কর্মের উপর একটি বিতরণ বার্তাগুলি মানচিত্র। প্রেরকরা সর্বোত্তম প্রতিক্রিয়া খেলছেন বলে তাদের কেবল ইনসোফারটিতেই প্রভাব পড়ে।
পিবার্গ

2
ধরুন একটি সুস্থিতি বিদ্যমান যা রিসিভার randomises কর্মের উপরে নিযুক্ত । এর মানে হল, সংজ্ঞা দ্বারা, তিনি এর বেশী কোনো দুই সম্ভাব্যতা ডিস্ট্রিবিউশন মধ্যে উদাসীন হওয়া আবশ্যক α যারা যা সমস্ত ওজন একটি একক কর্ম (খাঁটি কৌশল) উপর করা হয় --including। সুতরাং না, একটি মিশ্র কৌশল সর্বোত্তম বিশুদ্ধ কৌশলের চেয়ে কঠোরতর কখনও হতে পারে না। নাকি আমি প্রশ্নটি ভুল বুঝেছি? αα
সর্বব্যাপী

@ সর্বব্যাপী এটি আমার কাছে বোধগম্য হয় তবে আমি ভাবছিলাম যে এখানে কিছু অদ্ভুত রোগ সংক্রান্ত ঘটনা ঘটতে পারে কিনা। উদাহরণস্বরূপ, আমি কেবলমাত্র একটি উপপাদ্যটি খুঁজে পেতে পারি, "নিখুঁত স্মৃতিচারণের সাথে একটি সীমাবদ্ধ বিস্তৃত গেমের পেওফগুলির সাধারণ পছন্দগুলির জন্য, পিক অফগুলি অনুক্রমিক ভারসাম্যের প্রতিটি সংযুক্ত উপাদানগুলিতে স্থির থাকে" " জেনেরিক ক্যাভ্যাট আমাকে অবাক করে দিয়েছিল।
পিবার্গ

1
@ পিবার্গ হ্যাঁ, আমি দেখছি। দেখে মনে হচ্ছে আমাদের মনে বিভিন্ন প্রশ্ন ছিল। আমি ভাবছিলাম "এটি কি এমন ক্ষেত্রে হয় যে প্রদত্ত প্রেরকের কৌশলটির বিষয়ে প্রাপকের অনন্য সর্বোত্তম প্রতিক্রিয়া একটি মিশ্র কৌশল?", যেখানে মনে হয় আপনার প্রশ্নটি আসলে "এটিই কি এমন ক্ষেত্রে হয় যে সর্বাধিক রিসিভার পেমেন্টের সাথে সামঞ্জস্যতা জড়িত থাকে? মিশ্র কৌশল? "
সর্বব্যাপী

উত্তর:


3

সম্ভবত আমার একটি পাল্টা নমুনা আছে!

তিন বার্তা, সেখানে হতে দিন এবং মি 3 , এবং তিন প্রেরক ধরনের টন 1 , T 2 , টি 3 যেখানে Pr ( T = T 3 ) = 1m1,m2,m3t1,t2,t3,জনসংযোগ(টি=টি2)=1Pr(t=t3)=12ϵ এবংজনসাধারণ(টি=টি1)=1Pr(t=t2)=14। প্রেরকদের জন্যএকটিমিটার0 তেমি3ফলাফলপাঠানো, আমরা এটিকে গেমের প্রস্থান হিসাবে ভাবতে পারি।Pr(t=t1)=14+ϵm30

একটি বার্তায় রিসিভার প্রতিক্রিয়াগুলির সেটটি হ'ল { a , r }m=m1,m2{a,r}

ut(a,m1)=1>ut(a,m2)=β>ut(r,)=0

, ইউ আর ( টি 3 , মি i , ) = 1 ,uR(t1,m1,a)=uR(t2,m2,a)=2uR(t3,mi,a)=1

, ইউ আর ( টি 3 , এম আমি , আর ) = 2 ,uR(t2,m1,a)=uR(t2,m1,a)=0uR(t3,mi,r)=2

uR(t1,mi,r)=uR(t2,mi,r)=1

তারপরে ভারসাম্যপূর্ণভাবে, সমস্ত প্রেরকের অবশ্যই একই উপযোগিতা গ্রহণ করতে হবে, সঠিক ?. অন্যথায়, একজন অন্যের কৌশল অনুকরণ করবে।

সুতরাং, একমাত্র বিশুদ্ধ কৌশল ভারসাম্য হল সমস্ত প্রেরকের মি 1 বা মি 2 তে একটি পুলিং ভারসাম্যের মধ্যে , r নির্বাচন করা সবচেয়ে ভাল প্রতিক্রিয়া । টি 1 এবং টি 2 এম 2 প্রেরণ করা ব্যতীত ভারসাম্যকে আলাদা করার কোনও খাঁটি কৌশল নেই এবং প্রাপক আর দিয়ে সাড়া দেয় । তারপরে t 3 সমস্ত বার্তাগুলির মধ্যে উদাসীন, কারণ তিনি অবশ্যই payoff 0 এর সাথে দেখা করবেন । এই সব রিসিভার পেওফ দেয় 3m3m1m2rt1t2m2rt3032ϵ

তারপরে বিবেচনা করুন যেখানে σ m 1 R ( a ) = β এবং σ m 2 R ( a ) = 1. এখন প্রেরকরা এই দুটি বার্তা প্রেরণের মধ্যে উদাসীন। তারপর, দিন σ টি 3 ( মি 1 ) = ε + + 1 / 4σRm1(a)=βσRm2(a)=1.এবংσটিআমি(মিআমি)=1জন্যআমি=1,2। তারপরে রিসিভার কৌশলটি যৌক্তিক।σt3(m1)=ϵ+1/4ϵ+1/2=1σt3(m1)σti(mi)=1i=1,2

এক বা আর প্রদত্ত থেকে প্রাপ্তির প্রত্যাশিত ইউটিলিটি 1.5 is আশা ইউটিলিটি মি 2 দেওয়া সামান্য 1.5 উপরে, একটি । সুতরাং প্রাক্তন পূর্ব প্রত্যাশিত বেতনটি 3 এর উপরেm1arm2a, উপরে বর্ণিত খাঁটি ভারসাম্যের চেয়ে ভাল। তদ্ব্যতীত, এই বিচ্ছেদটি শুধুমাত্র মিশ্রণের দ্বারা বজায় থাকে। অন্য যে কোন বিশুদ্ধ, রিসিভার কর্তৃক গৃহীত প্রেরক পুলিং রাজি করানো কেবল একটি বিশুদ্ধ কৌশল সুস্থিতি অর্থ কৌশল যখন রিসিভার তা চয়নr32ϵr

আমি থাকা উচিত থেকে lefthand পাশ প্রেরক ভাতা জন্য নিচের ছবিতে গুলি একটি । আমি মনে করি β < 1 হল মূল উপাদান।βaβ<1

এখানে চিত্র বর্ণনা লিখুন


3

আমি মনে করি এটা ঝুঁকি বিমুখ প্রেরকদের ঝুঁকি নিরপেক্ষ রিসিভার, এবং ঘটতে পারে না ধনী যথেষ্ট।A

উদাহরণস্বরূপ, ক্যানোনিকাল সংকেত মডেল বিদ্ধ করা, অনুমান যে ইতিবাচক বাস্তব লাইন এবং প্রেরকদের 'ইউটিলিটি তোমার দর্শন লগ করা বাড়ছে একটি সময় রিসিভারের রৈখিক ইউটিলিটি মধ্যে কমে যায় একটিAuaa

(স্বীকারোক্তি হিসাবে, এটি কেবলমাত্র একটি আংশিক উত্তর হিসাবে আপনার কাঠামোর কাঠামোটি খুব কম সাধারণ যেটি আপনার প্রশ্নে রয়েছে তাই এটি আপনার কাছে সন্তোষজনক নাও হতে পারে these আপনি যদি এই অনুমানগুলি নিয়ে ঠিক থাকেন তবে আমি এখনও একটি যুক্তি সরবরাহ করি)

একটি বৈপরীত্য পেতে, ধরুন যে সাম্যাবস্থায় এবং σ m আর ( a ) > 0 এর জন্য কিছু । দিনσRm(a)>0σRm(a)>0aaA

aσRm(a)σRm(a)+σRm(a)a+σRm(a)σRm(a)+σRm(a)a.

ঝুঁকি এড়ানোর মাধ্যমে

[ σ এম আর ( ) + σ এম আর ( ) ] ইউ ( ) > σ এম আর ( ) ইউ ( ) + σ এম আর (

u[a]>σRm(a)σRm(a)+σRm(a)u(a)+σRm(a)σRm(a)+σRm(a)u(a).
[σRm(a)+σRm(a)]u(a)>σRm(a)u(a)+σRm(a)u(a).

কিছু ধারাবাহিকতা অনুমানের অধীনে, অবশ্যই উপস্থিত থাকতে হবে

a<a

যেমন যে

[σRm(a)+σRm(a)]u(a)=σRm(a)u(a)+σRm(a)u(a).

সুতরাং নিম্নলিখিত উপায়ে নির্মিত বিবেচনা করুনσRm

  • σRm(a)=σRm(a)=0 ,
  • σRm(a)=σRm(a)+[σRm(a)+σRm(a)]
  • অন্য সমস্ত ,a~σRm(a~)=σRm(a~)

রিসিভার পছন্দ করেন উপর যদি , এটা প্রেরকদের পাঠানো সংকেত পরিবর্তন করা হয়নি, কারণ এটি কম প্রত্যাশিত ক্ষতিপূরণ জড়িত। কিন্তু নির্মাণ দ্বারা, প্রেরকদের মধ্যে উদাসীন এবং , তাই তারা একই সংকেত পাঠান উচিত । সুতরাং একটি ভারসাম্য হতে পারে না যা দেখায় যে আমরা ভারসাম্যপূর্ণ সম্ভাবনার সাথে দুটি ভারসাম্যকে ভারসাম্যহীনভাবে খেলতে পারি না। Σ এম আর σ এম আরσRmσRm Σ এম আর σ এম আর σ এম আরσRmσRmσRmσRm


এই মডেলটিতে, গ্রহীতা কি সর্বদা কেবল পছন্দ করে না ? a=0
পিবার্গ

আমি অবশ্যই এটি করি না। রিসিভার সবসময় choses যদি কোন সংকেত ব্যাপার, সে incentivize "উচ্চ" ধরনের একটি "উচ্চ" সংকেত নালা তাদের টাইপ প্রকাশ করতে নেই। এটি একটি পুলিং ভারসাম্যের ক্ষেত্রে সর্বোত্তম হতে পারে, তবে পৃথকীকরণের ভারসাম্যের ক্ষেত্রে নয় not উদাহরণস্বরূপ দেখুন মাস-কোলেল, হুইনস্টন এবং গ্রিনের ১৩. সি বিভাগ, যদিও সেটআপটি আবার আপনার থেকে কিছুটা আলাদা (উদাহরণস্বরূপ বিভিন্ন ধরণের শ্রমিকদের জন্য দু'টি সংস্থা প্রতিযোগিতা করছে)a
মার্টিন ভ্যান ডের লিন্ডেন

তারপরে "রিসিভারের লিনিয়ার ইউটিলিটি হ্রাস পায়" এর অর্থ কী?
পিবার্গ

দুঃখিত যে খুব পরিষ্কার ছিল না। আমার মনে থাকা স্পেন্স সিগন্যালিং মডেলটিতে, প্রাপক গ্রহণের ক্রিয়াটি প্রেরকের কাছে মজুরি প্রদানের অন্তর্ভুক্ত। রিসিভারের ইউটিলিটি প্রেরকের টি, মাইনাস মজুরি প্রদেয় t − w এর ধরণের উপর নির্ভর করে। মূলত, গ্রহীতা ঝুঁকি নিরপেক্ষ: তিনি কেবল তার প্রত্যাশিত মজুরি প্রদান করতে হবে এবং প্রত্যাশিত প্রকারটি সে নিয়োগ করবে will
মার্টিন ভ্যান ডের লিন্ডেন

ঠিক আছে, আমি মনে করি আমি এটি চতুর্ভুজ ক্ষতি হিসাবে দেখেছি, দ্বিগুণএই পরামর্শের জন্য ধন্যবাদ, যদিও আমি কিছুটা আরও সাধারণ খুঁজছি তবে ভিন্ন পদক্ষেপ নিয়ে। (tw)2.
পিবার্গ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.