দুটি খামে পুনর্বিবেচনা করা হয়েছে


16

আমি এই সমস্যাটি ভাবছিলাম।

http://en.wikipedia.org/wiki/Two_envelopes_problem

আমি সমাধানটিকে বিশ্বাস করি এবং আমি মনে করি আমি এটি বুঝতে পেরেছি, তবে আমি যদি নিম্নলিখিত পদ্ধতি গ্রহণ করি তবে আমি সম্পূর্ণ বিভ্রান্ত।

সমস্যা 1:

আমি আপনাকে নীচের খেলাটি অফার করব। আপনি আমাকে 10 ডলার দিবেন এবং আমি একটি ভাল মুদ্রা ফ্লিপ করব। শিরোনাম আমি আপনাকে $ 5 এবং লেজগুলি আপনাকে 20 ডলার দেব ।

প্রত্যাশাটি 12.5 ডলার তাই আপনি সর্বদা গেমটি খেলবেন।

সমস্যা 2:

আমি আপনাকে 10 ডলার দিয়ে একটি খাম দেব , খামটি খোলা আছে এবং আপনি পরীক্ষা করতে পারেন। আমি তারপর আপনি অন্য একটি খাম দেন এই সময় বন্ধ করে আপনাকে বলতে এই খাম পারেন হয়েছে $ 5 বা সমান সম্ভাবনা সঙ্গে এটি 20 $। আপনি কি অদলবদল করতে চান?

আমি মনে করি এই ঠিক সমস্যা 1 হিসাবে একই, আপনি ত্যাগ $ একটি 10 $ 5 বা একটি $ 20, তাই আবার আপনি সবসময় পাল্টাবে।

সমস্যা 3:

আমি উপরের মত একই করি তবে খামগুলি বন্ধ করে দিই। সুতরাং আপনি জানেন না যে এখানে $ 10 রয়েছে তবে কিছু পরিমাণ এক্স I আমি আপনাকে বলি অন্য খামে দ্বিগুণ বা অর্ধেক রয়েছে। এখন আপনি যদি একই যুক্তি অনুসরণ করেন তবে আপনি স্যুইচ করতে চান। এটি খাম প্যারাডক্স।

আমি খামটি বন্ধ করে দিলে কি পরিবর্তন হয়েছে ??

সম্পাদনা করুন:

কেউ কেউ যুক্তি দেখিয়েছেন যে 3 সমস্যাটি খামের সমস্যা নয় এবং আমি নীচে চেষ্টা করে যাচ্ছি কেন আমি মনে করি কেন এটি প্রতিটি গেমটি কীভাবে দেখছে তা বিশ্লেষণ করেই এটি মনে হচ্ছে। এছাড়াও, এটি গেমটির জন্য আরও ভাল সেট আপ করে।

সমস্যা 3 এর জন্য কিছু স্পষ্টতা প্রদান:

গেমটি সংগঠিত করা ব্যক্তির দৃষ্টিকোণ থেকে:

আমি 2 খাম রাখা। একটিতে আমি 10 ডলার এটিকে বন্ধ করে প্লেয়ারকে দিয়েছি । আমি তখন তাকে বলি, আমার আরও একটি খাম রয়েছে যা আমি আপনাকে যে খাম দিয়েছি তা দ্বিগুণ বা অর্ধেক পরিমাণ। আপনি কি স্যুইচ করতে চান? আমি তারপরে একটি ন্যায্য মুদ্রা ও মাথাটি ফ্লিপ করতে এগিয়ে যাই I আমি 5 ডলার এবং লেজগুলিতে আমি 20 ডলার রাখি And এবং তাকে খামটি হস্তান্তর করি। আমি তখন তাকে জিজ্ঞাসা। আপনি যে খামটি আমাকে সবেমাত্র দিয়েছিলেন সেটিতে আপনি যে খামটি রাখছেন তার দ্বিগুণ বা অর্ধেক পরিমাণ রয়েছে। আপনি কি স্যুইচ করতে চান?

প্লেয়ারের দৃষ্টিকোণ থেকে:

আমাকে একটি খাম দেওয়া হয়েছে এবং জানানো হয়েছে যে আরও একটি খাম রয়েছে যার সমান সম্ভাবনা সহ দ্বিগুণ বা অর্ধেক পরিমাণ রয়েছে। আমি কি পরিবর্তন করতে চাই? আমি নিশ্চিত মনে করি আমার এক্স আছেX , সুতরাং 12 (1)2 এক্স+2এক্স)>এক্স12(12X+2X)>Xতাই আমি স্যুইচ করতে চাই। আমি খামটি পেয়েছি এবং হঠাৎ করে আমি ঠিক একই পরিস্থিতির মুখোমুখি হয়েছি। অন্যান্য খামে দ্বিগুণ বা অর্ধেক পরিমাণ থাকায় আমি আবার পরিবর্তন করতে চাই।


2
কমপক্ষে আমার কাছে মূল বোঝাপড়াটি হ'ল আমি কেবল "আমার কাছে এক্স আছে, তাই (1/2 * এক্স + 2 এক্স) / 2> এক্স" বলতে পারি না - মোট গড় সম্ভাবনা 50/50 তবে কোনও নির্দিষ্ট এক্সের জন্য , প্রত্যাশিত সম্ভাবনা আর 50/50 নয়; এবং বৃহত্তর এক্স, অন্যান্য খামে 2 * এক্স থাকার কম সুযোগ (ইতিবাচক সসীম বিতরণের জন্য); সম্ভাব্য X'es এর সাথে সংহত করা sum(p(X) * (1/2X*f(X) + 2X(1-f(X)) ) = X, যেখানে f (এক্স) কোনও নির্দিষ্ট এক্স দেওয়া হলে প্রথম খামটি বড় হওয়ার সম্ভাবনা রয়েছে
পিটারিস

1
প্যারাডক্সের বিবৃতিতে, এমন কিছু নেই যা বলে যে এক্স এক্স পরীক্ষক দ্বারা নির্বাচিত হয় এবং তারপরে পরীক্ষকটি এলোমেলোভাবে অন্য খামে এক্সX বা এক্স / 2 রাখার সিদ্ধান্ত নেয় X/2। আপনি দুটি খাম প্যারাডক্সের সাথে আপনি যে পরিস্থিতি তৈরি করেছেন তা বিবাদ করে চলেছেন এর অর্থ, অন্য খামটি X / 2X/2 বা 2 এক্স এর 50/50 সম্ভাবনা রয়েছে বলে প্লেয়ারের পক্ষে বিশ্বাস করা কেন এটি ভুল তা আপনি বুঝতে পারছেন না 2X। প্রকৃত দুটি খাম সমস্যার মধ্যে, 2 এক্সটি2X অন্য খামে রয়েছে এমন সম্ভাবনা 0 বা 1 হয়
জেস্ক

তুমি ঠিক. আমি আনস্ট্যান্ড্যান্ড করি না :( সুতরাং প্রশ্নটি। আমি যে সমস্যাটি বলেছি তা এবং খামের প্যারাডক্সের মধ্যে পার্থক্যটি বোঝার চেষ্টা করছি I আমি বুঝতে পেরেছি যে প্যারাডক্সে এক্স এবং 2 এক্স দুটি সম্পন্ন আছে এবং সম্পন্ন হয়েছে, তবে আমি করি না ' টি দেখতে যে কিভাবে কেউ একটা খাম দান এবং তারপর একটি মুদ্রা আলোকসম্পাতের অন্যান্য পরিমাণ করা সিদ্ধান্ত নিতে থেকে আলাদা।
evan54

1
এর কৌশলটি ত্রুটিযুক্ত ধারণা যে এক্স / 2X/2 বা 2 এক্স2X ফলাফলগুলির সমান সম্ভাবনা রয়েছে। যদি 2 এক্স2X অন্য খামে থাকে তবে স্যুইচিং থেকে প্রত্যাশিত লাভ 2 এক্স - এক্স = এক্স2XX=X । যদি এক্স / 2X/2 অন্য খামে থাকে তবে স্যুইচিং থেকে প্রত্যাশিত লাভটি এক্স / 2 - এক্স = - এক্স / 2 হবেX/2X=X/2 । খেলোয়াড় জানেন না যে তিনি এর মধ্যে কোন পরিস্থিতিতে আছেন তবে এর অর্থ এই নয় যে তার বিশ্বাস করা উচিত যে সেখানে একটি 50/50 সুযোগ রয়েছে।
jsk

1
ধরা যাক খামগুলিতে এক্সX এবং 2 এক্স রয়েছে2X । যদি আপনি এক্স দিয়ে শেষ করেন X, তবে অন্যান্য খামে 2 এক্স2X থাকার সম্ভাবনাটি 1 এবং অন্য খামে X / 2 থাকার সম্ভাবনা X/20 হয় you আপনি যদি 2 এক্স দিয়ে শেষ করেন 2Xতবে সম্ভাবনা 2 ( 2 এক্স ) = 4 এক্স2(2X)=4X অন্যান্য খামে 0 এবং অন্য খামে 2 এক্স / 2 = এক্স হওয়ার সম্ভাবনাটি 2X/2=X1
জেস্ক

উত্তর:


23

১. অসাধারণ সম্ভাব্যতা।

এই নোটের পরবর্তী দুটি বিভাগ সিদ্ধান্ত তত্ত্বের মানক সরঞ্জামগুলি (2) ব্যবহার করে "অনুমানটি আরও বড়" এবং "দুটি খাম" সমস্যার বিশ্লেষণ করে। এই পদ্ধতির, যদিও সোজা, নতুন বলে মনে হচ্ছে। বিশেষত, এটি দুটি খামের সমস্যার জন্য সিদ্ধান্ত পদ্ধতির একটি সেট সনাক্ত করে যা "সর্বদা স্যুইচ" বা "কখনই স্যুইচ না" পদ্ধতিগুলির তুলনায় সুস্পষ্ট superiorর্ধ্বতন।

বিভাগ 2 (মানক) পরিভাষা, ধারণা এবং স্বরলিপি প্রবর্তন করে। এটি "অনুমান যা আরও বড় সমস্যা" "এর জন্য সম্ভাব্য সমস্ত সিদ্ধান্ত পদ্ধতি বিশ্লেষণ করে। এই উপাদানগুলির সাথে পরিচিত পাঠকরা এই বিভাগটি এড়িয়ে যেতে পছন্দ করতে পারেন। বিভাগ 3 দুটি খামের সমস্যাটির জন্য একই রকম বিশ্লেষণ প্রয়োগ করে। বিভাগ 4, উপসংহারগুলি, মূল পয়েন্টগুলির সংক্ষিপ্তসার করে।

এই ধাঁধাগুলির সমস্ত প্রকাশিত বিশ্লেষণ ধরে নিয়েছে যে প্রকৃতির সম্ভাব্য রাজ্যগুলি পরিচালনা করে এমন সম্ভাবনা বন্টন রয়েছে। এই ধারণাটি ধাঁধা বিবৃতি অংশ নয়। এই বিশ্লেষণগুলির মূল ধারণাটি হ'ল এই (অযাচিত) অনুমানকে বাদ দেওয়া এই ধাঁধাগুলিতে আপাত বিপরীতে একটি সহজ সমাধানের দিকে নিয়ে যায়।

"সমস্যাটি যা সবচেয়ে বড়" সমস্যা।

একটি পরীক্ষককে বলা হয় যে বিভিন্ন বাস্তব সংখ্যা x 1x1 এবং x 2x2 কাগজের দুটি স্লিপে লেখা থাকে। তিনি এলোমেলোভাবে বেছে নেওয়া স্লিপে নম্বরটি দেখেন। কেবলমাত্র এই একটি পর্যবেক্ষণের ভিত্তিতে, তাকে অবশ্যই সিদ্ধান্ত নিতে হবে যে এটি দুটি সংখ্যার চেয়ে ছোট বা বড়।

সম্ভাব্যতা সম্পর্কে এই জাতীয় সহজ তবে উন্মুক্ত সমস্যাগুলি বিভ্রান্তিকর এবং পাল্টা স্বজ্ঞাত হওয়ার জন্য কুখ্যাত। বিশেষত, কমপক্ষে তিনটি স্বতন্ত্র উপায় রয়েছে যেখানে সম্ভাব্যতা ছবিটিতে প্রবেশ করে। এটি স্পষ্ট করতে, আসুন একটি আনুষ্ঠানিক পরীক্ষামূলক দৃষ্টিভঙ্গি গ্রহণ করুন (2)।

ক্ষতির ফাংশন নির্দিষ্ট করে শুরু করুন । আমাদের লক্ষ্যটি তার প্রত্যাশাটি হ্রাস করা হবে, এক অর্থে নীচে সংজ্ঞায়িত করা হবে। একটি ভাল পছন্দ করতে ক্ষতি সমান 11 যখন পরীক্ষায় সঠিকভাবে এবং অনুমান 00 অন্যথায়। এই ক্ষতির কার্যকারিতাটির প্রত্যাশা হ'ল ভুল অনুমানের সম্ভাবনা। সাধারণভাবে, ভুল অনুমানের জন্য বিভিন্ন জরিমানা বরাদ্দের মাধ্যমে, একটি ক্ষতির ফাংশন সঠিকভাবে অনুমানের উদ্দেশ্যটি ধারণ করে। নিশ্চিত হওয়া উচিত যে ক্ষতির ফাংশন গ্রহণ করা x 1x1 এবং এর পূর্বের সম্ভাবনা বন্টনকে ধরে নেওয়ার মতো স্বেচ্ছাচারী এক্স 2x2, তবে এটি আরও প্রাকৃতিক এবং মৌলিক। যখন আমরা কোনও সিদ্ধান্ত নেওয়ার মুখোমুখি হই তখন আমরা স্বাভাবিকভাবেই সঠিক বা ভুল হওয়ার পরিণতি বিবেচনা করি। যদি কোনওভাবেই কোনও পরিণতি না হয় তবে কেন যত্ন করবেন? আমরা যখনই কোনও যুক্তিযুক্ত সিদ্ধান্ত গ্রহণ করি তখনই আমরা স্পষ্টভাবে সম্ভাব্য ক্ষতির বিষয়টি বিবেচনা করি এবং সুতরাং ক্ষতির একটি সুস্পষ্ট বিবেচনা থেকে আমরা উপকৃত হই, অন্যদিকে কাগজের স্লিপগুলিতে সম্ভাব্য মানগুলি বর্ণনা করার সম্ভাবনার ব্যবহার অপ্রয়োজনীয়, কৃত্রিম এবং যেমন -— আমরা দেখতে পাব useful- দরকারী সমাধানগুলি পেতে আমাদের বাধা দিতে পারে।

সিদ্ধান্ত তত্ত্বের মডেলগুলি পর্যবেক্ষণমূলক ফলাফল এবং সেগুলি সম্পর্কে আমাদের বিশ্লেষণ। এটি তিনটি অতিরিক্ত গাণিতিক অবজেক্ট ব্যবহার করে: একটি নমুনা স্থান, "প্রকৃতির রাজ্যগুলির একটি সেট" এবং সিদ্ধান্ত পদ্ধতি procedure

  • নমুনা স্পেস এসS সমস্ত সম্ভাব্য পর্যবেক্ষণ নিয়ে গঠিত; এখানে এটি আর এর সাথে চিহ্নিত করা যেতে পারে R (প্রকৃত সংখ্যাগুলির সেট) ।

  • প্রকৃতির রাজ্যগুলি হ'লΩ পরীক্ষামূলক ফলাফলকে পরিচালনা করে এমন সম্ভাব্য বন্টন। (এটিই প্রথম অনুভূতি যেখানে আমরা কোনও ঘটনার "সম্ভাবনা" সম্পর্কে কথা বলতে পারি।) "অনুমান যা আরও বড়" সমস্যাটিতে, এগুলি হ'ল বিযুক্ত ডিস্ট্রিবিউশনগুলি সমান সম্ভাবনার সাথে পৃথক বাস্তব সংখ্যা x 1x1 এবং x 2 এ মান গ্রহণ করছে taking x2এর 112প্রতিটি মান 2ΩΩ দ্বারা স্থিতিমাপ করা যেতে পারে{ω=(x এর1,x এর2)আর×আর| x1>x2}  {ω=(x1,x2)R×R | x1>x2}.

  • সিদ্ধান্ত স্থান বাইনারি সেট Δ = { ছোট , বড় }Δ={smaller,larger} সম্ভব সিদ্ধান্ত।

এই শর্তাবলীতে, লোকসান ফাংশন একটি বাস্তব-মান ফাংশন উপর সংজ্ঞায়িত Ω × ΔΩ×Δ । এটি আমাদের জানায় যে বাস্তবতা (প্রথম যুক্তি) এর তুলনায় সিদ্ধান্তটি "খারাপ" কী (দ্বিতীয় যুক্তি)।

সবচেয়ে সাধারণ সিদ্ধান্ত পদ্ধতি δδ পরীক্ষায় উপলব্ধ একটি হল এলোমেলোভাবে এক: কোন পরীক্ষামূলক ফলাফল তার মূল্যের ওপর সম্ভাব্যতা বিতরণের হয় ΔΔ । অর্থাৎ সিদ্ধান্ত দেখে ফলাফল উপর করতে এক্সx অগত্যা নির্দিষ্ট নয়, বরং এলোমেলোভাবে একটি বিতরণ অনুযায়ী মনোনীত করা হয় δ ( এক্স )δ( এক্স ) । (এটি দ্বিতীয় উপায় যাতে সম্ভাবনা জড়িত হতে পারে))

যখন ΔΔ মাত্র দুটি উপাদান আছে, কোন এলোমেলোভাবে পদ্ধতি সম্ভাব্যতা এটি একটি prespecified সিদ্ধান্ত নির্ধারণ, যা কংক্রিট আমরা নিতে হতে হতে দ্বারা চিহ্নিত করা যেতে পারে "বড় করা হয়েছে।"

স্পিনার

একটি শারীরিক স্পিনার কার্যকরী যেমন একটি বাইনারি এলোমেলোভাবে পদ্ধতি: অবাধে-কাটনা পয়েন্টার উপরের এলাকায় বন্ধ করার এক সিদ্ধান্ত সংশ্লিষ্ট আসবে ΔΔ সম্ভাব্যতা সঙ্গে, δδ সম্ভাব্যতা সঙ্গে নিচের বাম এলাকায় বন্ধ করে দেবে, এবং অন্যথায় 1 - δ ( x )1 - δ( এক্স ) । স্পিনার সম্পূর্ণরূপে মান নির্দিষ্ট করে নির্ধারণ করা হয় δ ( এক্স ) [ 0 , 1 ]δ( x ) [ 0 , 1 ]

সুতরাং একটি সিদ্ধান্ত পদ্ধতি একটি ফাংশন হিসাবে চিন্তা করা যেতে পারে

δ : এস [ 0 , 1 ] ,

δ': এস[ 0 , 1 ] ,

কোথায়

প্র δ ( এক্স ) (বৃহত্তর)= δ (এক্স) এবং  প্র δ ( এক্স ) (ছোট)=1- δ (এক্স)  

prδ( এক্স )(larger)=δ(x)  and  Prδ(x)(smaller)=1δ(x).

বিপরীতভাবে, কোন ফাংশন δ ' একটি এলোমেলোভাবে সিদ্ধান্ত পদ্ধতি নির্ধারণ করে। এলোমেলোভাবে সিদ্ধান্ত বিশেষ ক্ষেত্রে নির্ণায়ক সিদ্ধান্ত অন্তর্ভুক্ত যেখানে পরিসীমা δ ' মিথ্যা { 0 , 1 }δδ{0,1}

আমাদের বলে যে যাক খরচ একটি সিদ্ধান্ত কার্যপ্রণালী δ জন্য একটি ফলাফল এক্স প্রত্যাশিত ক্ষতি δ ( এক্স ) । প্রত্যাশা সম্ভাব্যতা বিতরণের সম্মান সঙ্গে হয় δ ( এক্স ) সিদ্ধান্ত স্থান Δ । প্রকৃতির প্রতিটি রাজ্য ω (যা, প্রত্যাহার, নমুনা স্থান একটি বাইনমিয়াল সম্ভাব্যতা বিতরণের হয় এস ) কোন পদ্ধতি প্রত্যাশিত খরচ নির্ণয় δ ; এই হল ঝুঁকি এর δ জন্য ω , ঝুঁকি δ ( ω )δxδ(x)δ(x)ΔωSδδωRiskδ(ω)। এখানে, প্রত্যাশা প্রকৃতির রাষ্ট্র থেকে সম্মান সঙ্গে নেওয়া হয় ωω

সিদ্ধান্তের পদ্ধতিগুলি তাদের ঝুঁকিপূর্ণ কার্যগুলির সাথে তুলনা করা হয়। যখন প্রকৃতির রাষ্ট্র সত্যিই অজানা, ε এবং δ দুই পদ্ধতি আছে, এবং ঝুঁকি ε ( ω ) ঝুঁকি δ ( ω ) সবার জন্য ω , তারপর পদ্ধতি ব্যবহার করে কোন মানে হয়না ε , কারণ পদ্ধতি δ কোন খারাপ না হয় ( এবং কিছু ক্ষেত্রে ভাল হতে পারে)। এই ধরনের একটি পদ্ধতি ε হয় অগ্রহণীয়εδRiskε(ω)Riskδ(ω)ωεδε; otherwise, it is admissible. Often many admissible procedures exist. We shall consider any of them “good” because none of them can be consistently out-performed by some other procedure.

নোট করুন যে পূর্বের কোনও বিতরণ ( Ω (" সি এর জন্য একটি মিশ্র কৌশল ") এর পরিভাষায় (1) এর প্রবর্তন করা হয়নি । এটি তৃতীয় উপায় যাতে সম্ভাবনা সমস্যা সেটিংয়ের অংশ হতে পারে। এটি ব্যবহার করা বর্তমান বিশ্লেষণকে (1) এবং এর রেফারেন্সগুলির তুলনায় আরও সাধারণ করে তোলে, যদিও এখনও সহজ হওয়া যায়।ΩC

প্রকৃতির সত্যিকারের অবস্থা ω = ( x 1 , x 2 ) দ্বারা দেওয়া হলে সারণী 1 ঝুঁকিটি মূল্যায়ন করে X 1 > x 2 স্মরণ করুন ω=(x1,x2).x1>x2.

1 নং টেবিল.

ডিসিশন:LargerLargerSmallerSmallerOutcomeProbabilityProbabilityLossProbabilityLossCostx11/2δ(x1)01δ(x1)11δ(x1)x21/2δ(x2)11δ(x2)01δ(x2)

Decision:Outcomex1x2Probability1/21/2LargerProbabilityδ(x1)δ(x2)LargerLoss01SmallerProbability1δ(x1)1δ(x2)SmallerLoss10Cost1δ(x1)1δ(x2)

Risk(x1,x2): (1δ(x1)+δ(x2))/2.

Risk(x1,x2): (1δ(x1)+δ(x2))/2.

In these terms the “guess which is larger” problem becomes

Given you know nothing about x1x1 and x2x2, except that they are distinct, can you find a decision procedure δδ for which the risk [1δ(max(x1,x2))+δ(min(x1,x2))]/2[1δ(max(x1,x2))+δ(min(x1,x2))]/2 is surely less than 1212?

This statement is equivalent to requiring δ(x)>δ(y)δ(x)>δ(y) whenever x>y.x>y. Whence, it is necessary and sufficient for the experimenter's decision procedure to be specified by some strictly increasing function δ:S[0,1].δ:S[0,1]. This set of procedures includes, but is larger than, all the “mixed strategies QQ” of 1. There are lots of randomized decision procedures that are better than any unrandomized procedure!

3. THE “TWO ENVELOPE” PROBLEM.

It is encouraging that this straightforward analysis disclosed a large set of solutions to the “guess which is larger” problem, including good ones that have not been identified before. Let us see what the same approach can reveal about the other problem before us, the “two envelope” problem (or “box problem,” as it is sometimes called). This concerns a game played by randomly selecting one of two envelopes, one of which is known to have twice as much money in it as the other. After opening the envelope and observing the amount xx of money in it, the player decides whether to keep the money in the unopened envelope (to “switch”) or to keep the money in the opened envelope. One would think that switching and not switching would be equally acceptable strategies, because the player is equally uncertain as to which envelope contains the larger amount. The paradox is that switching seems to be the superior option, because it offers “equally probable” alternatives between payoffs of 2x2x and x/2,x/2, whose expected value of 5x/45x/4 exceeds the value in the opened envelope. Note that both these strategies are deterministic and constant.

In this situation, we may formally write

S={xR | x>0},Ω={Discrete distributions supported on {ω,2ω} | ω>0 and Pr(ω)=12},andΔ={Switch,Do not switch}.

SΩΔ={xR | x>0},={Discrete distributions supported on {ω,2ω} | ω>0 and Pr(ω)=12},and={Switch,Do not switch}.

As before, any decision procedure δδ can be considered a function from SS to [0,1],[0,1], this time by associating it with the probability of not switching, which again can be written δ(x)δ(x). The probability of switching must of course be the complementary value 1δ(x).1δ(x).

The loss, shown in Table 2, is the negative of the game's payoff. It is a function of the true state of nature ωω, the outcome xx (which can be either ωω or 2ω2ω), and the decision, which depends on the outcome.

Table 2.

LossLossOutcome(x)SwitchDo not switchCostω2ωωω[2(1δ(ω))+δ(ω)]2ωω2ωω[1δ(2ω)+2δ(2ω)]

Outcome(x)ω2ωLossSwitch2ωωLossDo not switchω2ωCostω[2(1δ(ω))+δ(ω)]ω[1δ(2ω)+2δ(2ω)]

In addition to displaying the loss function, Table 2 also computes the cost of an arbitrary decision procedure δδ. Because the game produces the two outcomes with equal probabilities of 1212, the risk when ωω is the true state of nature is

Riskδ(ω)=ω[2(1δ(ω))+δ(ω)]/2+ω[1δ(2ω)+2δ(2ω)]/2=(ω/2)[3+δ(2ω)δ(ω)].

Riskδ(ω)=ω[2(1δ(ω))+δ(ω)]/2+ω[1δ(2ω)+2δ(2ω)]/2=(ω/2)[3+δ(2ω)δ(ω)].

A constant procedure, which means always switching (δ(x)=0δ(x)=0) or always standing pat (δ(x)=1δ(x)=1), will have risk 3ω/23ω/2. Any strictly increasing function, or more generally, any function δδ with range in [0,1][0,1] for which δ(2x)>δ(x)δ(2x)>δ(x) for all positive real x,x, determines a procedure δδ having a risk function that is always strictly less than 3ω/23ω/2 and thus is superior to either constant procedure, regardless of the true state of nature ωω! The constant procedures therefore are inadmissible because there exist procedures with risks that are sometimes lower, and never higher, regardless of the state of nature.

Strategy

Comparing this to the preceding solution of the “guess which is larger” problem shows the close connection between the two. In both cases, an appropriately chosen randomized procedure is demonstrably superior to the “obvious” constant strategies.

These randomized strategies have some notable properties:

  • There are no bad situations for the randomized strategies: no matter how the amount of money in the envelope is chosen, in the long run these strategies will be no worse than a constant strategy.

  • No randomized strategy with limiting values of 00 and 11 dominates any of the others: if the expectation for δδ when (ω,2ω)(ω,2ω) is in the envelopes exceeds the expectation for εε, then there exists some other possible state with (η,2η)(η,2η) in the envelopes and the expectation of εε exceeds that of δδ .

  • The δδ strategies include, as special cases, strategies equivalent to many of the Bayesian strategies. Any strategy that says “switch if xx is less than some threshold TT and stay otherwise” corresponds to δ(x)=1δ(x)=1 when xT,δ(x)=0xT,δ(x)=0 otherwise.

What, then, is the fallacy in the argument that favors always switching? It lies in the implicit assumption that there is any probability distribution at all for the alternatives. Specifically, having observed xx in the opened envelope, the intuitive argument for switching is based on the conditional probabilities Prob(Amount in unopened envelope | xx was observed), which are probabilities defined on the set of underlying states of nature. But these are not computable from the data. The decision-theoretic framework does not require a probability distribution on ΩΩ in order to solve the problem, nor does the problem specify one.

This result differs from the ones obtained by (1) and its references in a subtle but important way. The other solutions all assume (even though it is irrelevant) there is a prior probability distribution on ΩΩ and then show, essentially, that it must be uniform over S.S. That, in turn, is impossible. However, the solutions to the two-envelope problem given here do not arise as the best decision procedures for some given prior distribution and thereby are overlooked by such an analysis. In the present treatment, it simply does not matter whether a prior probability distribution can exist or not. We might characterize this as a contrast between being uncertain what the envelopes contain (as described by a prior distribution) and being completely ignorant of their contents (so that no prior distribution is relevant).

4. CONCLUSIONS.

In the “guess which is larger” problem, a good procedure is to decide randomly that the observed value is the larger of the two, with a probability that increases as the observed value increases. There is no single best procedure. In the “two envelope” problem, a good procedure is again to decide randomly that the observed amount of money is worth keeping (that is, that it is the larger of the two), with a probability that increases as the observed value increases. Again there is no single best procedure. In both cases, if many players used such a procedure and independently played games for a given ωω, then (regardless of the value of ωω) on the whole they would win more than they lose, because their decision procedures favor selecting the larger amounts.

In both problems, making an additional assumption-—a prior distribution on the states of nature—-that is not part of the problem gives rise to an apparent paradox. By focusing on what is specified in each problem, this assumption is altogether avoided (tempting as it may be to make), allowing the paradoxes to disappear and straightforward solutions to emerge.

REFERENCES

(1) D. Samet, I. Samet, and D. Schmeidler, One Observation behind Two-Envelope Puzzles. American Mathematical Monthly 111 (April 2004) 347-351.

(2) J. Kiefer, Introduction to Statistical Inference. Springer-Verlag, New York, 1987.


8
This is a short article I wrote ten years ago but never published. (The new editor of the AMM saw no mathematical interest in it.) I have given talks in which I played the two-envelope game with the audience, using substantial amounts of real money.
whuber

1
Very nice write up! Joe Blitzstein talked about the two evelope problem in a Harvard Stat 110 lecture which is available free on youtube if anyone is interested btw.
Benjamin Lindqvist

@whuber Consider this variant. Suppose I choose two amounts of money such that one is twice as much as the other. Then I flip a fair coin to decide which amount goes in which envelope. Now you pick an envelope at random, and imagine the amount inside it, calling it xx (if this step is questionable, consider the case of opening up the envelope and looking at the actual amount - since the reasoning applies no matter what value you see inside, it should apply with a general xx). Then calculate the expected value of the money in the other envelope as E=(1/2)(x/2)+(1/2)(2x)=1.25x>xE=(1/2)(x/2)+(1/2)(2x)=1.25x>x...
Zubin Mukerjee

I guess I don't understand where in that reasoning I "assumed a prior distribution on the states of nature". Did I? Clearly the reasoning cannot be correct, because I cannot justify switching to the other envelope by merely thinking about the first envelope (since the same logic would apply to the second, once I switch once).
Zubin Mukerjee

2
@Zubin There is a basic (but interesting) mistake in that analysis. Let θθ be the smaller amount in the two envelopes. Given an observation of xx, you know that either θ=xθ=x or θ=x/2θ=x/2 and that the likelihood of this observation in either case is 1/21/2. In the former case the amount YY in the other envelope is 2x2x and in the latter case it is x/2x/2, but in order to assign a valid expectation to YY you must assume there is some probability distribution for θθ. Equal likelihood is not equivalent to equal probability.
whuber

7

The issue in general with the two envelope problem is that the problem as presented on wikipedia allows the size of the values in the envelopes to change after the first choice has been made. The problem has been formulized incorrectly.

However, a real world formulation of the problem is this: you have two identical envelopes: AA and BB, where B=2AB=2A. You can pick either envelope and then are offered to swap.

Case 1: You've picked AA. If you switch you gain AA dollars.

Case 2: You've picked BB. If you switch you loose AA dollars.

This is where the flaw in the two-envelope paradox enters in. While you are looking at loosing half the value or doubling your money, you still don't know the original value of AA and the value of AA has been fixed. What you are looking at is either +A+A or AA, not 2A2A or 12A12A.

If we assume that the probability of selecting AA or BB at each step is equal,. the after the first offered swap, the results can be either:

Case 1: Picked AA, No swap: Reward AA

Case 2: Picked AA, Swapped for BB: Reward 2A2A

Case 3: Picked BB, No swap: Reward 2A2A

Case 4: Picked BB, Swapped for AA: Reward AA

The end result is that half the time you get AA and half the time you get 2A2A. This will not change no matter how many times you are offered a swap, nor will it change based upon knowing what is in one envelope.


IMO, the problem says that you cannot lose A no matter what. So, your +A vs -A cannot be appropriate. You either win A or 2A.
Little Alien

7

My interpretation of the question

I am assuming that the setting in problem 3 is as follows: the organizer first selects amount XX and puts XX in the first envelope. Then, the organizer flips a fair coin and based on that puts either 0.5X0.5X or 2X2X to the second envelope. The player knows all this, but not XX nor the result of the coin-flip. The organizer gives the player the first envelope (closed) and asks if the player wants to switch. The questioner argues 1. that the player wants to switch because the switching increases expectation (correct) and 2. that after switching, the same reasoning symmetrically holds and the player wants to switch back (incorrect). I also assume the player is a rational risk-neutral Bayesian agent that puts a probability distribution over XX and maximizes expected amount of money earned.

Note that if the we player did not know about the coin-flip procedure, there might be no reason in the first place to argue that the probabilities are 0.5 for the second envelope to be higher/lower.

Why there is no paradox

Your problem 3 (as interpreted in my answer) is not the envelope paradox. Let the ZZ be a Bernoulli random variable with P(Z=1)=0.5P(Z=1)=0.5. Define the amount YY in the 2nd envelope so that Z=1Z=1 implies Y=2XY=2X and Z=0Z=0 implies Y=0.5XY=0.5X. In the scenario here, XX is selected without knowledge of the result of the coin-flip and thus ZZ and XX are independent, which implies E(YX)=1.25XE(YX)=1.25X. E(Y)=E(E(YX))=E(1.25X)=1.25E(X)

E(Y)=E(E(YX))=E(1.25X)=1.25E(X)
Thus, if if X>0 (or at least E(X)>0E(X)>0), the player will prefer to switch to envelope 2. However, there is nothing paradoxical about the fact that if you offer me a good deal (envelope 1) and an opportunity to switch to a better deal (envelope 2), I will want to switch to the better deal.

To invoke the paradox, you would have to make the situation symmetric, so that you could argue that I also want to switch from envelope 2 to envelope 1. Only this would be the paradox: that I would want to keep switching forever. In the question, you argue that the situation indeed is symmetric, however, there is no justification provided. The situation is not symmetric: the second envelope contains the amount that was picked as a function of a coin-flip and the amount in the first envelope, while the amount in the first envelope was not picked as a function of a coin-flip and the amount in the second envelope. Hence, the argument for switching back from the second envelope is not valid.

Example with small number of possibilities

Let us assume that (the player's belief is that) X=10X=10 or X=40X=40 with equal probabilities, and work out the computations case by case. In this case, the possibilities for (X,Y)(X,Y) are {(10,5),(10,20),(40,20),(40,80)}{(10,5),(10,20),(40,20),(40,80)}, each of which has probability 1/41/4. First, we look at the player's reasoning when holding the first envelope.

  1. If my envelope contains 1010, the second envelope contains either 55 or 2020 with equal probabilities, thus by switching I gain on average 0.5×(5)+0.5×10=2.50.5×(5)+0.5×10=2.5.
  2. If my envelope contains 4040, the second envelope contains either 2020 or 8080 with equal probabilities, thus by switching I gain on average 0.5×(20)+0.5×(40)=100.5×(20)+0.5×(40)=10.

Taking the average over these, the expected gain of switching is 0.5×2.5+0.5×10=6.250.5×2.5+0.5×10=6.25, so the player switches. Now, let us make similar case-by-case analysis of switching back:

  1. If my envelope contains 55, the old envelope with probability 1 contains 1010, and I gain 55 by switching.
  2. If my envelope contains 2020, the old envelope contains 1010 or 4040 with equal probabilities, and by switching I gain 0.5×(10)+0.5×20=50.5×(10)+0.5×20=5.
  3. If my envelope contains 8080, the old envelope with probability 1 contains 4040 and I lose 4040 by switching.

Now, the expected value, i.e. probability-weighted average, of gain by switching back is 0.25×5+0.5×5+0.25×(40)=6.250.25×5+0.5×5+0.25×(40)=6.25. So, switching back exactly cancels the expected utility gain.

Another example with a continuum of possibilities

You might object to my previous example by claiming that I maybe cleverly selected the distribution over XX so that in the Y=80Y=80 case the player knows that he is losing. Let us now consider a case where XX has a continuous unbounded distribution: XExp(1)XExp(1), ZZ independent of XX as previously, and YY as a function of XX and ZZ as previously. The expected gain of switching from XX to Y is again E(0.25X)=0.25E(X)=0.25. For the back-switch, we first compute the conditional probability P(X=0.5YY=y) using Bayes' theorem: P(X=0.5YY=y)=P(Z=1Y=y)=p(Y=yZ=1)P(Z=1)p(Y=y)=p(2X=y)P(Z=1)p(Y=y)=0.25e0.5yp(Y=y)

and similarly P(X=2YY=y)=e2yp(Y=y), wherefore the conditional expected gain of switching back to the first envelope is E(XYY=y)=0.125ye0.5y+ye2yp(Y=y),
and taking the expectation over Y, this becomes E(XY)=00.125ye0.5y+ye2yp(Y=y)p(Y=y)dy=0.25,
which cancels out the expected gain of the first switch.

General solution

The situation seen in the two examples must always occur: you cannot construct a probability distribution for X,Z,Y with these conditions: X is not a.s. 0, Z is Bernoulli with P(Z=1)=0.5, Z is independent of X, Y=2X when Z=1 and 0.5X otherwise and also Y,Z are independent. This is explained in the Wikipedia article under heading 'Proposed resolutions to the alternative interpretation': such a condition would imply that the probability that the smaller envelope has amount between 2n,2n+1 (P(2n<=min(X,Y)<2n+1) with my notation) would be a constant over all natural numbers n, which is impossible for a proper probability distribution.

Note that there is another version of the paradox where the probabilities need not be 0.5, but the expectation of other envelope conditional on the amount in this envelope is still always higher. Probability distributions satisfying this type of condition exist (e.g., let the amounts in the envelopes be independent half-Cauchy), but as the Wikipedia article explains, they require infinite mean. I think this part is rather unrelated to your question, but for completeness wanted to mention this.


I edited my question trying to explain why I think it is similar to the envelope paradox and you would want to switch forever.
evan54

@evan54 I rewrote my answer to contain my interpretation of the setting problem 3, more explanation about why the situation is not symmetric, examples etc.
Juho Kokkala

I think I'm close to getting it. I think that once there is a coin flip and envelope 2 contains half/double the amount in your hand you are basically in the situation of the envelope paradox BUT the way you got there guarantees you that you are better off switching. Does that make sense?
evan54

also, if it does, is there a way to make it more formal? I may ponder on it more..
evan54

1
@evan54 Not sure. The whole point of the paradox is that it is a situation in which there is no advantage to switching. Thus, anything you change to the setup of the problem that results in it being advantageous to switch, at least initially, must therefore not be equivalent to the setup of the two envelope paradox. Note that in your setup, it only makes sense to switch the very first time. After you switch the first time, you expect to lose by switching back. The flawed logic in the paradox comes into play if you attempt to argue that you should switch back.
jsk

4

Problem 1: Agreed, play the game. The key here is that you know the actual probabilities of winning 5 vs 20 since the outcome is dependent upon the flip of a fair coin.

Problem 2: The problem is the same as problem 1 because you are told that there is an equal probability that either 5 or 20 is in the other envelope.

Problem 3: The difference in problem 3 is that telling me the other envelope has either X/2 or 2X in it does not mean that I should assume that the two possibilities are equally likely for all possible values of X. Doing so implies an improper prior on the possible values of X. See the Bayesian resolution to the paradox.


I see we interpret problem 3 slightly differently. I assumed OP specifically constructs the setting in problem 3 so that the 2nd envelope has probabilities 0.5/0.5. This is clearly possible without improper distributions, but then the possibilities for envelope 1 are not equally likely given the amount in the second envelope.
Juho Kokkala

Agreed, if OP meant that you are told that the other envelope either has X/2 or 2X with equal probabilities, then problem 3 would not be equivalent to the 2 envelope paradox.
jsk

yes that was my thinking, that in problem 3 there is equal probability between X/2 and 2X. So you hold 3 envelopes give him the 10 and then flip a coin to see if you give him the 20 or 5 (they are closed) if he decides to switch
evan54

1
@evan54 - if you make the random flip after you choose which envelope to give me, then it's equivalent to problem 1; if you choose both amounts of money, and then make a random flip on which envelope you give me, then it's the situation described above; they're different situations.
Peteris

1
@evan54 - the optimal player's decision depends on how you made those envelopes. If you don't tell the player how you did that (only that 50/50 sentence), then the optimal strategy depends on player's assumptions on how likely you are to do it one way or another - the first envelope you prepared is less valuable than the second envelope you prepared; if they were fairly shuffled (and unopened) then it doesn't matter what the player chooses; if the player thinks that you likely (>50%) initially gave him the first envelope, then player should switch and stick with that.
Peteris

1

This is a potential explanation that I have. I think it is wrong but I'm not sure. I will post it to be voted on and commented on. Hopefully someone will offer a better explanation.

So the only thing that changed between problem 2 and problem 3 is that the amount became in the envelope you hold became random. If you allow that amount to be negative so there might be a bill there instead of money then it makes perfect sense. The extra information you get when you open the envelope is whether it's a bill or money hence you care to switch in one case while in the other you don't.

If however you are told the bill is not a possibility then the problem remains. (of course do you assign a probability that they lie?)


Introducing the possibility of negative amounts is an interesting observation, but not needed for resolving the issue in your question. See my answer.
Juho Kokkala

It is not necessary to assume the amount in the envelope is random: it suffices that it is unknown. Assuming randomness adduces information--however little it might be--that was not given in the problem!
whuber

1
The biggest difference between 2 and 3 is that being told the other amount is either X/2 or 2X is not the same as being told that the two possibilities are equally likely. Assuming the two amounts are equally likely is not the same as being told the two amounts are equally likely.
jsk

1

Problem 2A: 100 note cards are in an opaque jar. "$10" is written on one side of each card; the opposite side has either "$5" or "$20" written on it. You get to pick a card and look at one side only. You then get to choose one side (the revealed, or the hidden), and you win the amount on that side.

If you see "$5," you know you should choose the hidden side and will win $10. If you see "$20," you know you should choose the revealed side and will win $20. But if you see "$10," I have not given you enough information calculate an expectation for the hidden side. Had I said there were an equal number of {$5,$10} cards as {$10,$20} cards, the expectation would be $12.50. But you can't find the expectation from only the fact - which was still true - that you had equal chances to reveal the higher, or lower, value on the card. You need to know how many of each kind of card there were.

Problem 3A: The same jar is used, but this time the cards all have different, and unknown, values written on them. The only thing that is the same, is that on each card one side is twice the value of the other.

Pick a card, and a side, but don't look at it. There is a 50% chance that it is the higher side, or the lower side. One possible solution is that the card is either {X/2,X} or {X,2X} with 50% probability, where X is your side. But we saw above that the the probability of choosing high or low is not the same thing as these two different cards being equally likely to be in the jar.

What changed between your Problem 2 and Problem 3, is that you made these two probabilities the same in Problem 2 by saying "This envelope either has $5 or $20 in it with equal probability." With unknown values, that can't be true in Problem 3.


0

Overview

I believe that they way you have broken out the problem is completely correct. You need to distinguish the "Coin Flip" scenario, from the situation where the money is added to the envelope before the envelope is chosen

Not distinguishing those scenarios lies at the root of many people's confusion.

Problem 1

If you are flipping a coin to decide if either double your money or lose half, always play the game. Instead of double or nothing, it is double or lose some.

Problem 2

This is exactly the same as the coin flip scenario. The only difference is that the person picking the envelope flipped before giving you the first envelope. Note You Did Not Choose an Envelope!!!! You were given one envelope, and then given the choice to switch This is a subtle but important difference over problem 3, which affects the distribution of the priors

Problem 3

This is the classical setup to the two envelope problem. Here you are given the choice between the two envelopes. The most important points to realize are

  • There is a maximum amount of money that can be in the any envelope. Because the person running the game has finite resources, or a finite amount they are willing to invest
  • If you call the maximum money that could be in the envelope M, you are not equally likely to get any number between 0 and M. If you assume a random amount of money between 0 and M was put in the first envelope, and half of that for the second (or double, the math still works) If you open an envelope, you are 3 times as likely to see something less than M/2 than above M/2. (This is because half the time both envelopes will have less than M/2, and the other half the time 1 envelope will)
  • Since there is not an even distribution, the 50% of the time you double, 50% of the time you cut in half doesn't apply
  • When you work out the actual probabilities, you find the expected value of the first envelope is M/2, and the EV of the second envelope, switching or not is also M/2

Interestingly, if you can make some guess as to what the maximum money in the envelope can be, or if you can play the game multiple times, then you can benefit by switching, whenever you open an envelope less than M/2. I have simulated this two envelope problem here and find that if you have this outside information, on average you can do 1.25 as well as just always switching or never switching.

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.