এখানে একটি "প্রত্যাশিত ইউটিলিটি সর্বাধিকীকরণ / গেম তাত্ত্বিক" পদ্ধতির (সেট-তাত্ত্বিক সম্ভাবনার ড্যাশ সহ) রয়েছে। যেমন একটি কাঠামোতে, উত্তরগুলি পরিষ্কার প্রদর্শিত হবে।
প্রাঙ্গনে
আমরা নিখুঁত সততা মধ্যে বলা হয় যে জন্য ,. x কঠোরভাবে ইতিবাচক আর্থিক পরিমাণ, নিম্নলিখিত দুটি টিকিট একটি বাক্সে রাখা হয়েছিল: {A=x,B=2x} নির্ধারিত পরিচয় নম্বর সহ 1 এবং {A=2x,B=x} নির্ধারিত পরিচয় নম্বর সহ 0। তারপরে একটি বার্নোল্লি থেকে একটি অঙ্কন (p=0.5) এলোমেলো ভেরিয়েবল কার্যকর করা হয়েছিল, এবং ফলাফল এবং ঘটেছে ইভেন্টের উপর ভিত্তি করে পরিমাণ x এবং 2x খামে রাখা হয়েছিল A এবং B। আমাদের কী বলা হয় তা বলা হয় নাx হয়, বা কোন পরিমাণে কোন খাম গিয়েছিল।
প্রথম CASE: একটি খাম এটি না খোলায় স্যুইচ করার বিকল্পটি সহ চয়ন করুন
প্রথম বিষয়টি হ'ল আমরা একটি খামকে কীভাবে বেছে নেব ? এটি পছন্দগুলির সাথে করতে হবে। সুতরাং ধরে নিন যে আমরা ইউটিলিটি ফাংশন সহ ইউটিলিটি ম্যাক্সিমাইজারগুলি প্রত্যাশিতআপনি ( )।
দুটি সম্ভাব্য র্যান্ডম ভেরিয়েবল বিবেচনা করে আমরা এখানে সম্ভাব্য কাঠামোটি মডেল করতে পারি, একজন এবং বিখামগুলি, এবং এতে পরিমাণের প্রতিনিধিত্ব করে। প্রত্যেকের সমর্থন হয়{ এক্স , 2 x এর }। তবে তারা স্বতন্ত্র নয়। সুতরাং আমরা যৌথ বিতরণ দিয়ে শুরু করতে হবে। সারণী আকারে, যৌথ বন্টন এবং সংশ্লিষ্ট প্রান্তিক বিতরণ হয়
একজন/খ →এক্স2 এক্সমার্গ বিএক্স00.50.52 এক্স0.500.5মার্গ এ0.50.51.00
এটি আমাদের জানায় একজন এবং বি অভিন্ন প্রান্তিক বিতরণ আছে।
তবে এর অর্থ হ'ল আমরা খামগুলি কীভাবে চয়ন করি তা বিবেচ্য নয়, কারণ আমরা সর্বদা একই প্রত্যাশিত ইউটিলিটি পাব ,
0.5 ⋅ u ( x ) + 0.5 ⋅ u ( 2 x )
আমরা এখানে যা মুখোমুখি তা হ'ল দুটি যৌগিক জুয়া (প্রতিটি খাম) এর উপর একটি যৌগিক জুয়া (একটি খাম কীভাবে চয়ন করা যায়)। আমরা চয়ন করতে পারেনএকজন সম্ভাবনা সহ 1, 0, বা এর মধ্যে কিছু (এবং পরিপূরকভাবে এর জন্য) বি)। এটা কোন ব্যাপার না। আমরা সর্বদা একই প্রত্যাশিত ইউটিলিটি পাব। নোট করুন যে ঝুঁকির প্রতি আমাদের মনোভাব এখানে ভূমিকা পালন করে না।
সুতরাং, আমরা একটি খাম চয়ন করি, বলুন একজন, এবং আমরা এটি তাকিয়ে আছে। এখন আমাদের প্রত্যাশিত ইউটিলিটি কী? ঠিক আগে পছন্দ হিসাবে একই । যেভাবেই একটি খাম বাছাই করা, তার ভিতরে থাকা সম্ভাবনাগুলিকে প্রভাবিত করে না।
আমাদের স্যুইচ করার অনুমতি রয়েছে। বলুন আমরা করি, এবং এখন আমরা খাম ধরে আছিবি। প্রত্যাশিত ইউটিলিটি এখন কী? ঠিক আগের মতই ।
এটি আমাদের জন্য বিশ্বের সম্ভাব্য দুটি রাষ্ট্র: চয়ন করুন একজন বা চয়ন করুন বি। যে কোনও পছন্দ অনুসারে, বিশ্বের উভয় রাষ্ট্রই আমাদের নির্বাচিত / ধরে নেওয়া চালক শক্তিকে (অর্থাত্ প্রত্যাশিত ইউটিলিটি সর্বাধিকীকরণ) একই মূল্যকে বোঝায়।
সুতরাং এখানে, আমরা স্যুইচিং সম্পর্কে উদাসীন। , এবং বাস্তবে আমরা এলোমেলোভাবেও করতে পারি।
২ য় ক্ষেত্রে: পরে স্যুইচ করার বিকল্পটি দিয়ে এনভেলপ খুলুন
এখনই ধরুন যে আমরা বাছাই করেছি একজন, এটি খুলুন, এবং পরিমাণের ভিতরে পাওয়া যায় Y∈ { এক্স , 2 x এর }। এটি কি জিনিস পরিবর্তন করে?
দেখা যাক. আমি অবাক, কি
পি( এ = এক্স ∣ এ ∈ { এক্স , ২ এক্স } ) = ?
আমরা হব, { এক্স , 2 x এর } নমুনা স্থান যা এলোমেলো পরিবর্তনশীল একজনসংজ্ঞায়িত করা. সম্পূর্ণ নমুনা স্পেসে অবস্থিত তাত্পর্যপূর্ণ সিগমা-বীজগণিতের উপর অবস্থার শর্তাদি সম্ভাব্যতা বা প্রত্যাশিত মানগুলিকেও প্রভাবিত করে না। এটি যেমন আমরা ভাবছি "এর মান কীএকজন যদি আমরা জানি যে সমস্ত সম্ভাব্য মানগুলি উপলব্ধি হয়ে থাকতে পারে? "কোনও কার্যকর জ্ঞান অর্জন করা যায় নি, তাই আমরা এখনও মূল সম্ভাব্য কাঠামোতে আছি।
তবে আমিও অবাক, কী
পি( বি = এক্স ∣ এ ∈ { এক্স , ২ এক্স } ) = ?
কন্ডিশনার বিবৃতি, ইভেন্টটি দ্বারা উত্পাদিত সিগমা-বীজগণিত হিসাবে সঠিকভাবে দেখা { একটি∈{এক্স,2x এর} }, পুরো পণ্য নমুনা স্থান যা এলোমেলো ভেক্টর ( ক , খ )সংজ্ঞায়িত করা হয়েছে। উপরের যৌথ বিতরণের টেবিল থেকে আমরা দেখতে পাচ্ছি যে যৌথের সম্ভাব্যতা বরাদ্দ প্রান্তিকের সম্ভাবনা বরাদ্দ হিসাবে সমান (মাপের শূন্যের দুটি ইভেন্টের উপস্থিতির কারণে "প্রায় অবশ্যই" যোগ্যতা)। সুতরাং এখানেও আমরা মূলত এর জন্য সম্ভাব্যতাগুলি শর্ত করিবিএটির পুরো নমুনা স্পেসে। এটি অনুসরণ করে যে খামটি খোলার জন্য আমাদের ক্রিয়াটি এর জন্য সম্ভাব্য কাঠামোকে প্রভাবিত করে নাবি এছাড়াও।
সিদ্ধান্ত গ্রহণের পাশাপাশি গেম তত্ত্ব লিখুন। আমরা খামটি খুলেছি, এবং সিদ্ধান্ত নিতে হবে যে আমরা সুইচ করব কিনা। আমরা যদি স্যুইচ না করি তবে আমরা ইউটিলিটি পাইu ( y))। যদি আমরা স্যুইচ করি তবে আমরা বিশ্বের নিম্নলিখিত দুটি সম্ভাব্য রাজ্যে আছি
Y= এক্স , ইউ ( এ ) = ইউ ( এক্স )⟹ইউ ( বি ) = ইউ ( ২ এক্স )
Y= 2 এক্স , ইউ ( এ ) = ইউ ( 2 এক্স )⟹ইউ ( বি ) = ইউ ( এক্স )
কোন রাষ্ট্রটি আসলে রাখে তা আমরা জানি না, তবে উপরের আলোচনা অনুযায়ী আমরা জানি যে প্রত্যেকটির সম্ভাবনা রয়েছে পি = 0.5 বিদ্যমান
আমরা এটিকে এমন একটি খেলা হিসাবে মডেল করতে পারি যেখানে আমাদের প্রতিপক্ষ "প্রকৃতি" এবং যেখানে আমরা জানি যে প্রকৃতি নিশ্চিতভাবে এলোমেলো কৌশল নিয়ে খেলে : সাথেপি = 0.5 Y= এক্স এবং সাথে পি = 0.5, Y= 2 এক্স। তবে আমরা এখন এটিও যদি আমরা স্যুইচ না করি তবে আমাদের বেতন নিশ্চিত। সুতরাং এখানে আমাদের খেলাগুলি আমাদের সাধারণ আকারে, আমাদের পেওফগুলি সহ:
আমরা/প্রকৃতি →সুইচস্যুইচ করবেন নাY= এক্সআপনি ( 2 এক্স )u ( y))Y= 2 এক্সআপনি ( এক্স )u ( y))
প্রতিস্থাপনের লোভ আমাদের প্রতিহত করা উচিত আপনি ( এক্স ) এবং আপনি ( 2 এক্স ) জন্য u ( y))। u ( y))একটি জ্ঞাত এবং নির্দিষ্ট পরিশোধ "স্যুইচ" কৌশলটির অর্থ প্রদানগুলি আসলে জানা যায় না (যেহেতু আমরা এর মান জানি নাএক্স)। সুতরাং আমরা বিকল্প প্রতিস্থাপন করা উচিত । যদিY= এক্স তারপর তোমার দর্শন লগ করা ( 2 x ) = u ( 2 y)), এবং যদি Y=2 এক্স তারপর তোমার দর্শন লগ করা ( x ) = u ( y )/ 2)। সুতরাং এখানে আবার আমাদের খেলা:
আমরা/প্রকৃতি →সুইচস্যুইচ করবেন নাY=এক্সতোমার দর্শন লগ করা ( 2 y))তোমার দর্শন লগ করা( y))Y= 2 এক্সতোমার দর্শন লগ করা( y)/ 2)তোমার দর্শন লগ করা( y))
এখন ম্যাট্রিক্সের সমস্ত পে-অফস জানা গেছে। একটি বিশুদ্ধ প্রভাবশালী কৌশল আছে?
কৌশল "স্যুইচ" এর প্রত্যাশিত পরিশোধ is
ই(ভীএস) = 0.5 ⋅ ইউ ( 2 y)) + 0.5 ⋅ u (y)/ 2)
কৌশল "প্রত্যাশা স্যুইচ করুন" এর প্রত্যাশিত পরিশোধ
ই(ভীডি এস) = ইউ ( ওয়াই ))
আমাদের যদি সুইচ করা উচিত
ই(ভীএস) > ই(ভীডি এস)⟹0.5 ⋅ u ( 2 y)) + 0.5 ⋅ u ( y)/ 2)>u(y))
এবং এখন , ঝুঁকি প্রতি মনোভাব সমালোচনা হয়ে ওঠে। ঝুঁকি নেওয়ার এবং ঝুঁকিপূর্ণ নিরপেক্ষ আচরণের অধীনে এটিকে অনুমিত করা কঠিন নয় , আমাদের স্যুইচ করা উচিত।
শুভেচ্ছা ঝুঁকি বিমুখ আচরণ , আমি একটি মার্জিত ফলাফলের খুঁজে পেয়েছেন:
লগারিদমিক (বলুন, বর্গমূল) এর চেয়ে "কম অবতল" (কঠোরভাবে উপরে) ইউটিলিটি ফাংশনের জন্য, তারপরে আমাদের এখনও স্যুইচ করা উচিত।
লগারিদমিক ইউটিলিটির জন্য তুমি (y)) = lnY, আমরা স্যুইচিং বা না করার মধ্যে উদাসীন।
লগারিদমিক ইউটিলিটি ফাংশনগুলির ("নীচে কঠোরভাবে" এর চেয়ে "আরও অবতল" জন্য, আমাদের উচিত নয়) স্যুইচ করা ।
আমি লগারিদমিক কেসের ডায়াগ্রামের সাথে বন্ধ করে দিই
ধরে Y= 4। তারপরY/ 2=2,2 y= 8। লাইনΓ - Δ - ই"স্যুইচ" থেকে প্রত্যাশিত ইউটিলিটিটি যে লাইনে পড়ে থাকবে। প্রকৃতি যেহেতু ক50 - 50 কৌশল, এটি আসলে পয়েন্ট এ হবে Δযার মধ্যম পয়েন্ট Γ - Δ - ই। লগারিদমিক ইউটিলিটি সহ সেই মুহুর্তে, আমরা "ডোন্ট স্যুইচ", অর্থাত্ ঠিক একই রকমের ইউটিলিটিটি পাইLn( 4 ) এই সংখ্যার উদাহরণ জন্য।