ননজারো যোগফল দুটি প্লেয়ার ডিফারেনটিভাল গেমের মান ফাংশন কীভাবে যাচাই করবেন?


6

দুটি এজেন্ট i=1,2 । রাজ্য τ i[ 0 , 1 ]k দ্বারা পরিচালিত যেখানে ˙ k = f ( কে , τ 1 , τ 2 ) τi[0,1]

k˙=f(k,τ1,τ2).

i

vi(k):=supτi0eρtF(k,τi,σi)dt.
σi(k)iρ>0

হ্যামিল্টন-জ্যাকোবি-বেলম্যান সমীকরণটি পড়ছে

ρvi(k)=supτi{F(k,τi,σi)+v(k)f(k,τi,σi)}.

এখন ধরে নিন আমি মান ফাংশন পুনরাবৃত্তির দ্বারা একটি ফাংশন প্রায় অনুমান করেছি । আমি কীভাবে জানতে পারি যে এটি আসল মান ফাংশন?v^i


শেষ পুনরাবৃত্তির সাথে দূরত্বটি পরীক্ষা করুন। আপনি যদি এটি পছন্দ করেন তবে আপনি থামাতে পারেন। যদি এটি খুব বড় হয় তবে পুনরাবৃত্তি করুন।
ভিসাচে

প্রথমে আপনি একটি বিশ্লেষণমূলক উদাহরণ সমাধান করতে পারেন এবং তারপরে আপনার অ্যালগরিদমটি পরীক্ষা করতে পারেন। দ্বিতীয়ত, মান ফাংশন একটি নির্দিষ্ট বিন্দু, সুতরাং আপনি একটি নির্দিষ্ট বিন্দুতে রূপান্তরকরণের কয়েকটি পরীক্ষার জন্য গুগল করতে পারেন, কমপক্ষে একটি হিউরিসিটিক নিয়ম মাথায় আসে, i এবং i + 1 এর মধ্যে দূরত্ব হ্রাস পাচ্ছে, কঠোর অবতরণ বিশ্বব্যাপী অনুকূলতা নিশ্চিত করে
ব্যবহারকারী 157623

উত্তর:


1

প্রথম প্যানেল 80k (!) পুনরাবৃত্তি করার পরে চূড়ান্ত মান ফাংশনটি দেখায়। সম্ভবত একটি অন্তর্নিহিত পদ্ধতি চেষ্টা করা উচিত। দ্বিতীয় প্যানেলটি হ্রাস অনুমান থেকে চূড়ান্ত ফলাফল , পর্যন্ত বিবর্তন দেখায় । তৃতীয় প্যানেল হ'ল মান ফাংশনগুলির মধ্যে দূরত্ব এবং চতুর্থ ত্রুটি দেখায়।v0vjj=80k

নোট করুন যে মান ফাংশন উত্তল-অবতল। এই যে সীমা ক্ষেত্রে জন্য গতি আইন infinty থাকে আসলে কারণে ।limk0k˙=

সর্বোচ্চ নীতি অনুসারে অনুকূলতার প্রয়োজন হ্যামিলটোনিয়ান (পর্যাপ্ত শর্ত) -এ অবতল থাকে । এখন আমাদের কাছে

H1(k,τ1,τ2,λ1):=F(k,τ1,τ2)+λ1f(k,τ1,τ2)
(k,τ1,τ2)
ρv(k)=maxτ1H1(k,τ1,τ2,λ1).
  • আমি ভাবছিলাম যে সর্বোত্তমতা নিশ্চিত করতে মান ফাংশনটি অবশ্যই (কঠোরভাবে) অবতল হওয়া উচিত?

কোন রেফারেন্স প্রশংসা করা হয়।

vfi

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.