হ্যামিল্টন-জ্যাকোবি-বেলম্যান সমীকরণ সমাধান করা; অনুকূলতার জন্য প্রয়োজনীয় এবং পর্যাপ্ত?


13

নিম্নলিখিত ডিফারেনশিয়াল সমীকরণ বিবেচনা

x˙(t)=f(x(t),u(t))
যেখানে x রাষ্ট্র নেই এবং u নিয়ন্ত্রণ পরিবর্তনশীল। সমাধানটি
x(t)=x0+0tf(x(s),u(s))ds.
যেখানে x0:=x(0) হল প্রদত্ত মূল অবস্থা।

এখন নিম্নলিখিত প্রোগ্রামাম বিবেচনা করুন

V(x0):=maxu0eρtF(x(t),u(t))dts.t. x˙(t)=f(x(t),u(t))x(0)=x0
যেখানেসময় পছন্দকে বোঝায়,হ'ল মান এবংএকটি উদ্দেশ্যমূলক ফাংশন। একটি ধ্রুপদী অর্থনৈতিক প্রয়োগ হ'ল সর্বোত্তম বৃদ্ধির রামসে-ক্যাস-কোপম্যানস মডেল। হ্যামিল্টন-জ্যাকোবি-বেলম্যান সমীকরণটি ভি ( ) এফ ( ) ρ ভি ( এক্স ) = সর্বাধিক ইউ [ এফ ( এক্স , ইউ ) + ভি ( এক্স ) ( এক্স , ইউ ) ] ,ρ>0V()F()
ρV(x)=maxu[F(x,u)+V(x)f(x,u)],t[0,).

বলুন আমি জন্য এইচজেবি সমাধান করেছি V। সর্বোত্তম নিয়ন্ত্রণটি তখন

u=argmaxu[F(x,u)+V(x)f(x,u)].
আমি রাষ্ট্র ও নিয়ন্ত্রণের জন্য অনুকূল নির্দিষ্ট আবক্র পাবেন {(x(t),u(t)):t[0,)}

উইকি নিবন্ধে বলেছেন

... তবে পুরো রাষ্ট্রীয় স্থানের সমাধানের সময়, এইচজেবি সমীকরণটি সর্বোত্তমের জন্য প্রয়োজনীয় এবং পর্যাপ্ত শর্ত।

Bertsekas (2005) সালে ডায়নামিক প্রোগ্রামিং এবং অনুকূল নিয়ন্ত্রণ , ভোল 1, 3 য় সংস্করণ।, প্রোপজিসন 3.2.1 তিনি যে জন্য সমাধানে অনুকূল খরচ টু যেতে ফাংশন এবং সংশ্লিষ্ট তোমার দর্শন লগ করা * অনুকূল নয়। যাইহোক, তিনি স্পষ্টভাবে এটি পর্যাপ্তর উপপাদ্য হিসাবে ঘোষণা করেছেন।Vu

প্রকৃতপক্ষে, আমি কেবল এটি নিশ্চিত করতে চাই যে, আমি যদি এইচজেবি সমাধান করেছি এবং সম্পর্কিত রাষ্ট্র এবং নিয়ন্ত্রণের ট্র্যাজেক্টরিগুলি পুনরুদ্ধার করেছি, তবে আমাকে কোনও অতিরিক্ত অনুকূল পরিস্থিতির সাথে উদ্বিগ্ন হওয়ার দরকার নেই।

সমাধান

আমি চেষ্টা

আমি মনে করি আমি নিজেই এইচজেবি সমীকরণ দ্বারা সর্বোচ্চ নীতি থেকে প্রয়োজনীয় শর্তাদি অর্জন করতে সক্ষম হয়েছি।

H(x,u,V(x)):=F(x,u)+V(x)f(x,u)

ρV(x)=maxuH(x,u,V(x))

ρV(x)=H(x,u,V(x)).

q:[0,)Rq(0)=limtq(t)=0

x=x+εq

εR

ρV(x+εq)=H(x+εq,u,V(x+εq)).

ε=0ε

ρVq=Hxq+HVVq.

এখন সাথে অ্যাডেজমেন্ট ভেরিয়েবলটি সংজ্ঞায়িত করুন

λ=V(x).

সময়ের সাথে পার্থক্য

λ˙=Vx˙.

এবং নোট করুন যে

HV=f(x,u)=x˙.

ফোকাসে এভারথিং প্লাগ করুন gives

ρλ=Hx+λ˙.

এটাই অনেক সুন্দর। সুতরাং এইচজেবি সমাধান করা অনুকূলতার জন্য প্রয়োজনীয় এবং পর্যাপ্ত (এখানে বাদ দেওয়া)। কারও উচিত এটি উইকে যুক্ত করা উচিত। এই জাতীয় সমস্যাগুলি সম্পর্কে চিন্তাভাবনা করা লোকদের জন্য সময় সাশ্রয় করতে পারে (আমার পক্ষে তেমন কিছু হবে না)।

তবে রূপান্তরযোগ্যতা শর্ত অনুপস্থিত।

limteρtλ(t)=0

II চেষ্টা

পেওফের কার্যক্ষম সংজ্ঞায়িত করুন

J(u):=0eρtF(x,u)dt

নোট করুন যে সংজ্ঞা অনুসারে । পারফরম্যান্সাল জন্য নিরপেক্ষ মেয়াদ যুক্ত করুন

0eρtλ[f(x,u)x˙]dt=0
x˙=f(x,u)
J(u)=0eρt[F(x,u)+λf(x,u)]dt0eρtλx˙dt=0eρtH(x,u,λ)0eρtλx˙dt

ডান টার্মের অংশগুলির দ্বারা একীকরণের ফলে আরএইচএস ফলন হবে

0eρtλx˙dt=[eρtλ(t)x(t)]00eρtx(λ˙ρλ)dt

সেই পদটি পুনরায় প্রতিস্থাপন করুন

J(u)=0eρt[H(x,u,λ)+x(λ˙ρλ)]dtlimteρtλ(t)x(t)+λ(0)x(0)

নির্ধারণ করুন

x=x+εqu=u+εp

যা

J(ε)=0eρt[H(x+εq,u+εp,λ)+(x+εq)(λ˙ρλ)]dtlimteρtλ(t)[x(t)+εq(t)]+λ(0)x(0)

সর্বাধিকJε=0

Jε=0eρt[Hxq+Hup+q(λ˙ρλ)]dtlimteρtλ(t)q(t)=0

যেহেতু এবং আমাদের অবশ্যই qp

Hu=0Hx=ρλλ˙limteρtλ(t)=0

আপনি এখনও প্রয়োজনীয় এবং পর্যাপ্ত শর্তাদি চিহ্নিত করেছেন?
জামজি

এটি কোন অর্থনৈতিক প্রসঙ্গে উঠে আসে?
স্টান শানপাইক

উদাহরণস্বরূপ রামসে মডেল cer.ethz.ch/resec/people/tsteger/Ramsey_Model.pdf
পুনের

1
আমি মনে করি যে এই থ্রেডটি ম্যাথ.স্ট্যাকেক্সেঞ্জ ডটকমের জন্য আরও উপযুক্ত since একটি মোড এটি স্থানান্তর করতে পারে।
অনুগ্রহহীন

এখানে কী জিজ্ঞাসা করা হয়েছে তা সম্পর্কে আমি নিশ্চিত নই: বার্টসেকাসে যদি এইচজেবি সমাধানের জন্য যথেষ্ট হয় , তবে আপনাকে "অতিরিক্ত অনুকূল অবস্থার বিষয়ে চিন্তা করতে হবে না"। এইচজেবি সমাধান না করা হলে "প্রয়োজনীয় এবং পর্যাপ্ত" "বিরুদ্ধে কেবল" যথেষ্ট উত্থাপিত হবে - যার ক্ষেত্রে কেউ বলবেন "এর অর্থ এই নয় যে কোনও সমাধান নেই"। যাইহোক, আপনার এবং দ্বিতীয় চেষ্টাগুলি এখানে মূল্যবান সামগ্রী রয়েছে - প্রথমটি এইচজেবি এবং অনুকূল নিয়ন্ত্রণের অন্তর্গত একটি লিঙ্ক দেখায়, দ্বিতীয়টি কীভাবে অনুকূল নিয়ন্ত্রণ FOC গুলি প্রাপ্ত হতে পারে তা দেখায়।
অ্যালেকোস পাপাদোপল্লোস

উত্তর:


1

(এটি সম্ভবত একটি মন্তব্য বিবেচনা করা উচিত।)

আপনি যদি এইচজেবি সমীকরণটি সমাধান করে থাকেন তবে এটি সর্বোত্তম সমাধান পেতে যথেষ্ট। সুতরাং আপনাকে "অন্য কোনও অনুকূল অবস্থার সাথে উদ্বিগ্ন হতে হবে না", যা আমি বিশ্বাস করি যে এটি আপনার প্রশ্নের উত্তর দেবে বলে মনে হয়।

এটি প্রদর্শিত হয় যে আপনি উপপাদ্যের "প্রয়োজনীয়" উপাদানটি সম্পর্কে উদ্বিগ্ন। বিবৃতিটির প্রয়োজনীয়তার দিকটি নিম্নরূপ: যদি কোনও অনুকূল সমাধান হয় তবে এইচজেবি সমীকরণের একটি সমাধান অবশ্যই উপস্থিত থাকে।

আমি এই বিশেষ সমস্যাটি নিয়ে কাজ করি নি, তবে সাধারণভাবে উত্তরটি হ'ল আমাদের একটি পৃথক ফাংশন ভি আশা করা যায় না Therefore সুতরাং সমীকরণের যেমনটি বলা আছে তেমন সমাধান আমাদের নেই। পরিবর্তে, আমাদের সাধারণীকৃত ডেরাইভেটিভগুলি দেখতে হবে এবং এইচজেবি সমীকরণকে একটি বৈষম্যতে রূপান্তর করতে হবে। কোন ক্ষেত্রে, আপনি একটি "সান্দ্রতা সমাধান" পেতে পারেন। যদি আমরা সাধারণীকৃত ডেরাইভেটিভগুলি ব্যবহার করতে প্রসারিত করি তবে এটি প্রমাণ করা সম্ভব যে এই জাতীয় সমাধানটি সর্বদা বিদ্যমান। আপনার প্রমাণগুলিতে দৃষ্টিনন্দন হওয়া, তারা প্রয়োজনীয়তার শর্তগুলিতে সহায়তা করবে না, কারণ আপনি স্বতন্ত্রতা ধরে নিচ্ছেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.