ডায়নামিক প্রোগ্রামিংয়ের সমাধান (বেলম্যান সমীকরণ) সমস্যা


2

কেউ দয়া করে নীচের সমাধান কীভাবে পয়েন্টার সরবরাহ করতে পারেন? যদি কোনও তাত্ত্বিক অনুমানগুলি সম্ভব হয় তবে এটি খুব সহায়ক হবে। যদি সংখ্যাসূচক সমাধানগুলি সঠিক পদ্ধতির হয় তবে আপনি কী পরামর্শ দিতে পারবেন যে আমরা আর-এ এটি করতে পারি (সীমিত, আসলে শূন্য, তহবিলের কারণে ফ্রি সফ্টওয়্যারটিতে সীমাবদ্ধ; সুতরাং আর পয়েন্টারগুলি সবচেয়ে স্বাগত হবে)?

সমাধান করা বেলম্যান সমীকরণটি দিয়েছেন,

ভীটি(ওয়াইটি-1,জেডটি)=সর্বনিম্ন{এক্সটি}টি[সর্বোচ্চ{(ওয়াইটি-ওয়াইটি-1),0}জেডটি+ +ভীটি+ +1(ওয়াইটি,জেডটি+ +1)]

এখানে, স্বরলিপিটি দাঁড়িয়েছে,

ভীটি(ওয়াইটি-1,জেডটি) সময় এর মান ফাংশন ।টি

টি প্রত্যাশা সময়ে নেওয়া হয় ।টি

এক্সটি , পরিমাণ বা সময়ের মধ্যে অর্জিত পণ্যের পরিমাণ মূল্যে ।Y tটিওয়াইটি

জেডটি , এমন একক সংখ্যা যা আমাদের এখনও সময়ে অর্জন করতে হবে ।টি

এক্স¯ = , মোট পরিমাণ প্রয়োজন।জেড1

টি , সময়সীমার মোট সংখ্যা।

এক্স1,,এক্সটি হ'ল যে অধিগ্রহণগুলি আমরা করতে চাই এবং এটি নির্ধারণ করা দরকার তার তালিকা।

মূল্য গতির একটি সাধারণ আইন নীচে হিসাবে ধরে নেওয়া হয়,

ওয়াইটি=ওয়াইটি-1+ +θএক্সটি+ +εটি,θ>0,[εটি|এক্সটি,ওয়াইটি-1]=0,εটি~এন(0,σε2)

σ 2 εএন(0,σε2) একটি গড় বিতরণ যা গড় শূন্য এবং বৈকল্পিকσε2

এছাড়াও, নিম্নলিখিত বৈশিষ্ট্যগুলি ধরে রাখে,

Σটি=1টিএক্সটি=এক্স¯,এক্সটি0,জেড1=এক্স¯,জেডটি+ +1=0,জেডটি=জেডটি-1-এক্সটি-1

পিএস: দয়া করে নোট করুন, বিস্তৃত দর্শকদের কাছ থেকে উত্তর চেয়ে এটি গণিতের ওয়েবসাইটে পোস্ট করা হয়নি।

https://math.stackexchange.com/questions/2694694/solution-to-dynamic-programming-bellman-equation-problem

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.