অবিচ্ছিন্ন সময় গতিশীল প্রোগ্রামিং শেখার জন্য কেউ কি ভাল রেফারেন্স সম্পর্কে জানেন? তথ্যসূত্রগুলি বই হতে হবে না। তারা পাশাপাশি অনলাইন সংস্থানগুলির লিঙ্ক হতে পারে। এমনকি কেবলমাত্র বেসিকগুলির পরিষ্কার, সংক্ষিপ্ত আলোচনার লিঙ্কগুলি সহায়ক হবে।
অবিচ্ছিন্ন সময় গতিশীল প্রোগ্রামিং শেখার জন্য কেউ কি ভাল রেফারেন্স সম্পর্কে জানেন? তথ্যসূত্রগুলি বই হতে হবে না। তারা পাশাপাশি অনলাইন সংস্থানগুলির লিঙ্ক হতে পারে। এমনকি কেবলমাত্র বেসিকগুলির পরিষ্কার, সংক্ষিপ্ত আলোচনার লিঙ্কগুলি সহায়ক হবে।
উত্তর:
অবিচ্ছিন্ন সময় স্টোকাস্টিক গতিশীল প্রোগ্রামিংয়ের জন্য, দীক্ষিত দ্বারা স্মুথ পেস্টিংয়ের ছোট, ননটেকনিক্যাল আর্ট একটি দুর্দান্ত বিকল্প। এটি বেসিক অন্তর্দৃষ্টি জানাতে একটি খুব কার্যকর কাজ করে।
স্টোকির আরও সাম্প্রতিক ঘটনা ইকোনমিক্স অফ অ্যাকশনটিও শালীন, তবে একটি ব্যবহারিক মনোভাবের ব্যক্তির পক্ষে এটি সম্ভবত ডিক্সিতকে দক্ষতা প্রদর্শন করে - এর অনেক বেশি দৈর্ঘ্য এবং কিছুটা ভারী স্বরলিপি উপযুক্ত পুরষ্কার দেয় না।
যদি অন্তর্নিহিত স্টোকাস্টিক প্রক্রিয়াগুলি এটির মতবিরোধ না হয় তবে আমি নিশ্চিত নই যে সেরা রেফারেন্সটি কী। সবচেয়ে সাধারণ ধরনের ক্ষেত্রে আমি দেখেছি (এবং আমি নিজেকে ব্যবহার) বিযুক্তভাবে অনেক exogenous রাজ্যের যেখানে আমরা যদি রাষ্ট্র বর্তমানে এর ক্ষেত্রে দেখা যায় আছে কিছু ধ্রুবক বিপত্তি হার λ গুলি , গুলি ' রাষ্ট্র করার জন্য একটি স্যুইচের গুলি ' । সৌভাগ্যক্রমে, এটি অনুশীলনের ক্ষেত্রে খুব সহজ একটি মামলা: ভি ( ⋅ , গুলি ) থেকে ভি ( ⋅ , এস ′ ) এ স্যুইচিংয়ের প্রবাহ সম্ভাবনার জন্য অ্যাকাউন্টে HJB সমীকরণটি পরিবর্তিত করতে পারে। (উদাহরণস্বরূপ, এই এসেমোগলু এবং আকসিগিটি পেপারে সমীকরণগুলিতে (1) - (5) এটি দেখতে পারেন Con ড্রাইভিং প্রক্রিয়া হিসাবে আমাদের যখন এটির বিচ্ছিন্নতা থাকে তখন ধারণামূলকভাবে এটি এইচজেবি সমীকরণ স্থাপনের থেকে আলাদা নয় except কারণ আমরা কেবল একটি রৈখিক সমীকরণের ব্যবস্থা পেয়েছি এবং এটির লেমা ইত্যাদি সম্পর্কে আমাদের ভাবার দরকার নেই)
অবশ্যই, এটির জন্য খুব ভাল পাঠ্যপুস্তকের উল্লেখ থাকতে পারে - তবে স্টোকাস্টিক ক্যালকুলাসের সাথে জড়িত সম্ভাব্য অনেক জটিল মামলার বিপরীতে, এটি যথেষ্ট সহজ যে কোনও পাঠ কখনও আমার কাছে প্রয়োজনীয় মনে হয়নি।
আমি মনে করি কামিয়েন এবং শোয়ার্টজের ডায়নামিক অপটিমাইজেশন: অর্থনীতি এবং পরিচালনার ক্ষেত্রে ক্যালকুলাস অফ ভেরিয়েশনস এবং অনুকূল নিয়ন্ত্রণটি বেশ সুপরিচিত।
ফ্লেমিং এবং সোনার দ্বারা নিয়ন্ত্রিত মার্কভ প্রসেসেস এবং ভিসোসিটি সলিউশনে ফিনান্স এবং ডিফারেনশিয়াল গেমগুলির জন্য বেশ কয়েকটি অ্যাপ্লিকেশন অন্তর্ভুক্ত রয়েছে।
এইচজেবি আনুমানিক করার জন্য একটি দুর্দান্ত পদ্ধতি হল আপুইন্ড স্কিম, যা আমি খুব তাড়াতাড়ি ব্যবহার করে শিখেছি বেন মোল এট এর নোট এবং কোডগুলি
উদাহরণগুলি হেজেট এবং আইগরির মতো পরিচিত ভিন্ন ভিন্ন এজেন্টের অর্থনীতির মডেলগুলির ক্রমাগত সময়ের সংস্করণ।
ক্লাউস ওয়েল্ডের প্রয়োগকৃত আন্তঃআবিজ্ঞানীয় অপ্টিমাইজেশন একটি খুব সুন্দর বই, এমনকি তাদের জন্য যারা গণিতের সাথে সত্যই পরিচিত নন।
বইটি নির্বিঘ্নে এবং অবিচ্ছিন্ন সময় উভয় ক্ষেত্রে নির্জনবাদী এবং স্টোকাস্টিক মডেলগুলির আচরণ করে।
আমি সত্যই এই বইটি "ডামিমেটিক অপটিমাইজেশন ফর ডমিস" এর জন্য বলব। গতিশীল অপ্টিমাইজেশনের সাথে আমি মোটেই পরিচিত ছিলাম না তবে এই বইটি আমাকে প্রবেশ করতে দেয়।