প্রশ্ন ট্যাগ «dynamic-programming»

3
যখন অনুকূল নিয়ন্ত্রণ ব্যর্থ হয় (?)
"আমার প্রশ্ন জিজ্ঞাসা করতে" প্রথমে আমাকে একটি মডেল সমাধান করতে হবে। আমি কিছু পদক্ষেপ বাদ হবে কিন্তু এখনও, এই অনিবার্য পোস্টটি করতে হবে খুব দীর্ঘ -so এটাও দেখতে এই সম্প্রদায় প্রশ্ন ধরনের লেগেছে কিনা একটি পরীক্ষা। শুরু করার আগে, আমি পরিষ্কার করে দিয়েছি যে এটি সম্পূর্ণরূপে অবিচ্ছিন্ন সময়ে একটি আদর্শ …

1
হ্যামিল্টন-জ্যাকোবি-বেলম্যান সমীকরণ সমাধান করা; অনুকূলতার জন্য প্রয়োজনীয় এবং পর্যাপ্ত?
নিম্নলিখিত ডিফারেনশিয়াল সমীকরণ বিবেচনা x˙(t)=f(x(t),u(t))x˙(t)=f(x(t),u(t))\begin{align} \dot x(t)=f(x(t),u(t)) \end{align} যেখানে xxx রাষ্ট্র নেই এবং uuu নিয়ন্ত্রণ পরিবর্তনশীল। সমাধানটি x(t)=x0+∫t0f(x(s),u(s))ds.x(t)=x0+∫0tf(x(s),u(s))ds.\begin{align} x(t)=x_0 + \int^t_0f(x(s),u(s))ds. \end{align} যেখানে x0:=x(0)x0:=x(0)x_0:=x(0) হল প্রদত্ত মূল অবস্থা। এখন নিম্নলিখিত প্রোগ্রামাম বিবেচনা করুন s.t. V(x0):=maxu∫∞0e−ρtF(x(t),u(t))dtx˙(t)=f(x(t),u(t))x(0)=x0V(x0):=maxu∫0∞e−ρtF(x(t),u(t))dts.t. x˙(t)=f(x(t),u(t))x(0)=x0\begin{align} &V(x_0) := \max_u \int^\infty_0 e^{-\rho t}F(x(t),u(t))dt\\ s.t.~&\dot x(t)=f(x(t),u(t))\\ &x(0) = x_0 \end{align} যেখানেসময় পছন্দকে …

6
অবিচ্ছিন্ন-সময় গতিশীল প্রোগ্রামিং শিখার জন্য উল্লেখগুলি
অবিচ্ছিন্ন সময় গতিশীল প্রোগ্রামিং শেখার জন্য কেউ কি ভাল রেফারেন্স সম্পর্কে জানেন? তথ্যসূত্রগুলি বই হতে হবে না। তারা পাশাপাশি অনলাইন সংস্থানগুলির লিঙ্ক হতে পারে। এমনকি কেবলমাত্র বেসিকগুলির পরিষ্কার, সংক্ষিপ্ত আলোচনার লিঙ্কগুলি সহায়ক হবে।

1
অনুমান এবং যাচাই করুন
গতিশীল প্রোগ্রামিংয়ে, নির্ধারিত সহগগুলির পদ্ধতিটি কখনও কখনও "অনুমান এবং যাচাইকরণ" নামে পরিচিত। আমি পর্যায়ক্রমে শুনেছি এমন কোনও অনুমানক অনুমান করা যায় make বিশেষত, আমি দেখেছি ভী( কে ) = এ + বি এলএন( কে )ভী(ট)=একজন+ +বিLn⁡(ট)V(k) = A + B\ln(k) ভী( কে ) =বিট1 - σ1 - σভী(ট)=বিট1-σ1-σV(k) = \frac{Bk^{1-\sigma}}{1-\sigma} …

1
ননজারো যোগফল দুটি প্লেয়ার ডিফারেনটিভাল গেমের মান ফাংশন কীভাবে যাচাই করবেন?
দুটি এজেন্ট i=1,2i=1,2i=1,2 । রাজ্য τ i ∈ [ 0 , 1 ]kkk দ্বারা পরিচালিত যেখানে ˙ k = f ( কে , τ 1 , τ 2 ) ।τi∈[0,1]τi∈[0,1]\tau_i\in[0,1]k˙=f(k,τ1,τ2).k˙=f(k,τ1,τ2).\begin{align} \dot{k} = f(k,\tau_1,\tau_2). \end{align} iiivi(k):=supτi∫∞0e−ρtF(k,τi,σ−i)dt.vi(k):=supτi∫0∞e−ρtF(k,τi,σ−i)dt.\begin{align} v_i(k) := \sup_{\tau_i}\int^\infty_0{e^{-\rho t}F(k,\tau_i,\sigma_{-i})dt}. \end{align}σ−i(k)σ−i(k)\sigma_{-i}(k)−i−i-iρ>0ρ>0\rho>0 হ্যামিল্টন-জ্যাকোবি-বেলম্যান সমীকরণটি পড়ছে ρvi(k)=supτi{F(k,τi,σ−i)+v′(k)f(k,τi,σ−i)}.ρvi(k)=supτi{F(k,τi,σ−i)+v′(k)f(k,τi,σ−i)}.\begin{align} \rho v_i(k) = \sup_{\tau_i}\{F(k,\tau_i,\sigma_{-i}) + v'(k)f(k,\tau_i,\sigma_{-i})\}. …

0
ডায়নামিক প্রোগ্রামিংয়ের সমাধান (বেলম্যান সমীকরণ) সমস্যা
কেউ দয়া করে নীচের সমাধান কীভাবে পয়েন্টার সরবরাহ করতে পারেন? যদি কোনও তাত্ত্বিক অনুমানগুলি সম্ভব হয় তবে এটি খুব সহায়ক হবে। যদি সংখ্যাসূচক সমাধানগুলি সঠিক পদ্ধতির হয় তবে আপনি কী পরামর্শ দিতে পারবেন যে আমরা আর-এ এটি করতে পারি (সীমিত, আসলে শূন্য, তহবিলের কারণে ফ্রি সফ্টওয়্যারটিতে সীমাবদ্ধ; সুতরাং আর পয়েন্টারগুলি …
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.