যেহেতু একটি উপযুক্ত লক্ষ্য-অবস্থান নির্দিষ্ট করে দেওয়া অনেক পরিস্থিতিতে জটিল হতে পারে, তাই 2 ডি অধিগ্রহণ গ্রিড-মানচিত্রের ভিত্তিতে নিম্নলিখিত পদ্ধতির বিষয়টি বিবেচনার জন্য উপযুক্ত হতে পারে। এটিকে সাধারণত "মান পুনরাবৃত্তি" হিসাবে উল্লেখ করা হয় এবং গ্রেডিয়েন্ট-ডেসেন্ট / অ্যাসেন্টের সাথে মিলিত হয়ে এটি একটি সাধারণ এবং মোটামুটি দক্ষ (বাস্তবায়নের উপর নির্ভর করে) পাথ-পরিকল্পনা অ্যালগরিদম দেয়। এর সরলতার কারণে, এটি মোবাইল রোবোটিক্সে সুপরিচিত, বিশেষত "সরল রোবট" অভ্যন্তরীণ পরিবেশে নেভিগেট করার জন্য। উপরে বর্ণিত হিসাবে, এই পদ্ধতিটি নীচের হিসাবে স্পষ্টভাবে কোনও লক্ষ্য-অবস্থান নির্দিষ্ট করে না দিয়ে শুরু-অবস্থান থেকে দূরে কোনও পথ সন্ধানের একটি উপায় সরবরাহ করে। নোট করুন যে কোনও লক্ষ্য-অবস্থানটি উপলভ্য থাকলে allyচ্ছিকভাবে নির্দিষ্ট করা যেতে পারে। এছাড়াও, পদ্ধতির / অ্যালগরিদমটি প্রস্থের প্রথম সন্ধানকে গঠন করে,
বাইনারি ক্ষেত্রে, দখলযুক্ত গ্রিড-কোষের জন্য 2 ডি ওপেনসিভেশন গ্রিড-মানচিত্র একটি এবং অন্য কোথাও শূন্য। মনে রাখবেন যে এই দখল-মানটি [0,1] এর মধ্যেও ধারাবাহিক হতে পারে, আমি নীচে সেইটিতে ফিরে আসব। প্রদত্ত গ্রিড-সেল g i এর মান হ'ল ভি (g i ) ।
বেসিক সংস্করণ
- ধরে নিই যে গ্রিড-সেল g 0 এ স্টার্ট-পজিশন রয়েছে। সেট ভী (ছ 0 ) = 0 , এবং করা ছ 0 একটি FIFO-সারিতে।
- সারি থেকে পরবর্তী গ্রিড-সেল g i নিন ।
- সব প্রতিবেশীদের জন্য গ্রাম ঞ এর ছ আমি :
- যদি জি জে দখল না করে থাকে এবং আগে দেখা না হয়:
- ভি (জি জে ) = ভি (জি আই ) +1
- জি জেদর্শন করেছেন হিসাবে চিহ্নিত করুন ।
- ফিফো-সারিতে জি জে যুক্ত করুন ।
- যদি কোনও প্রদত্ত দূরত্বের চৌম্বকটি এখনও পৌঁছায় না, তবে (২) দিয়ে চালিয়ে যান, অন্যথায় (৫) দিয়ে চালিয়ে যান।
- জি 0 থেকে শুরু হওয়া সবচেয়ে খাড়া গ্রেডিয়েন্ট-অ্যাসেন্ট অনুসরণ করে পাথটি পাওয়া যায় ।
পদক্ষেপ 4 নোট।
- উপরে বর্ণিত হিসাবে, পদক্ষেপের (4.) সর্বোচ্চ আচ্ছাদিত দূরত্বের উপর নজর রাখতে হবে, যা স্পষ্টতা / সংক্ষিপ্ততার কারণে উপরের বর্ণনায় বাদ দেওয়া হয়েছে।
- যদি কোনও লক্ষ্য-অবস্থান দেওয়া হয়, লক্ষ্য-অবস্থানটি পৌঁছানোর সাথে সাথে পুনরাবৃত্তিটি বন্ধ হয়ে যায়, অর্থাত প্রক্রিয়া করা / পর্যায়ের অংশ হিসাবে পরিদর্শন করা (৩)।
- অবশ্যই, সম্পূর্ণ গ্রিড-মানচিত্রটি সহজেই প্রক্রিয়া করা সম্ভব, অর্থাত্ সমস্ত (ফ্রি) গ্রিড-সেলগুলি প্রক্রিয়া করা / পরিদর্শন না করা অবধি অবিরত রাখা। সীমিতকরণের কারণটি স্পষ্টতই এর রেজোলিউশনের সাথে মিলিতভাবে গ্রিড-মানচিত্রের আকার।
এক্সটেনশন এবং আরও মন্তব্য
আপডেট-সমীকরণ ভি (জি জে ) = ভি (জি আই ) +1 ডাউন-স্কেলিং ভি (জি জ ) এর মাধ্যমে সমস্ত ধরণের অতিরিক্ত হিউরিস্টিক্স প্রয়োগ করতে প্রচুর জায়গা ফেলেছেবা নির্দিষ্ট পথ-বিকল্পগুলির মান হ্রাস করার জন্য অ্যাডিটিভ উপাদান। বেশিরভাগ, সমস্ত না হলেও, এই পরিবর্তনগুলি [0,1] থেকে অবিচ্ছিন্ন মান সহ একটি গ্রিড-মানচিত্র ব্যবহার করে সুন্দরভাবে এবং সাধারণভাবে সংহত করা যেতে পারে, যা কার্যকরভাবে প্রাথমিক, বাইনারি গ্রিড-মানচিত্রের প্রাক প্রসেসিং পদক্ষেপ গঠন করে। উদাহরণস্বরূপ, বাধা সীমানা বরাবর 1 থেকে 0 এ রূপান্তর যুক্ত করার ফলে "অভিনেতা" বাধা থেকে পরিষ্কার থাকতে পারে clean এই জাতীয় গ্রিড-মানচিত্র, উদাহরণস্বরূপ, বাইনারি সংস্করণ থেকে ঝাপসা, ভারাক্রান্ত প্রসারণ বা অনুরূপ দ্বারা তৈরি করা যেতে পারে। বড় ঝাপসা ব্যাসার্ধের সাথে বাধা হিসাবে হুমকি এবং শত্রুদের যুক্ত করা, এগুলির নিকটে আসা পথগুলিকে শাস্তি দেয়। সামগ্রিকভাবে গ্রিড-মানচিত্রে এর মতো একটি প্রসারণ-প্রক্রিয়াও ব্যবহার করা যায়:
ভি (জি জে ) = (1 / (এন + 1)) × [ভি (জি জে ) + সম (ভি (জি আই ))]
যেখানে " যোগফল " সমস্ত প্রতিবেশী গ্রিড-কোষের যোগফলকে বোঝায়। উদাহরণস্বরূপ, বাইনারি মানচিত্র তৈরির পরিবর্তে প্রাথমিক (পূর্ণসংখ্যা) মানগুলি হুমকির পরিমাণের সাথে সমানুপাতিক হতে পারে এবং বাধাগুলি "ছোট" হুমকির উপস্থিতি হতে পারে। প্রসারণ-প্রক্রিয়া প্রয়োগ করার পরে, গ্রিড-মানগুলি অবশ্যই [0,1], এবং বাধা, হুমকি এবং শত্রুদের দ্বারা অধিষ্ঠিত কোষগুলিকে সেট / বাধ্যতামূলক করা উচিত ১। অন্যথায় আপডেট-সমীকরণের স্কেলিং হতে পারে পছন্দসই হিসাবে কাজ না।
এই সাধারণ স্কিম / পদ্ধতির বিভিন্ন বৈচিত্র রয়েছে। বাধা ইত্যাদির মতো ছোট মান থাকতে পারে, তবে নিখরচায় গ্রিড-কোষের বড় মান থাকতে পারে, যা লক্ষ্য অনুসারে শেষ ধাপে গ্রেডিয়েন্ট-ডেসেন্টের প্রয়োজন হতে পারে। যে কোনও ক্ষেত্রে, আইএমএইচও, আশ্চর্যজনকভাবে বহুমুখী, বাস্তবায়নের পক্ষে মোটামুটি সহজ, এবং সম্ভাব্য বরং দ্রুত (গ্রিড-মানচিত্র-আকার / রেজোলিউশনের বিষয়) is অবশেষে, অনেকগুলি পথ-পরিকল্পনা অ্যালগরিদমগুলির সাথে যেমন একটি নির্দিষ্ট লক্ষ্য-অবস্থান ধরে না, মৃত প্রান্তগুলিতে আটকে যাওয়ার স্পষ্ট ঝুঁকি রয়েছে। কিছুটা হলেও, এই ঝুঁকি হ্রাস করার জন্য শেষ পদক্ষেপের আগে ডেডিকেটেড পোস্ট-প্রসেসিং পদক্ষেপগুলি প্রয়োগ করা সম্ভব হতে পারে।
জাভা স্ক্রিপ্ট (?) এর একটি চিত্রের সাথে এখানে আরও একটি সংক্ষিপ্ত বিবরণ দেওয়া হচ্ছে, যদিও চিত্রটি আমার ব্রাউজারটির সাথে কাজ করে না :(
http://www.cs.ubc.ca/~poole/demos/mdp/vi.html
পরিকল্পনা সম্পর্কিত প্রচুর আরও বিস্তারিত নীচের বইটিতে পাওয়া যাবে। মান পুনরাবৃত্তিটি অধ্যায় ২, বিভাগ ২.৩.১-এ সুনির্দিষ্টভাবে নির্দিষ্ট স্থির-দৈর্ঘ্যের পরিকল্পনাগুলিতে আলোচনা করা হয়েছে।
http://planning.cs.uiuc.edu/
আশা করি যে সাহায্য করবে, আন্তরিক শুভেচ্ছা, ডেরিক।