মন্টি কার্লো ট্রি অনুসন্ধান: কোন ধরণের পদক্ষেপগুলি সহজেই পাওয়া যায় এবং কোন ধরণের সমস্যা তৈরি করে?


10

আমি এমন একটি দৃশ্য দিয়ে শুরু করতে চাই যা এমসিটিএস কতটা ভাল পারফর্ম করতে পারে তা নিয়ে আমাকে ভাবতে পেরেছিল: আসুন ধরে নেওয়া যাক যে এমন একটি পদক্ষেপ রয়েছে যা অনুসন্ধানের গাছটিতে এখনও যোগ করা হয়নি। এটি কিছু স্তর / খুব চলাচল করে। তবে আমরা যদি এই পদক্ষেপটি খেলি তবে গেমটি মূলত জয়ী। তবে আসুন আমরা ধরে নিই যে প্রদত্ত গেমের স্থলে পরিবর্তিত সমস্ত পদক্ষেপগুলি খুব খারাপ। তর্কের পক্ষে বলা যাক যে 1000 টি সম্ভাব্য পদক্ষেপ রয়েছে এবং তার মধ্যে একটি মাত্র ভাল (তবে খুব ভাল) এবং বাকিটি খুব খারাপ। এমসিটিএস এটি সনাক্ত করতে এবং না বুঝতে ব্যর্থ হবে নাঅনুসন্ধানের গাছটি এই পদক্ষেপের দিকে বাড়বে এবং এই সাবট্রিটিকে খুব খারাপভাবে রেট করবে? আমি জানি যে এমসিটিএস শেষ পর্যন্ত মিনিম্যাক্সে রূপান্তরিত হয় (এবং পর্যাপ্ত স্মৃতি থাকলে শেষ পর্যন্ত এটি পুরো গাছটি তৈরি করবে)। তারপরে এটি জানা উচিত যে অনেকগুলি খারাপ সম্ভাবনা থাকা সত্ত্বেও এই পদক্ষেপটি ভাল। তবে অনুমান করে আমি অনুমান করি যে এটি এমন কোনও বিষয় নয় যেটিতে কেউ নির্ভর করতে পারেন। এটি আমার পক্ষে সঠিক মূল্যায়ন হলে কেউ আমাকে বলতে পারে।

এই বিশেষ পরিস্থিতিটি ছাড়াও আমি আরও জানতে চাই যে এমসিটিএস খারাপ (বা অসাধারণ ভাল) পারফরম্যান্স করবে এমন আরও কিছু পরিস্থিতি আছে কিনা।


এমসিটিএস সম্ভাব্য। এর মতো এর জন্য ক্লু দরকার বা এটি কিছুই খুঁজে পাবে না। উদাহরণস্বরূপ: খড়ের খড়ের মধ্যে সুইয়ের সন্ধান করা। এটি চেষ্টা করুন এবং আপনি ব্যর্থ হবে। আপনি যদি আরও বাস্তববাদী উদাহরণ নিয়ে আসতে পারেন এবং সেই উদাহরণটির সর্বোত্তম কৌশল কী হবে তা জিজ্ঞাসা করা ভাল হবে It এটি খড়ের খাঁজে সূঁচগুলি কীভাবে আরও ভালভাবে খুঁজে পাবে তার একটি ইঙ্গিত দিতে পারে।
Trilarion

উত্তর:


2

সরানো সন্ধান পাওয়া যায় এবং কী দ্রুত তা পাওয়া যায় তা কয়েকটি বিষয়ের উপর নির্ভর করে। যদি আমি সঠিকভাবে বুঝতে পারি তবে অনেকগুলি "খারাপ" পদক্ষেপের ক্রম রয়েছে যা "বিগ জয়" পদক্ষেপের দিকে পরিচালিত করে এবং আপনি আশঙ্কা করছেন যে এমসিটিএস অ্যালগরিদম "বিগ জয়" পদক্ষেপে না পাবে কারণ এটি আরও আশাব্যঞ্জক নির্বাচন করবে গাছ আরও উপরে সরানো। কিছু ভাবার বিষয় (উইকিপিডিয়া এমসিটিএস নিবন্ধটিও পড়ুন ):

  • প্লেআউটগুলি করার সময়, আপনি আপনার গেমটি আরও কয়েকটি চালনার জন্য বা গেমের শেষের দিকে যেতে পারেন। আরও কয়েকটি চাল চালানো স্পষ্টতই দ্রুত, তবে আপনি যে চরম ক্ষেত্রে বর্ণনা করেছেন এটি সেরা পছন্দ নয়। আপনি যদি এই জাতীয় দৃশ্যের অস্তিত্ব সম্পর্কে জানেন তবে প্লেআউটগুলিতে শেষ পর্যন্ত গেমটি খেলতে ভুলবেন না।

  • প্লেআউটগুলি করার সময়, আপনি আপনার চালচলন / ক্রিয়াগুলি এলোমেলোভাবে বা আপনার সমস্যার জন্য উপযুক্ত কিছু সাধারণ, লোভী (দ্রুত) হিউরিস্টিকের ভিত্তিতে বেছে নিতে পারেন। আপনার খেলা / সমস্যার জন্য এই জাতীয় পরিস্থিতিগুলি সন্ধান করতে বা এটি বিবেচনার জন্য ডিজাইন করা লোভী হিউরিস্টিক্সগুলি কী আছে? যদি হ্যাঁ, এগুলি বাস্তবায়ন করুন। এরপরে একে "ভারী প্লেআউট" বলা হয়। এলোমেলো চালগুলি ব্যবহার করে ফলাফলগুলি প্লেআউটগুলির সাথে তুলনা করুন।

  • আপনি যদি ইউসিটি ব্যবহার করে ক্রিয়াগুলি বেছে নেন (উপরের আত্মবিশ্বাসের সীমা গাছগুলিতে প্রয়োগ করা হয়) তবে এক্সপ্রেশনটির প্রথম অংশটি শোষণের জন্য দায়ী। উচ্চ গড় উইন রেশিও সহ চালগুলি পছন্দ করা হয়। দ্বিতীয় অংশটি যদিও অনুসন্ধানের সাথে সম্পর্কিত। যদি এক্সপ্লোরেশন প্যারামিটারটি যথেষ্ট পরিমাণে সেট করা থাকে (আপনার সমস্যার জন্য পরীক্ষামূলকভাবে পরীক্ষা করা হয়), তবে কয়েকটি সিমুলেশন দিয়ে চালগুলি পছন্দ করা হবে। উচ্চ অন্বেষণ হ'ল শোষণের ক্ষয়ক্ষতিতে (সন্ধান / শোষণের দ্বিধা সম্পর্কে পড়ুন) আপনার সোনার পদক্ষেপটি খুঁজে পাওয়ার অন্য উপায়।

আপনি যদি কোনও বাস্তববাদী খেলা বা সমস্যার দৃশ্যের বিবরণ দেন তবে আমরা আপনাকে উপযুক্ত কৌশল নিয়ে আসতে সহায়তা করতে পারি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.