এমসিটিএস / ইউসিটি-র অ্যাপ্লিকেশন


10

এমসিটিএস / ইউসিটি হ'ল একটি গেম ট্রি ট্রিটিং পদ্ধতি যা অন্বেষণের জন্য আশাব্যঞ্জক নোডগুলি নির্বাচন করতে ডাকাত অ্যালগরিদম ব্যবহার করে। গেমগুলি এলোমেলোভাবে তাদের সমাপ্তিতে খেলা হয় এবং আরও জয়ের দিকে পরিচালিত নোডগুলি আরও বেশি অনুসন্ধান করা হয়। ডাকাত অ্যালগরিদম উচ্চ জয়ের হারের সাথে নোডগুলি অন্বেষণ এবং অজানা নোডগুলি অন্বেষণের মধ্যে একটি ভারসাম্য বজায় রাখে (এবং এর শুদ্ধ আকারে অগত্যা একটি হিউরিস্টিক মূল্যায়ন ফাংশন ব্যবহার করে না)। এই সাধারণ প্রযুক্তির উপর ভিত্তি করে প্রোগ্রামগুলি কম্পিউটার গোতে বেশ আশ্চর্যজনক ফলাফল অর্জন করেছে ।

ডাকাত চালিত মন্টে-কার্লো অনুসন্ধানগুলি কি অন্য কোনও অনুসন্ধানের সমস্যার জন্য প্রয়োগ করা হয়েছে? উদাহরণস্বরূপ, এটি ম্যাক্স-স্যাট, বিকেপি, বা অন্যান্য সংযুক্তি অপ্টিমাইজেশন সমস্যার প্রায় সমাধান সমাধানে একটি দরকারী পদ্ধতির হতে পারে? কোনও সমস্যা (কাঠামোগত / পরিসংখ্যান / ইত্যাদি) এর কোনও বিশেষ বৈশিষ্ট্য রয়েছে যা পরামর্শ দেয় যে দস্যু-শৈলীর পদ্ধতি কার্যকর হবে কিনা?

সমাধান স্থানের প্রকৃতির কারণে এমন কোনও ডায়রিমিনিস্টিক সমস্যা রয়েছে যা পুরোপুরি ডাকাত পদ্ধতির বিরুদ্ধে প্রতিরোধী হবে?

উত্তর:


7

এটি সম্পূর্ণ উত্তর নয়, তবে এটি ম্যাক্স-স্যাট প্রয়োগের বিষয়ে কিছু প্রাথমিক পর্যবেক্ষণ।

একটি উচ্চ স্তরে, দেখে মনে হচ্ছে এই হিউরিস্টিক পদ্ধতির (যখন ম্যাক্স-স্যাট প্রয়োগ করা হবে) "শর্তাধীন প্রত্যাশা" পদ্ধতির উপর ভিত্তি করে একটি ব্রাঞ্চিং অ্যালগরিদমের সাথে অনুরূপ হবে যা ডেরানডমাইজেশনের একটি মানক পদ্ধতি। উদাহরণস্বরূপ, ম্যাক্স 3-স্যাট (প্রতি ধারাটিতে 3 ভেরিয়েবল সহ) এর জন্য একটি নির্ধারক -প্রক্রোক্সেশন পেতে , একটি ভেরিয়েবল নির্ধারণ করে, অনুমানের প্রত্যাশিত ভগ্নাংশটি অনুমান করে যা বাকী অংশে এলোমেলো কার্য দ্বারা সন্তুষ্ট হবে সূত্র, তারপরে সেট করে এবং একই গণনা করে। (এটি "এলোমেলোভাবে সমাপ্তির জন্য একটি গেম খেলার" সাথে চূড়ান্ত অনুরূপ)) ক্লজগুলির উচ্চতর প্রত্যাশিত ভগ্নাংশ ( বা ) সহ পরিবর্তনশীল সেটিংটি চয়ন করা হবে। এই বহুপদী সময় অ্যালগোরিদম একটি দেয়7/8এক্স=0এক্স=1এক্স=0এক্স=17/8 -প্রসূচনা এবং এটি শক্ত হিসাবে পরিচিত (আপনি এটির ক্লজগুলির কেবলমাত্র সন্তুষ্ট করতে বোকা বানাতে পারেন )। এই সংযোগের মাধ্যমে এই তাত্ত্বিকের দক্ষতার কম সীমা প্রমাণ করা সম্ভব হওয়া উচিত।7/8

জানা যায় MAX টি 3-স্যাট বেশী ভালো approximating হয় , -hard তাই আমরা একটি দক্ষ অনুসন্ধানমূলক এই বেশী ভালো করতে আশা করবেন না। এটা তোলে দেখানোর জন্য আকর্ষণীয় হবে (এবং আমি অনুমান এটা সত্য) যে একটি শাখাবিন্যাস উপরে পরিবর্তনশীল পছন্দ অনুসন্ধানমূলক উপর ভিত্তি করে অ্যালগরিদম একটি উন্নততর-than- এটি ব্যাখ্যা মূলকভাবে অনেক পদক্ষেপ প্রয়োজন পড়তা। ব্যাকট্র্যাকিংয়ের ইতিমধ্যে নিম্ন সীমানা রয়েছে যা বলে যে আপনি যতই বৌদ্ধিক ব্যবহার করেন তা বিবেচনাধীন নয় , এমনকি আপনি যদি পুরোপুরি অনুমান করেন তবে এখনও অসন্তুষ্টিজনক সূত্র রয়েছে যার জন্য ব্যাকট্র্যাকিং কেবলমাত্র সিদ্ধান্ত নেবে যে তারা তাত্পর্যপূর্ণভাবে অনেক পদক্ষেপের পরে অসন্তুষ্টিজনক। রেজোলিউশন প্রমাণগুলির দৈর্ঘ্যের উপর নিম্ন সীমানা এই ফলাফলগুলি দেয়। একটি উল্লেখ হল:7/8এনপি7/8

পাভেল পুদলেক, রাসেল ইম্পাগলিয়াজো: কে-স্যাট (প্রাথমিক সংস্করণ) এর জন্য ডিএলএল অ্যালগরিদমগুলির জন্য একটি নিম্ন সীমা। সোডা 2000: 128-136


3

বৈশিষ্ট্যগুলি কীভাবে ডাকাত-ভিত্তিক পদ্ধতির জন্য সমস্যাটিকে সমস্যাযুক্ত করে তোলে তা এই প্রশ্নে, এই কাগজটি বিভিন্ন সন্ধানের জায়গাগুলিতে ইউসিটির আচরণ বর্ণনা করে:

http://www.cs.cornell.edu/~raghu/Raghuram_Ramanujan_files/mcts11.pdf

শুভেচ্ছা, ক্যামেরন


2

সাম্প্রতিক এই জরিপ গবেষণাপত্রটি এমসিটিএসের প্রয়োগগুলি গেম ব্যতীত অনুসন্ধান এবং অপ্টিমাইজেশান সমস্যাগুলি সম্পর্কিত আরও কয়েকটি বিভাগে তালিকাভুক্ত করে Section.৮ বিভাগে:

http://pubs.doc.ic.ac.uk/survey-mcts-methods/survey-mcts-methods.pdf

http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=6145622

দস্যু-ভিত্তিক পদ্ধতিগুলির সাথে সম্পূর্ণ প্রতিরোধী ডোমেনগুলি সম্পর্কে, আমি কোনও অফ-হ্যান্ড সম্পর্কে অবগত নই। দাবা এমসিটিএস সাহিত্যের এক স্পষ্টতামূলক বাদ দেওয়া, সম্ভবত অনুসন্ধানে ক্ষতিগ্রস্থ "ট্র্যাপ স্টেটস" এর কারণে, তবে সম্ভবত কম্পিউটার দাবা খেলোয়াড়রা এই মুহুর্তে কেবলমাত্র অত্যন্ত উচ্চতর অনুকূল এবং ভাল যে কারণে কোনও নতুন পদ্ধতির সম্ভাবনা নেই to তাদের উপর একটি গর্ত।

শুভেচ্ছা, ক্যামেরন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.