এন-সশস্ত্র ডাকাত সমস্যা সমাধানের জন্য অনুকূল অ্যালগরিদম?


13

আমি এন সশস্ত্র ডাকাত সমস্যা সমাধানের জন্য আলগোরিদিম একটি সংখ্যা সম্পর্কে পড়েছি -greedy, softmax এবং UCB1, কিন্তু আমি কিছু কষ্ট কি পদ্ধতির খেদ কমানোর জন্য সবচেয়ে ভাল হয় মাধ্যমে বাছাই হচ্ছে।ε

এন-সশস্ত্র ডাকাত সমস্যা সমাধানের জন্য কি কোনও সর্বোত্তম অ্যালগরিদম রয়েছে? অনুশীলনে সেরা অভিনয় বলে মনে হচ্ছে এমন কোনও অ্যালগরিদমের কোনও পছন্দ আছে কি?


সম্ভবত কোনও স্বীকৃত সর্বোত্তম সমাধান নেই, অন্যথায় উইকিপিডিয়া পৃষ্ঠাটি এটি বলত এবং পরীক্ষামূলক সোর্সফোজের পৃষ্ঠাটি
হেনরি

এটি তাত্ত্বিক কম্পিউটার বিজ্ঞান এসই তে থাকা উচিত নয়?

1
@ এমবিকিউ যেহেতু রিইনফোর্সমেন্ট লার্নিং মেশিন লার্নিংয়ের একটি শাখা, আমি তা মনে করি না;)
স্টিফেন

@ স্টেফেন শিওর, নামটি "tcsy" বলে মনে হয়েছিল।

@mbq- আমি এটি পেলাম না। "Tscy" এর অর্থ কী?
স্টিফেন

উত্তর:


9

আমি সম্প্রতি পাওয়া দুটি জরিপ কাগজপত্র এখানে। আমি সেগুলি এখনও পড়িনি, তবে বিমূর্তগুলি আশাব্যঞ্জক।

জোয়ানেস ভারমোরেল এবং মেহরিয়ার মোহরী: মাল্টি-সশস্ত্র ডাকাত অ্যালগরিদম এবং অভিজ্ঞতা অভিজ্ঞতা (2005)

বিমূর্ত থেকে:

জুয়াড়কের জন্য বহু-সশস্ত্র ডাকাত সমস্যাটি সিদ্ধান্ত নেওয়া হয় যে কে-স্লট মেশিনের কোন বাহুটি ট্রায়ালের একটি সিরিজে তার মোট পুরষ্কারকে সর্বাধিক করে তোলার জন্য টানতে হবে। অনেক রিয়েল-ওয়ার্ল্ড লার্নিং এবং অপ্টিমাইজেশান সমস্যাগুলি এভাবে মডেল করা যায়। গত দু' দশকে এই সমস্যার সমাধান হিসাবে বেশ কয়েকটি কৌশল বা অ্যালগরিদম প্রস্তাব করা হয়েছিল, তবে আমাদের জ্ঞানের কাছে এই অ্যালগোরিদমের কোনও সাধারণ মূল্যায়ন হয়নি।

ভোলোডাইমার কুলেশভ এবং ডোনা প্রিকআপ: মাল্টি-সশস্ত্র ডাকাত সমস্যার জন্য অ্যালগরিদম (2000) বিমূর্ত থেকে:

দ্বিতীয়ত, বেশিরভাগ অ্যালগরিদমের পারফরম্যান্স দস্যু সমস্যার পরামিতিগুলির সাথে নাটকীয়ভাবে পরিবর্তিত হয়। আমাদের অধ্যয়ন শনাক্তকরণ - প্রতিটি অ্যালগরিদম সেটিংস যেখানে এটি ভাল সঞ্চালন করে এবং সেটিংস যেখানে এটি খারাপভাবে সম্পাদন করে for

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.