দাবা ইঞ্জিন প্রোগ্রামিংয়ের বিকল্প পদ্ধতি


14

আমি যতদূর বুঝতে পারি, মোটামুটি কথা বলতে গেলে দাবা ইঞ্জিনগুলি এর দ্বারা কাজ করে:

  1. কিছু গভীরতা পর্যন্ত সমস্ত সম্ভাব্য প্রকরণ (গেম ট্রি) গণনা করা হচ্ছে
  2. কিছু মানদণ্ডের ভিত্তিতে চূড়ান্ত অবস্থানের মূল্যায়ন (উপাদান, টুকরো ক্রিয়াকলাপ ...)
  3. এই মূল্যায়নের ভিত্তিতে সেরা পদক্ষেপের সিদ্ধান্ত নিন

আমি পুরোপুরি বুঝতে পারি যে একটি দক্ষ ইঞ্জিনের জন্য নির্দিষ্ট লাইনগুলিকে ছাঁটাই করার উপায় রয়েছে, গভীরতা সীমাবদ্ধ করা ইত্যাদি; তবে এটি আমার প্রশ্ন নয়।

প্রশ্ন: এই প্রকল্পটি অনুসরণ করে না এমন একটি (প্রয়োজনীয় শক্তিশালী নয়, তবে এলোমেলোভাবে নয়) চেস ইঞ্জিন প্রোগ্রাম করার কোনও বিকল্প প্রচেষ্টা রয়েছে কি?


বোতভিনিক কম্পিউটার অনুসন্ধানের মাধ্যমে কেবলমাত্র সেরা প্রার্থীর পদক্ষেপ নিয়ে মূল গতিতে ছাঁটাই করতে চেষ্টা করেছিলেন। এটির একটি সফল প্রচেষ্টা হয়নি, এবং দাবা এটির পক্ষে আরও ভাল।
ফ্রেড নাইট

উত্তর:


13

কম্পিউটার দাবা শুরুর বছরগুলিতে, মানুষ প্রকৃতপক্ষে কম্পিউটার দাবা শেখাবার চেষ্টা করেছিল ঠিক যেমনভাবে তারা মানুষের সাথে হয়, যেমন একটি স্বাস্থ্যকর অদ্ভুত কাঠামো বা উদ্যোগের মতো কৌশলগত ধারণাটি ব্যাখ্যা করে। এই প্রচেষ্টা শীঘ্রই পরিত্যাগ করা হয়েছিল কারণ আপনি যে পদ্ধতিটি বর্ণনা করেছেন তা অনেক বেশি সফল হয়েছিল।

সম্প্রতি, ডিপ লার্নিং (সম্ভবত গুগলের গো এআই এর সাফল্য দ্বারা উত্সাহিত ) এর মাধ্যমে কোনও ইঞ্জিন নিজেকে দাবা শেখানোর সুযোগ দেওয়ার আরেকটি চেষ্টা করেছে । আমি নিবন্ধটি লিঙ্ক করেছি, তারা বেশ সফল এবং আইএম শক্তি পৌঁছাতে পরিচালিত ছিল।


1
আমার উপলব্ধি অনুসারে, আলফা গো ঠিক উল্লিখিত ওপি'র মতোই কাজ করে এবং কেবলমাত্র ডিপ লার্নিংয়ের মাধ্যমে তৈরি (2) এর evভাল ফাংশন। অন্য উত্তর কৃপা-সম্মত বলে মনে হচ্ছে।
হারমান ডাপ্পেস

According to the article I linked to, they were quite successful and managed to reach IM strengthতবে আপনি যদি মূল কাগজটি পড়েন তবে দেখবেন যে নিবন্ধটি সাফল্যটিকে অত্যন্ত অতিরঞ্জিত করেছে।
সালভাদোর ডালি

1
@ হারমানডাপ্পস নো, আলফাগো মন্টে-কার্লো গাছ অনুসন্ধানের উপর ভিত্তি করে।
হ্যালো ওয়ার্ল্ড

3

@ গ্লোরিফাইন্ডেল ভুল নয় তবে দাবাতে গভীর শিক্ষার পদ্ধতিটি দাবা প্রোগ্রামিংয়ে প্যারামিটার সুরের জন্য সত্যই অভিনব একটি শব্দ।

গভীর পড়াশোনা একটি দাবা ইঞ্জিনকে একটি মূল্যায়ন ফাংশন শিখতে দেয় যা সাধারণত প্রোগ্রামার দ্বারা রচিত কিছু। একটি গেমের সময়, এটি একটি সাধারণ দাবা ইঞ্জিনের মতো কাজ করে।

অন্যান্য সম্ভাবনার:

  • জিপিইউ দাবা প্রোগ্রামিং
  • মন্টে-কার্লো গাছের সন্ধান

আপনার উত্তরটির বেশিরভাগটি [গ্লোরিফিন্ডেলের উত্তর] এর অধীনে একটি মন্তব্য হওয়া উচিত ( চেস.সটাকেক্সচেঞ্জ / এ / 16293/2789প্রশ্নটি আসলে যে অংশটি সম্বোধন করেছে, কেবলমাত্র সাতটি শব্দ নিয়ে গঠিত, যা উত্তরের পক্ষে প্রায় যথেষ্ট নয়। এছাড়াও , "জিপিইউ দাবা প্রোগ্রামিং" আপনি যে কোনও অ্যালগরিদমকে অন্যথায় ব্যবহার করতে পারছেন তা কেবল সমান্তরাল করার একটি উপায়, সুতরাং আমি মনে করি না যে প্রশ্নটি যে অর্থে খুঁজছেন তা আসলেই এটি একটি "পদ্ধতির"; বরং এটি কেবল একটি বাস্তবায়ন পদ্ধতি।
ডেভিড রিচার্বি

-2

অবশ্যই! যদি আপনি সত্যিকার অর্থেই .... "তত্ত্ব অনুসারে, দাবা ইঞ্জিন কোড করার জন্য অন্য পদ্ধতি আছে কি?" ... তাহলে, হ্যাঁ !!

উদাহরণস্বরূপ .... কেউ দাবাতে প্রতিটি সম্ভাব্য অবস্থানের একটি অনুলিপি সঞ্চয় করতে পারে (একটি বিশাল সংখ্যা, আমি জানি), এবং প্রতিটিটির জন্য একটি মূল্যায়ন থাকতে পারে। তারপরে, এটি প্রদত্ত যে কোনও প্রশ্নের উত্তর (যেমন, "এক্স পজিশনে হোয়াইটের জন্য সেরা পদক্ষেপ"), কেবলমাত্র সেই বোর্ডটি সন্ধান করেই জানা যাবে। কম্পিউটারের হার্ডওয়্যারটির বর্তমান অবস্থা কি এটি বোঝাতে পারে? নাহ। কিন্তু আপনি এটি জিজ্ঞাসা করেন নি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.