এমন কোনও দাবা ইঞ্জিন রয়েছে যা নিষ্ঠুর-সন্ধান অনুসন্ধান ব্যবহার করে না?


10

প্রত্যেকটি দাবা ইঞ্জিন যাঁর সম্পর্কে আমি শুনেছি (উইকিপিডিয়ায় তালিকাভুক্ত সমস্তই আমি পেয়েছি) তার পদক্ষেপের সিদ্ধান্ত নেওয়ার জন্য মূল্যায়ন ফাংশন (মিনম্যাক্স অ্যালগরিদম) সহ ব্রুট-ফোর্স অনুসন্ধান ব্যবহার করে।

বেশিরভাগ মানুষ গেমটির কাছে এইভাবে আসে না, পরিবর্তে সাধারণ প্যাটার্ন স্বীকৃতি নিয়োগ করে, তাই নীতিগতভাবে, কম্পিউটারগুলির পক্ষে এটি করা সম্ভব হবে।

এমন কোন দাবা ইঞ্জিন রয়েছে যেটি তার চালগুলি খুঁজে পেতে ব্রুট-ফোর্সের পদ্ধতির উপর নির্ভর করে না?


9
ম্যাগনাস কার্লসেন। ;)
ওয়েস

3
যে লোকেরা বলে যে আধুনিক ইঞ্জিনগুলি ন্যায্য শক্তি নয় কারণ তারা চলাচলের ছাঁটাই করে ... আমার মনে হয় এটি অত্যন্ত স্পষ্ট যে যখন একটি দাবা ইঞ্জিন দশ লক্ষ লক্ষ অবস্থানের মূল্যায়ন করে, এটি ভ্রুকে নির্বিশেষে যে কোনও ভ্রুকে আঁকতে পারে তা নিষ্ঠুর শক্তি ব্যবহার করছে might অ্যালগরিদম উপর।
টনি এনিস

আধুনিক ইঞ্জিনগুলি চলনগুলি মিস করতে পারে, যেমন। বলিদানগুলি যেখানে বেতনটি যথেষ্ট গভীর হয় না। আমি মনে করি এটি সম্ভবত কারণ এগুলি ছাঁটাই করা হয় এবং গভীরভাবে পরীক্ষা করা হয় না।
একটি পথচারী

উত্তর:


6

1980 এর দশকে আবার জ্ঞানের ভিত্তি সহ দাবা ইঞ্জিনগুলি লেখার চেষ্টা করা হয়েছিল যা মানুষের মতো প্রার্থী পদক্ষেপগুলি বেছে নিতে পারে, তবে তারা ব্যর্থ হয়েছিল। সমস্যাটি হ'ল মানুষের প্যাটার্ন মিলানো শব্দগুলিতে বলা শক্ত, তাই জ্ঞানের ভিত্তির জন্য নিয়ম তৈরি করা অত্যন্ত কঠিন ছিল।

প্রার্থী পদক্ষেপগুলি বাছতে একটি নিউরাল নেটওয়ার্ক প্রশিক্ষণ দেওয়া গবেষণার প্রতিশ্রুতিবদ্ধ রেখার মতো বলে মনে হচ্ছে। এখানে এবং এখানে দুটি প্রাসঙ্গিক কাগজ হতে পারে। (এফডাব্লুআইডাব্লু, এটি কমপ সায়েন্সের ক্ষেত্র নয়)


5

আপনি জিরাফের দিকে একবার নজর দিতে পারেন যা সম্প্রতি খবরে প্রকাশিত হয়েছিল:

https://thestack.com/iot/2015/09/14/neural-network-chess-computer-abandons-brute-force-for-selective-human-approach/

হাইপটি হল যে 3 দিনের মধ্যে এটি নিজেকে গেমটি শিখিয়েছিল এবং আইএম স্তরে পৌঁছেছে। অন্যদিকে গবেষণা চলছে

http://arxiv.org/abs/1509.01549


ঠিক সত্য নয় ... আমার উত্তর দেখুন।
স্মার্টচিস

3

আমি জিরাফের উপর @ ইয়ান_ বুশের উত্তরে বিশদ যুক্ত করতে চাই।

@ ইয়ান_ বুশের উত্তরে, এটি উল্লেখ করা হয়েছে যে জিরাফ নিষ্ঠুর-শক্তি গণনা ব্যবহার করে না। এটি ঠিক নয় , কারণ জিরাফ এখনও একটি আলফা-বিটা (নেগা-ম্যাক্স) ইঞ্জিন। শুধুমাত্র একটি প্রমিত ইঞ্জিন পার্থক্য হল যে মূল্যায়ন ফাংশন গভীর শেখার দ্বারা স্বয়ংক্রিয়ভাবে টিউন করা হয়। অতএব, ইঞ্জিন নিজে থেকে কীভাবে খেলতে শিখবে।

Ditionতিহ্যগতভাবে, ইঞ্জিনে ইঞ্জিন প্রোগ্রামার স্ব-সুরের পরামিতি। আমি নিজে অনেক কিছু করেছি। উদাহরণস্বরূপ, বিশপ এবং একটি নাইটকে আপনার কতটা ওজন দেওয়া উচিত? 3.0? 3.1? 3.2? এটা বলা শক্ত।

জিরাফ সমস্যাটিকে অনেক বেশি স্মার্টভাবে দেখায়। এটি কিছু প্রাথমিক মান দিয়ে শুরু হয়। ইঞ্জিনগুলি সেই মানগুলি টিউন করতে গ্রেডিয়েন্ট অ্যাসেন্ট অ্যালগরিদম ব্যবহার করে। কোডটিতে রানীর কত ওজন হওয়া উচিত তা আমাদের স্পষ্টভাবে কোড করতে হবে না। এটি আমরা "শেখার" অর্থ। এটা তোলে মানে এই নয় যে ইঞ্জিন দাবা খেলতে পারেন ছাড়া অনুসন্ধান।

সম্পাদনা : জিরাফ গাছের নোডগুলিকে সম্ভাব্যতা হিসাবে মডেল করে যে তারা মূল বৈচিত্রের মধ্যে পড়ে। বিশদ জন্য কাগজ পরীক্ষা করুন। আমি ব্যক্তিগতভাবে এই পদ্ধতিকে বিশ্বাস করি না, এবং কাগজটি এটি কতটা কার্যকর হবে তার সামান্য প্রমাণ দেখায়।


এটা কি সত্য যে জিরাফ স্টকফিশকে লক্ষ্য হিসাবে ব্যবহার করে? যদি তা হয় তবে এটি নিজের দ্বারা "দাবা শেখা" হয় না, এটি বোর্ডের বৈশিষ্ট্যগুলির শীর্ষে একটি নেট ব্যবহার করে স্টকফিশের সাথে একটি সন্নিকট শিখায়।
ফার্নান্দো

আমার বিশ্বাস, স্টারফিশের সাথে ফার্নান্দো জিরাফের কোনও যোগসূত্র নেই, আমি বিশ্বাস করি।
স্মলচেস

আমি পুরো কাগজটি পড়ব, তবে 18 পৃষ্ঠায় এটি বলেছে: We evaluated board representations by training neural networks to predict the output of Stock- fish’s evaluation function in a supervised fashion, given 5 million positions as input, in the board representation under evaluation. সুতরাং, এটি সেলফ্লে আইএমও দ্বারা শিখছে না।
ফার্নান্দো

1

যদি আপনি কোনও হিউরিস্টিক ভিত্তিক অনুসন্ধানকে কল করতে পারেন এবং দৃষ্টিভঙ্গিটিকে ব্রুট-ফোর্স হিসাবে মূল্যায়ন করতে পারেন তবে এর ধরণের বিতর্কযোগ্য। শীর্ষস্থানীয় দাবা ইঞ্জিনগুলির বেশিরভাগ আজ অবস্থানের মূল্যায়ন করতে নিয়ম-ভিত্তিক পদ্ধতির অনুসরণ করে এবং চলাফেরার জন্য নিয়ম ভিত্তিক অনুসন্ধান ফাংশন অনুসরণ করে।

এটি আসলে "গ্লোবাল অনুকূল" পদক্ষেপটি বাছাই করার নিশ্চয়তা দেয় না, তবে এই পদক্ষেপগুলি উদ্দেশ্য জন্য যথেষ্ট ভাল। এই অর্থে বেশিরভাগ দাবা ইঞ্জিনগুলি বৈশ্বিক অনুকূলতমের উপর একটি সান্নিধ্য ব্যবহার করছে এবং বাস্তবে তা পাচ্ছে।

আজ অবধি, আমাদের অনেকগুলি দাবা ইঞ্জিন শীর্ষ স্তরে কোনও ভিন্ন পদ্ধতির সাহায্যে সফল হয় নি, কমপক্ষে সস্তা হার্ডওয়্যারগুলিতে নয়।


0

ক্লড শ্যানন দাবা ইঞ্জিন তৈরির জন্য দুই ধরণের অ্যালগরিদম প্রস্তাব করেছিলেন। একটি "টাইপ এ" ইঞ্জিনটি কিছু সীমাবদ্ধ গভীরতার সমস্ত সম্ভাব্য পদক্ষেপগুলি পরীক্ষা করে, গাছকে মিনিম্যাক্স করে এবং তারপরে মিনিম্যাক্সেসড ট্রি (ওরফে ব্রুট ফোর্স) থেকে সর্বোচ্চ মূল্যায়নের সাথে এই পদক্ষেপটি খেলায়। টাইপ বি ইঞ্জিনগুলি তাদের অনুসন্ধানকে কিছু মানদণ্ডের ভিত্তিতে কেবল সম্ভাব্য চালগুলির একটি উপসেটে সীমাবদ্ধ করে। আমি বিশ্বাস করি যে তিনি টাইপ বিকে আরও প্রতিশ্রুতিবদ্ধ হিসাবে পছন্দ করেছেন।

১৯ 1970০-এর দশকে (যেমন হিচেক, কায়সা) যে ইঞ্জিনগুলি তৈরি হয়েছিল তা কোনও ছাঁটাই বা কেবল আলফা-বিটা ছাড়াই খাঁটি উদ্দীপনা হিসাবে দেখত, তবে লোকেরা শীঘ্রই চাল এবং রেখার গাছের ছাঁটাইয়ের মূল্য দেখতে পেল যা দৃ prove় প্রমাণিত হওয়ার সম্ভাবনা ছিল না। । প্রায় সমস্ত সাম্প্রতিক ইঞ্জিনগুলি লাইন গাছগুলিকে ছাঁটাই করে দেয় যা স্পষ্টভাবে দুর্বল (আলফা-বিটা) হয় এবং বেশিরভাগ ইঞ্জিন বিভিন্ন ধরণের ফরোয়ার্ড ছাঁটাইও ব্যবহার করে (নিরর্থকতা, দেরী পদক্ষেপ হ্রাস, নাল মুভ, রেজারিং)। সেই অর্থে, এমন অনেক ইঞ্জিন নেই যা খাঁটি ব্রুট ফোর্স ব্যবহার করে।

১৯ 1970০-এর দশকে, বোতভিনিক আক্রমণাত্মক পথের ধারণাটি সম্পর্কে ধারণা পোষণ করেছিলেন এমন একটি ইঞ্জিনে কাজ করছিলেন যা মূল্যায়ন পরিচালিত হত। এটি কখনই এমন পর্যায়ে পৌঁছায়নি যেখানে এটি দাবা পুরো খেলা খেলতে পারে।

১৯৯০-এর দশকে, ক্রিস উইটিংটন আরও দাবা জ্ঞানকে অন্তর্ভুক্ত করার পক্ষে কথা বলেছিলেন এবং দাবা সিস্টেম তাল নামে একটি প্রোগ্রাম তৈরি করেছিলেন যা তার সময়ের জন্য যথেষ্ট শক্তিশালী ছিল।

কাস্পারভ, আনন্দ এবং টর্ড রোমস্টাড সকলেই উল্লেখ করেছেন যে হাইকার্সের শীর্ষস্থানীয় ইঞ্জিনগুলির মধ্যে অনেকের তুলনায় আরও বিশদ মূল্যায়ন রয়েছে বলে মনে হচ্ছে যাদের দ্রুত অনুসন্ধান থেকে আসে।


-2

মূলত এরা সবাই!

দাবা ইঞ্জিনগুলি সত্যই কেবল নিষ্ঠুর-শক্তি ব্যবহার করে যখন:

  • বলা
  • অবস্থান বিশ্লেষণ করছে (সমস্যা সমাধান)
  • চেকমেট খুঁজছেন (সমস্যা সমাধানের বিরুদ্ধে খেলছেন না, যেমন "এন মধ্যে সাথীকে খুঁজে পান" শৈলীর সমস্যার সমাধান করুন)

অন্যথায় তাদের একটি "নির্বাচনী অনুসন্ধান" রয়েছে, এটি প্রদত্ত বোর্ডের বিন্যাসের জন্য সমস্ত সম্ভাব্য পদক্ষেপ বিবেচনা করবে, তবে কেবলমাত্র তাদের মধ্যে কয়েকটি মুছে ফেলা হবে। যদি একটি ইঞ্জিন দুটি একই পদক্ষেপ খুব একইভাবে হারায় (একাধিক শক্তিশালী পদক্ষেপ) বা যদি এটি পছন্দ করে না এমন চলন খুঁজে না পায় তবে (শক্তিশালী কোনও চলন নেই) তবে তা প্রাণবন্ত-শক্তিতে স্যুইচ করতে পারে।

তারা প্রতিরক্ষা একটি সর্বশেষ লাইন হিসাবে নিষ্ঠুর-জোর প্রবণতাও দেখায়, যদি আপনি চেকমেট সম্ভাবনা দেখে থাকেন তবে এটি এটি দেখতে পাবে এবং এটি আঁকতে সত্যিই চেষ্টা করতে চাইবে, এবং কোনও উপায় খুঁজে পাবে না ("দিগন্ত প্রভাব) "ইঞ্জিনগুলির সাথে সমস্যা, ধরুন এটি রানীটি looseিলে করতে চলেছে, এবং এটি কেবল 4 টি নাটক গভীরভাবে যেতে সক্ষম হয়েছে; যদি এটি পদ্মাগুলি ব্যবসা করতে পারে এবং 4 টি চালের জন্য রানীর ক্ষতি স্থগিত করতে পারে তবে তারা ভাববে যে এটি রানিকে বাঁচিয়েছে? , প্রক্রিয়াটিতে এটি কমপক্ষে 1 প্যাড শিথিল হয়ে যাবে (পরবর্তী পদক্ষেপটি দিগন্তটি কাছাকাছি আসার আগে থেকে আসে) এবং রানিকে বাঁচাতে যে ওজন রাখে তার অর্থ এটি কোনও প্রতিরক্ষা বলিদান করতে পারে, কারণ মৃত্যু যদি দিগন্তের উপরে চলে যায় তবে কিছুই নয়) ।

নির্বাচনী অনুসন্ধান খুব কার্যকর না হলে এটি জঞ্জাল শক্তি প্রয়োগ করবে। এ কারণেই ইঞ্জিনগুলিতে 3 টি টুকরো যেমন বাকী থাকে তখন বেশি সময় নেয়। তাদের প্রাণঘাতী হতে হবে কারণ নির্বাচন অ্যালগরিদম কোনও পদক্ষেপের রেট দিতে পারে না। মিডগ্যামের সময় বাছাই অ্যালগরিদম দুর্দান্ত কারণ এটি "ওহহর মতো হতে পারে, পদ্ম দিয়ে এটি করা তার [যাই হোক না কেন] এবং আমার [যাই হোক না কেন] এবং [যা কিছু] সমর্থন করে যা আক্রমণ করার চেয়ে আমার চেয়ে কম সংখ্যক" - উদাহরণস্বরূপ ।

বোর্ডের মাঝামাঝিতে যদি আপনার রাজা থাকে তবে সেখানে 8 টি পদক্ষেপ রয়েছে, নির্বাচনী অনুসন্ধানটি "এর মধ্যে কোনওটিই কার্যকর কিছু করেন না, আমি বলতে পারি না") এর মতো হবে।

আপনি দুইটি অংশ হিসাবে নির্বাচনী অনুসন্ধানের কথা ভাবতে পারেন, এটি কৌশলগত দিক থেকে এটি কৌশলগত পদক্ষেপগুলি চেষ্টা করার চেষ্টা করবে এবং এটি সাধারণত জড়িত টুকরাগুলির ওজনকে উপেক্ষা করবে কারণ কোনও কৌশলের একটি অংশ নয় রানী মূল্যহীন নয় এটির জন্য প্রাণবন্ত এক মুহুর্তের চেয়েও বেশি। এটি কৌশলগতও কারণ এটি কোনও প্রতিরক্ষা জোরদার পদক্ষেপগুলি সন্ধান করতে এবং পরে সম্ভাব্য আক্রমণগুলির জন্য উন্মুক্ত করে।

ইঞ্জিনটি তখন আপনার দৃষ্টিকোণ থেকে একই কাজ করে এবং পিছনে এবং পিছনে এবং পিছনে।

ট্রান্সপজিশন টেবিল নামে পরিচিত এমন কিছু জিনিস যা সে সম্পর্কে ভেবেছিল সেগুলির একটি বৃহত তালিকা, এটি যদি ইতিমধ্যে এটি করা কিছু বিবেচনা করে শেষ হয় তবে এটি জানে এবং এটির পুনরায় মূল্যায়ন করতে হবে না।

নিঃশব্দ (নির্বাচনী :)) এটি সেখানে অন্যভাবে পৌঁছেছে, বা আরও অন্বেষণ করতে চায়। ধরুন উদাহরণস্বরূপ এটি আবিষ্কার করে যে আপনার ... রুক আসন্ন আক্রমণের জন্য অপরিহার্য, ইঞ্জিনটি যখন কোনও লাইন এটি আবিষ্কার করে তখন এটি পুনরায় মূল্যায়ন করতে পারে। পূর্বের ওজনটি সেই রোকটির উপরে রাখে (উদাহরণস্বরূপ 5 পয়েন্ট, এটি আপনার পক্ষে কতটা গুরুত্বপূর্ণ) একটি অনূর্ধ্ব-অনুমান হতে পারে।

বাছাই করা অনুসন্ধানটি ব্যাকট্র্যাকও করতে পারে, যেমন কোনও বিশপকে শত্রু অঞ্চলে ডানদিকে নিয়ে যাওয়া বিবেচনা করে, সরানো নির্বাচককে এটি গুরুত্বপূর্ণ নয় যে এটি সহজে নেওয়া যেতে পারে। বলুন যে এটি আবিষ্কার করে যে কৌশলগতভাবে এটি একটি দুর্দান্ত চাল! এরপরে সেই বিশপটিকে সেখানে পাওয়ার জন্য সেই বর্গক্ষেত্রটি সুরক্ষার জন্য কোনও উপায় খুঁজে বের করার চেষ্টা করতে এবং পিছনে ফিরে যেতে পারে। মনে করুন এটি করার জন্য একটি মহিমা জড়িত।

ব্রুট-ফোর্স পদ্ধতিটি সেই প্যাঁচা চালকে জড়িত রেখাটি বিবেচনা করবে এবং (ব্রুট ফোর্স দ্বারা) বিশপটিও খুব সরানো হবে এবং বোর্ডের অবস্থানের (রেফারেক্টিং সার্চ নিজেই) রেট দেওয়া একই জিনিসগুলি "এটি ভাল" তাই বোর্ড বলবে হার যে বৈচিত্র্য উচ্চ, উভয় এটি খুঁজে।

ব্রুট-ফোর্স পদ্ধতিটি ব্যবহার করে কোনও অবস্থান নির্ধারণ করা খুব কঠিন, এজন্যই বেছে বেছে অনুসন্ধানগুলি এত ভাল কাজ করে।

প্রারম্ভিক অবস্থান থেকে নিষ্ঠুর শক্তি সম্ভবত বিশিষ্ট সাথ-ইন -4 খুঁজে পেতে পারে যে কোনও বিশিষ্ট দ্বারা আবৃত একটি রানী f7 জড়িত রয়েছে এবং যদি এটির উচ্চমানের হারটি হয় (আমি একটি চেকমেটকে খুঁজে পেয়েছি! জব ডোন! প্লে!) এটি 'ভুল হবে কারণ কালো অবশ্যই উল্টে দেবে। নির্বাচিত অনুসন্ধানে কোনও অবস্থানকে রেট দেয় (আরও মূল্যায়নের জন্য) কারণ এটি ভাল বলে মনে হচ্ছে । এর অর্থ এটি যখন আপনার প্রতিক্রিয়া বিবেচনা করছে তখন সিদ্ধান্ত নিতে পারে আপনার পক্ষে ভাল কি হবে ....

সুতরাং যে জিনিসগুলি নির্বাচনী অনুসন্ধান জিনিসগুলি রেট দেওয়ার জন্য ব্যবহার করে তা হ'ল ব্রুট-ফোর্স দ্বারা ব্যবহৃত হয় কারণ "এই পদক্ষেপের সাথে জড়িত একটি চেকমেট পাওয়া গেছে" যে সরানো ভাল তা বলার পক্ষে যথেষ্ট নয়।

সুতরাং ব্রুট ফোর্স দাবা ইঞ্জিন দ্বারা নির্বাচিত প্রথম পদক্ষেপগুলি (হোয়াইট) কী কী?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.