দাবা জন্য একটি নিখুঁত অ্যালগরিদম আছে? [বন্ধ]


109

দাবা কম্পিউটারের সম্ভাবনা নিয়ে আমি সম্প্রতি একটি কোডারহীন ব্যক্তির সাথে আলোচনায় এসেছি। আমি তত্ত্ব সম্পর্কে ভাল পারদর্শী নই, তবে মনে করি আমি যথেষ্ট জানি।

আমি যুক্তি দিয়েছিলাম যে এখানে কোনও ডিস্ট্রিমেন্টিক ট্যুরিং মেশিন থাকতে পারে না যা দাবাতে সর্বদা জিতে বা অচল হয়ে পড়ে। আমি মনে করি যে, আপনি প্লেয়ার 1/2 পদক্ষেপের সমস্ত সংমিশ্রণের পুরো স্থান অনুসন্ধান করলেও কম্পিউটার প্রতিটি পদক্ষেপে সিদ্ধান্ত নেয় এমন একক পদক্ষেপ একটি হিউরিস্টিকের উপর ভিত্তি করে। একটি হিউরিস্টিকের উপর ভিত্তি করে, এটি প্রতিদ্বন্দ্বী যে সমস্ত পদক্ষেপগুলি করতে পারে তা অগত্যা পরাস্ত করে না।

আমার বন্ধুটি এর বিপরীতে ভেবেছিল যে কোনও কম্পিউটার যদি কোনও "ভুল" পদক্ষেপ না নেয় তবে সর্বদা জয়ী বা টাই হয়ে যাবে (তবে আপনি কী এটি সংজ্ঞায়িত করেন?)। তবে, একজন প্রোগ্রামার যিনি সিএস নিয়েছেন, আমি জানি যে এমনকি আপনার ভাল পছন্দগুলি - একজন বিজ্ঞ প্রতিপক্ষকে দেওয়া - আপনাকে শেষ পর্যন্ত "ভুল" পদক্ষেপ নিতে বাধ্য করতে পারে। এমনকি যদি আপনি সমস্ত কিছু জানেন, তবে আপনার পরবর্তী পদক্ষেপটি হিউরিস্টিকের সাথে মিলে লোভী।

বেশিরভাগ দাবা কম্পিউটার গেমের সাথে একটি সম্ভাব্য শেষ গেমটি অগ্রগতিতে মিলানোর চেষ্টা করে, যা মূলত একটি গতিশীল প্রোগ্রামিং ট্র্যাকব্যাক। আবার, প্রশ্নে এন্ডগেমটি যদিও এড়ানো যায়।

সম্পাদনা: হুম ... দেখে মনে হচ্ছে আমি এখানে কিছু পালক ছড়িয়েছি। এটা ভালো.

এটি আবার চিন্তা করে মনে হচ্ছে, দাবার মতো সীমাবদ্ধ খেলাটি সমাধান করার মতো কোনও তাত্ত্বিক সমস্যা নেই। আমি যুক্তি দিয়ে বলব যে দাবাড়ি চেকারদের চেয়ে কিছুটা জটিল যে জয়ের টুকরো সংখ্যার পরিশ্রমের দ্বারা নয়, বরং সাথীর দ্বারা হয়। আমার আসল দৃ probably় বক্তব্য সম্ভবত ভুল, তবে আবার আমি মনে করি আমি এমন কিছু নির্দিষ্ট করেছিলাম যা এখনও সন্তোষজনকভাবে প্রমাণিত হয়নি (আনুষ্ঠানিকভাবে)।

আমার ধারণাটি অনুমান করা হয়েছিল যে যখনই গাছের কোন শাখা নেওয়া হয়, তখন অবশ্যই অ্যালগরিদম (বা মুখস্ত পথগুলি) প্রতিপক্ষের কোনও সম্ভাব্য শাখার জন্য সঙ্গমের (সঙ্গম না করে) অবশ্যই একটি পথ খুঁজে পেতে পারে। আলোচনার পরে, আমরা সম্ভবত এটির স্বপ্ন দেখতে পারি তার চেয়ে বেশি মেমরি দেওয়া কিনে দেব, এই সমস্ত পথ খুঁজে পাওয়া যাবে।


1
+1: দুর্দান্ত বিষয়। তবে আমি ভাবব যে উত্তরগুলির বিভিন্নতা এবং ভলিউম দ্বারা এটি প্রদর্শিত উইকি ফাইড হওয়া উচিত।
আইএবস্ট্রাক্ট

1
"মনে করুন আমি এমন কিছু নির্দেশ করেছি যা এখনও সন্তুষ্টভাবে প্রমাণিত হয়নি"? আনুষ্ঠানিকভাবে প্রমাণিত হয় না আপনি কি চিহ্নিত করেছেন?
এস .লট

2
স্বীকারোক্তি করুন! এই জাতীয় কালো এবং সাদা প্রশ্নের 20 টির উত্তর কীভাবে থাকতে পারে! (কোন পাং উদ্দেশ্য)।
পিটার পুনরায় পুনরুদ্ধার

5
আমিও তাদের সংখ্যা সম্পর্কে অবাক হয়েছি যারা তাদের অনুমানমূলক উত্তর পোস্ট করে জেনেও জানে না যে উত্তরটি আসলে গাণিতিকভাবে নির্ধারিত হয়েছে - উত্তরটি এমন অর্থে যে প্রমাণিত হয়েছে যে দাবাড়ির একটি সমাধান রয়েছে - এটি গণনা করা কেবল ব্যবহারিক নয়।
ডিজেক্লেওয়ার্থ

3
পারফেক্ট দাবা বাজানো কম্পিউটার সম্পর্কে আমাকে কৌতুকের কথা মনে করিয়ে দেয়। সাদা খেলে, এটি চিন্তা করে এবং চিন্তা করে এবং তারপরে .... পদত্যাগ করে!

উত্তর:


104

"আমি যুক্তি দিয়েছিলাম যে দাবাতে সবসময় জিতে বা অচল হয়ে পড়ে এমন একটি নির্বাহী টুরিং মেশিনের অস্তিত্ব থাকতে পারে না।"

আপনি একদম ঠিক নেই এমন একটি মেশিন থাকতে পারে। বিষয়টি হ'ল রাষ্ট্রের জায়গার বিশালতা যা এটি অনুসন্ধান করতে হবে। এটা তোলে সসীম, এটি শুধু প্রকৃতই বড়।

এই কারণেই দাবা হিউরিস্টিক্সের পিছনে পড়ে - রাষ্ট্রের স্থানটি বিশাল (তবে সীমাবদ্ধ)। এমনকি গণনা করা - প্রতিটি সম্ভাব্য গেমের প্রতিটি কোর্স ধরে প্রতিটি নিখুঁত পদক্ষেপের জন্য খুব কম অনুসন্ধান - এটি একটি খুব, খুব বড় অনুসন্ধান সমস্যা হবে।

আপনাকে মধ্যম খেলায় নিয়ে যাওয়ার জন্য খোলার স্ক্রিপ্ট করা হয় যা আপনাকে একটি "শক্তিশালী" অবস্থান দেয়। একটি পরিচিত ফলাফল নয়। এমনকি শেষ গেমস - যখন কম টুকরো থাকে - সেরা পরবর্তী স্থানান্তর নির্ধারণের জন্য গণনা করা শক্ত। প্রযুক্তিগতভাবে তারা সীমাবদ্ধ। তবে বিকল্পের সংখ্যা বিশাল। এমনকি একটি 2 পল্লব + রাজা এর 22 টি পরবর্তী চলনগুলির মতো কিছু রয়েছে। এবং যদি এটি সাথিতে 6 টি পদক্ষেপ নেয় তবে আপনি 12,855,002,631,049,216 পদক্ষেপে খুঁজছেন।

খোলার পদক্ষেপে গণিত করুন। যেখানে প্রায় 20 টি উদ্বোধনী চলন রয়েছে সেখানে 30 বা ততোধিক দ্বিতীয় চাল হিসাবে কিছু রয়েছে, তাই তৃতীয় পদক্ষেপের মাধ্যমে আমরা 360,000 বিকল্প গেমের অবস্থার দিকে তাকিয়ে আছি।

তবে দাবা খেলাগুলি (প্রযুক্তিগতভাবে) সসীম হয়। বিশাল, কিন্তু সসীম নিখুঁত তথ্য আছে। এখানে সংজ্ঞা দেওয়া শুরু এবং শেষের রাজ্য রয়েছে, কোনও মুদ্রা-টসস বা ডাইস রোল নেই।


22
6 টি টুকরা বা তার কম সংখ্যক সমস্ত এন্ডগেইমগুলি গণিত করে সমাধান করা হয়েছে। Tablebase দেখুন এবং এখানে bitbase: en.wikipedia.org/wiki/Tablebase । উদাহরণস্বরূপ, একটি কেকিউএনকেআরবিএন এন্ডগেম রয়েছে যেখানে সাথিকে জোর করার জন্য ৫১7 টি চালচলনের প্রয়োজন হয়! তবে দাবা খেলার মোট সংখ্যা প্রায় (10 ^ (10 ^ 50))।
এইচটিটিপি 410

2
জয়ের স্ক্রিপ্ট করা একটি জিনিস is অবসন্নভাবে গণনা করা আলাদা জিনিস। যে কোনও উপায়ে, তথ্য নিখুঁত - সমস্ত কিছু জানা - গেমটি সংজ্ঞা অনুসারে নির্বিচারক।
এস .লট

11
@ রওডওয়ারিওর: একমত নন। র্যান্ডম আবহাওয়ার ক্ষেত্রে প্রযোজ্য। Dশ্বর পাশা রোলস। সংজ্ঞা অনুসারে দাবাতে এলোমেলো প্রয়োগ হয় না। দাবা সম্পূর্ণ তথ্য আছে। আবহাওয়ার কোয়ান্টাম প্রভাব রয়েছে - এটি সম্পূর্ণ হতে পারে না।
এস .লট

3
আবহাওয়ার পূর্বাভাসের জন্য কী কঠিন করে তোলে তা হ'ল বিশৃঙ্খল অ-রৈখিক কারণ, কোনও কোয়ান্টাম প্রভাব নয়। যথেষ্ট কম্পিউটিং শক্তি এবং জ্ঞান দেওয়া, আমরা তাত্ত্বিকভাবে একটি "সঠিক" আবহাওয়ার পূর্বাভাস তৈরি করতে পারি।
এইচটিটিপি 410

3
@ মোমোজনহ্নি: বিধিগুলি একই পদের তিনটি পুনরাবৃত্তি নিষিদ্ধ করে। দাবা সহজ সীমাবদ্ধ। এটি বড় তবে সসীম
এস .লট

72

দাবা সম্পর্কে আসলে কী আবিষ্কার হয়েছিল সে সম্পর্কে আমি কিছুই জানিনা। তবে একজন গণিতবিদ হিসাবে আমার যুক্তি এখানে:

প্রথমে আমাদের অবশ্যই মনে রাখতে হবে যে হোয়াইট প্রথমে যেতে পারে এবং সম্ভবত এটি তাকে একটি সুবিধা দেয়; সম্ভবত এটি কালোকে একটি সুবিধা দেয়।

এখন ধরুন যে ব্ল্যাকের জন্য এমন কোনও নিখুঁত কৌশল নেই যা তাকে সর্বদা বিজয়ী / অচলাবস্থা দেয়। এ থেকে বোঝা যায় যে কালো যাই করুক না কেন, হোয়াইট জয়ের জন্য অনুসরণ করতে পারে এমন একটি কৌশল রয়েছে। এক মিনিট অপেক্ষা করুন - এর অর্থ হ'ল হোয়াইটের জন্য একটি নিখুঁত কৌশল রয়েছে!

এটি আমাদের বলে যে দুই খেলোয়াড়ের অন্তত একটি করে একটি নিখুঁত কৌশল যার খেলোয়াড় সবসময় জয় বা আঁকা দেয় যা আছে।

তখন কেবল তিনটি সম্ভাবনা রয়েছে:

  • সাদা পুরোপুরি খেললে সর্বদা জিততে পারে
  • তিনি পুরোপুরি খেললে কৃষ্ণ সর্বদা জিততে পারে
  • একজন খেলোয়াড় পুরোপুরি খেললে জিততে বা আঁকতে পারে (এবং যদি উভয় খেলোয়াড়ই নিখুঁতভাবে খেলেন তবে তারা সর্বদা অচল হয়ে পড়ে)

তবে এর মধ্যে কোনটি আসলে সঠিক, আমরা কখনই জানি না।

প্রশ্নের উত্তর হ্যাঁ : দাবা জন্য একটি নিখুঁত অ্যালগরিদম থাকতে হবে, কমপক্ষে দুটি খেলোয়াড়ের মধ্যে একটির জন্য for


2
+1, এটি ব্যাখ্যা করার এটি একটি দুর্দান্ত উপায়। আমি বিশ্বাস করতে পারি না যে আমি কখনই ভেবে দেখিনি!
জিফ্রে

2
কালো রঙের কোনও নিখুঁত কৌশল না থাকা কেন সাদা রঙের একটি নিখুঁত কৌশল রয়েছে তা বোঝায়? উভয় খেলোয়াড়ের কোনও নিখুঁত কৌশল নেই? যদি আপনার জড়িত হওয়া সত্য হয় তবে প্রতি 2 খেলোয়াড়ের গেমটি কি সত্য হবে না, অর্থাত প্রতিটি গেমের একটি নিখুঁত কৌশল আছে?
জন এম নাগলিক

8
@ জোহান: যেহেতু দাবাতে নিখুঁত তথ্য এবং কোনও এলোমেলো উপাদান নেই (অনেকগুলি, অন্যান্য 2-খেলোয়াড়ের অনেকগুলি গেমের বিপরীতে), কালোদের কোনও সঠিক কৌশলই সম্ভব না হওয়ার একমাত্র উপায় হ'ল যদি কোনও প্রচেষ্টা সত্ত্বেও সাদা কোনও জয়কে জোর করতে পারে কালো - অন্য কথায়, যদি সাদা জন্য একটি নিখুঁত কৌশল আছে।
ডেভ শেরোহমান

2
আসলে এই যুক্তিটি সর্বদা ধারণ করে না , তবে এই ক্ষেত্রে এটি কি সত্য?
ব্লুরাজা - ড্যানি প্লেফুঘুফুট

4
@ জোহান "এখানে এত আলোচনা কেন" - কারণ কিছু লোক উত্তর জানে না, তবুও এখানে পোস্ট করুন।
ডিজেক্লেওয়ার্থ

30

এটি চেকারদের গেমের জন্য প্রমাণিত হয়েছে যে কোনও প্রোগ্রাম সর্বদা গেমটি জিততে বা টাই করতে পারে। অর্থাত, কোনও খেলোয়াড় এমন চলাফেরার বিকল্প নেই যা অন্য খেলোয়াড়কে হারাতে বাধ্য করে।

গবেষকরা 500 বিলিয়ন বিলিয়ন সম্ভাব্য চেকার পজিশনের মধ্য দিয়ে কাটিয়ে প্রায় দুই দশক অতিবাহিত করেছেন , যা এখনও দাবা পজিশনের সংখ্যার একটি স্বল্প পরিসর। চেকারদের প্রচেষ্টায় শীর্ষস্থানীয় খেলোয়াড়দের অন্তর্ভুক্ত ছিল, যারা গবেষণামূলক দল প্রোগ্রামটিকে চেকারদের আঙ্গুলের নিয়মগুলিকে সফ্টওয়্যারটিতে সহায়তা করেছিল যা চালগুলি সফল বা ব্যর্থ হিসাবে শ্রেণীবদ্ধ করে। তারপরে গবেষকরা এই প্রোগ্রামটি চালাতে দিন, প্রতিদিন গড়ে 50 টি কম্পিউটার। কিছু দিন, প্রোগ্রামটি 200 মেশিনে চলেছিল। গবেষকরা অগ্রগতি পর্যবেক্ষণ করেছেন এবং সেই অনুযায়ী প্রোগ্রামটি টুইট করেছেন। আসলে, চিনুক ১৯৯৪ সালে চেকার্স বিশ্ব চ্যাম্পিয়নশিপ জিতে মানবকে পরাজিত করেছিলেন।

হ্যাঁ, আপনি দাবা সমাধান করতে পারেন, না, আপনি শীঘ্রই কোনও সময় পাবেন না।


6
"[ওয়াই] আপনি শীঘ্রই কোনও ওয়াই সময় করবেন না" এটি একটি স্বল্পমূল্য হিসাবে বিবেচিত। মহাবিশ্বের প্রত্যাশিত সময়সীমা সীমা ছাড়াও, আপনি একটি স্টোরেজ ইস্যু পেয়েছেন - দাবাতে রাজ্যের সংখ্যা চেকের 500 বিলিয়ন ডলার ছাড়িয়ে গেছে; প্রকৃতপক্ষে, এটি মহাবিশ্বের কণার সংখ্যা ছাড়িয়েছে।
মাইকেল ডারফম্যান

30
"[...] বাস্তবে, এটি মহাবিশ্বের কণার সংখ্যা ছাড়িয়েছে।" যতক্ষণ না এটি মহাবিশ্বে কণার রাজ্যের সংখ্যা অতিক্রম করে না, তবুও আশা রয়েছে ;-)
কার্স্টেন

1
যখন প্রোগ্রামটি সর্বদা প্রতিপক্ষকে হারাতে বাধ্য করে তখন কী ঘটে যখন নিজের বিরুদ্ধে খেলছে ????
জন দেমেট্রিও

1
@ বিবিএস হুম, যদি এমন কোনও পূর্বাভাস থাকে যেখানে আমি যদি দ্বিতীয় খেলোয়াড় হিসাবে খেলছি এবং অন্যজন যদি আমার মতো একই ধর্মতাত্ত্বিক ব্যবহার করে থাকে তবে জয়ের জন্য এই হিউরিস্টিক অনুসরণ করুন এবং যদি প্রথম খেলোয়াড়ের অনুরূপ হিউরিস্টিক থাকে ???? ?
জন দেমেট্রিও

1
আমি যা বলছি তা যদি একটি নিখুঁত অ্যালগরিদম হয় এবং উভয় খেলোয়াড়েরই এটির অনির্দিষ্ট সংখ্যক সম্ভাবনা থাকে যা অ্যালগরিদম এটি সঠিক হওয়ার জন্য পরিবর্তিত হতে পারে
জন ডেমেট্রিও

15

এটি কম্পিউটার সম্পর্কিত প্রশ্ন নয় কেবল দাবা খেলা।

প্রশ্নটি হ'ল, খেলাটি কখনই না হারাতে কোনও ব্যর্থ-নিরাপদ কৌশল রয়েছে? যদি এই জাতীয় কৌশলটি বিদ্যমান থাকে, তবে এমন কম্পিউটার যা সমস্ত কিছু জানে এটি সর্বদা এটি ব্যবহার করতে পারে এবং এটি আর আর কোনও হিউরিস্টিক নয়।

উদাহরণস্বরূপ, গেমটি টিক-টাক-টো সাধারণত হিউরিস্টিকের ভিত্তিতে খেলা হয়। তবে, একটি ব্যর্থ-নিরাপদ কৌশল রয়েছে। প্রতিপক্ষ যেভাবেই চলুক না কেন, আপনি সর্বদা খেলাটি হারাতে এড়ানোর কোনও উপায় খুঁজে পান, যদি আপনি এটি শুরু থেকে ঠিকঠাক করেন।

সুতরাং আপনাকে প্রমাণ করতে হবে যে দাবারের জন্যও এমন কৌশল বিদ্যমান বা না। এটি মূলত একই, কেবল সম্ভাব্য পদক্ষেপের স্থানটি অনেক বড়।


তাহলে, আমার উত্তরকে হ্রাস করার আহ্বান কার ছিল? এতে কিছু ভুল আছে? নিজেকে সামনে পেতে চান?
ypnos

@ আইপোনস, আমি আপনার উত্তরটি মোটেও কম দেইনি। আমি কেবল মন্তব্য করতে গিয়ে বলেছিলাম যে এলোমেলোভাবে ভোটাররা আপনাকে নামাবেন না। আপনি 30 জন প্রতিনিধি অর্জন করেছেন এবং কেবল 1 টি হারিয়েছেন Also এছাড়াও, +1;)
এমএমসিডোল

1
ডাউনভোটের বেশ কয়েকটি কারণ। 1) এটি জানা যায় যে গেমটি সমাধান করার জন্য একটি অ্যালগরিদম রয়েছে, এটি কেবল অ্যালগরিদম যে কোনও কল্পনাযোগ্য প্রযুক্তি ব্যবহার করে গণনা করা অবৈধ। 2) গেমটি সমাধান করা বোঝায় না যে তাদের উপস্থিতি একটি ব্যর্থ সাফ কৌশল রয়েছে। টিক-ট্যাক-টো সমাধান করা হয়েছে, তবে দ্বিতীয় প্লেয়ারের কোনও কৌশল নেই যা ক্ষতি এড়ায়।
ডিজেক্লেওয়ার্থ

2
"এটি কম্পিউটার নিয়ে প্রশ্ন নয়, কেবল দাবা খেলা।" ঠিক আছে, কম্পিউটার বিজ্ঞান আসলে কম্পিউটার সম্পর্কে নয়। তারা কেবল একটি হাতিয়ার। কম্পিউটার বিজ্ঞান কম্পিউটার ছাড়াই কাজ করে।
জানুস ট্রয়লসেন

1
এটি- আসলে কম্পিউটার সম্পর্কে একটি প্রশ্ন, কারণ প্রশ্নগুলি একটি টুরিং মেশিন (= কম্পিউটার) থাকতে পারে কিনা, যা দাবা সমাধান করে।
এসডওয়ারফস

14

আমি খুব দেরীতে এই থ্রেডে আসছি এবং আপনি ইতিমধ্যে কয়েকটি সমস্যা বুঝতে পেরেছেন। তবে প্রাক্তন মাস্টার এবং প্রাক্তন পেশাদার দাবা প্রোগ্রামার হিসাবে আমি ভেবেছিলাম যে আমি কয়েকটি দরকারী তথ্য এবং পরিসংখ্যান যুক্ত করতে পারি। দাবার জটিলতা পরিমাপের বিভিন্ন উপায় রয়েছে :

  • দাবা গেমের মোট সংখ্যা প্রায় 10 ^ (10 ^ 50)। এই সংখ্যাটি অভাবনীয়ভাবে বড়।
  • 40 টি চাল বা তার কম দাবা গেমের সংখ্যা 10 10 40 এর কাছাকাছি। এটি এখনও একটি অবিশ্বাস্যরকম বিশাল সংখ্যা।
  • সম্ভাব্য দাবা পদের সংখ্যা প্রায় 10 ^ 46।
  • গড় দাবা অনুসন্ধান গাছ (শ্যানন সংখ্যা) প্রায় 10 ^ 123, গড় 35 এর গড় শাখা ফ্যাক্টর এবং গড় গেম দৈর্ঘ্যের 80 এর উপর ভিত্তি করে।
  • তুলনা করার জন্য, পর্যবেক্ষণযোগ্য মহাবিশ্বে পরমাণুর সংখ্যা প্রায় 10 ^ 80 হিসাবে অনুমান করা হয়।
  • 6 টুকরা বা তারও কমের সমস্ত এন্ডগেইমগুলি কোলাটেড এবং সমাধান করা হয়েছে ।

আমার উপসংহার: যদিও দাবা তাত্ত্বিকভাবে সমাধানযোগ্য, তবুও আমাদের কাছে কখনও অর্থ, অনুপ্রেরণা, কম্পিউটিং শক্তি বা সঞ্চয়স্থান থাকবে না।


3
এসো। সমস্যাটি আপনাকে অন্যভাবে ভাবতে হবে। গেমসের সংখ্যা সম্পর্কে চিন্তা করবেন না, কারণ স্থানান্তর এবং আলফা-বিটা অ্যালগরিদম এবং এর ফলে খুব ব্যয় হয়। বোর্ডের অবস্থানগুলি (10 ^ 60) বা দাবা টুকরো (100 মিলিয়ন) এর সংমিশ্রণের কথা চিন্তা করুন। কোয়ান্টাম কম্পিউটিংয়ের সাথে এটি তুচ্ছ।
lkessler

2
এই প্রসঙ্গে আলফা-বিটা (দাবা সমাধানের জন্য) একটি নিখুঁত মূল্যায়ন ফাংশন প্রয়োজন। বোর্ডের অবস্থান এবং টুকরো সংমিশ্রণগুলিও তাই করে। আমাদের একটি নিখুঁত মূল্যায়ন ফাংশন নেই, সুতরাং কোয়ান্টাম কম্পিউটিং আমাদের সহায়তা করে না।
এইচটিটিপি 410

1
যে কোনও সময় আমি মনে করি যে কিছু "তুচ্ছ", এবং আমি নিশ্চিত যে এরই মধ্যে কেউ এটিকে করেনি, আমিও নিশ্চিত যে আমি কমপক্ষে একবারও ভুল করেছি।
ডিন জে

2
@ এলকেসেলার: বোর্ডের অবস্থানগুলি পুরো গল্পটি বলে না। কাস্টলিং বা এন পাসেন্ট ক্যাপচারগুলির জন্য ক্যাপচার বা পদ্ম পদক্ষেপের অভাবের কারণে এবং পুনরাবৃত্তির মাধ্যমে অঙ্কনের পুরো ইতিহাসের জন্য কমপক্ষে গেমের কিছু ইতিহাস প্রয়োজন। অধিকন্তু, যেহেতু এটি কোয়ান্টাম কম্পিউটারের জন্য 15 এর ফ্যাক্টর করার জন্য সম্প্রতি একটি উল্লেখযোগ্য গবেষণার ফলাফল ছিল, আমি এখনই কোয়ান্টাম কম্পিউটিংয়ের সাথে কিছুই তুচ্ছ বলব না।
ডেভিড থর্নলি

2
এখানে তুলনা করার জন্য, আপনি যদি সমস্ত সম্ভাব্য দাবা অবস্থানগুলি তৈরি করতে পারেন তবে আপনি 128-বিট কী দিয়ে কোনও সাইফারকে তুচ্ছভাবে জোর করতে পারেন, যেহেতু 10 ^ 46 প্রায় 2 ^ 152 বা 2 ^ 153। মহাবিশ্বের উত্তাপের মৃত্যুর আগে এটি অসম্ভব বলে মনে করার দুর্দান্ত কারণ রয়েছে।
ডেভিড থর্নলি

9

কিছু গেমস বাস্তবে সমাধান হয়ে গেছে। টিক-ট্যাক-টো একটি খুব সহজেই যার জন্য এমন একটি এআই তৈরি করা যায় যা সর্বদা জিতবে বা টাই করবে। সম্প্রতি, সংযোগ 4 এরও সমাধান করা হয়েছে (এবং দ্বিতীয় খেলোয়াড়ের সাথে অন্যায় হিসাবে দেখানো হয়েছে, কারণ নিখুঁত নাটক তাকে হারাতে পারে)।

দাবা, তবে সমাধান করা হয়নি, এবং আমি মনে করি না যে এটি একটি নিখুঁত খেলা (যেমন, নিখুঁত খেলার ফলাফল ড্রয়ের ফলাফল কিনা) এর কোনও প্রমাণ নেই। তাত্ত্বিক দৃষ্টিকোণ থেকে কঠোরভাবে বলতে গেলে, দাবাতে সম্ভাব্য পিস কনফিগারেশনগুলির সীমাবদ্ধ সংখ্যা রয়েছে। অতএব, অনুসন্ধানের স্থান সীমাবদ্ধ (তবে, অবিশ্বাস্যভাবে বড়) large অতএব, নিখুঁতভাবে খেলতে পারে এমন একটি ডিস্ট্রিমেন্টিক ট্যুরিং মেশিন বিদ্যমান। যে কোনও একটি নির্মিত হতে পারে তা অবশ্য আলাদা বিষয়।


8

2040 সাল (5x10 ^ 20 গণনা) দ্বারা গড়ে $ 1000 ডেস্কটপ মাত্র 5 সেকেন্ডে চেকারদের সমাধান করতে সক্ষম হবে।

এমনকি এই গতিতে, দাবা সমাধানে এখনও এই কম্পিউটারগুলির মধ্যে 100 টি প্রায় 6.34 x 10 ^ 19 বছর লাগবে। এখনও সম্ভব না। কাছেও নয়।

2080 এর কাছাকাছি, আমাদের গড় ডেস্কটপগুলিতে প্রতি সেকেন্ডে প্রায় 10 ^ 45 গণনা থাকবে। একটি একক কম্পিউটারের প্রায় 27.7 ঘন্টা মধ্যে দাবা সমাধান করার জন্য গণনার শক্তি থাকবে। এটি ৩০৮০ সালের মধ্যে অবশ্যই করা হবে যতক্ষণ না কম্পিউটারে বিদ্যুৎ বাড়তে থাকে যতক্ষণ এর গত ৩০ বছর রয়েছে।

2090 সালের মধ্যে, প্রায় 1 সেকেন্ডের মধ্যে দাবা সমাধানের জন্য 1000 ডলার ডেস্কটপে যথেষ্ট পরিমাণ গণ্য শক্তি উপস্থিত থাকবে ... সুতরাং সেই তারিখের মধ্যে এটি সম্পূর্ণ তুচ্ছ হবে।

প্রদত্ত চেকারস 2007 সালে মীমাংসিত হয়, এবং 1 সেকেন্ডের মধ্যে তার সমাধানের কম্পিউটেশানাল শক্তির 33-35 বছর আগের মানুষ ধীরে ধীরে চলা, আমরা সম্ভবত যাবে মোটামুটিভাবে অনুমান দাবা 2055-2057 মধ্যে কোথাও সমাধান করা হবে। সম্ভবত যত বেশি সংখ্যক বিদ্যুৎ বিদ্যুৎ পাওয়া যায় (যে 45 বছরের মধ্যে এটি ঘটবে) তত দ্রুত এই প্রকল্পগুলির জন্য আরও বেশি উত্সর্গ করা যেতে পারে। তবে, আমি প্রথম দিকে 2050 এবং সর্বশেষে 2060 বলব would

2060 সালে, দাবা সমাধানে 100 গড় ডেস্কটপ সময় লাগবে 3.17 x 10 ^ 10 বছর। উপলব্ধি করুন যে আমি আমার বেঞ্চমার্ক হিসাবে একটি $ 1000 কম্পিউটার ব্যবহার করছি, যেখানে আরও বড় সিস্টেম এবং সুপার কম্পিউটারগুলি সম্ভবত তাদের প্রাইস / পারফরম্যান্স অনুপাতের উন্নতি হওয়ায় উপলব্ধ হবে। এছাড়াও, কম্পিউটেশনাল পাওয়ারের বিশালতার ক্রম তাদের দ্রুত গতিতে বৃদ্ধি পায়। একটি সুপার কম্পিউটার বিবেচনা করুন এখন প্রতি সেকেন্ডে 2.33 x 10 ^ 15 গণনা এবং 2 x 10 ^ 9 সম্পর্কে একটি 1000 ডলার কম্পিউটার করতে পারে। তুলনা করে, 10 বছর আগে পার্থক্য 10 ^ 6 এর পরিবর্তে 10 ^ 5 ছিল। 2060 এর মধ্যে প্রস্থের পার্থক্যের ক্রমটি সম্ভবত 10 ^ 12 হবে এবং এটি প্রত্যাশার চেয়েও দ্রুত বাড়তে পারে।

এর বেশিরভাগ নির্ভর করে আমাদের হিসাবে মানুষ হিসাবে দাবা সমাধানের চালনা আছে কি না, তবে গণনার শক্তি এটিকে প্রায় সময়টিকে সম্ভব করে তুলবে (যতক্ষণ না আমাদের গতি অব্যাহত থাকবে)।

অন্য নোটে, টিক-ট্যাক-টো-এর খেলাটি যা অনেক বেশি সহজ, এর সম্ভাব্য গণনাগুলি (একটি উন্মুক্ত বোর্ড সহ) 2,653,002 রয়েছে। প্রায় ২.৫ (প্রতি সেকেন্ডে 1 মিলিয়ন গণনা) সেকেন্ডে টিক-টাক-টো সমাধান করার গণ্য শক্তি 1990 সালে অর্জন হয়েছিল।

পিছনে সরানো, 1955 সালে, একটি কম্পিউটারের প্রায় 1 মাসে (প্রতি সেকেন্ডে 1 গণনা) টিকিট-টো সমাধান করার ক্ষমতা ছিল। আবার এটি নির্ভর করে আপনি যদি এটি কম্পিউটারে প্যাকেজ করতে পারতেন তবে 1000 ডলার আপনাকে কী পেতে পারে (1955 সালে স্পষ্টতই $ 1000 ডেস্কটপ উপস্থিত ছিল না), এবং এই কম্পিউটারটি টিক-ট্যাক-টো সমাধান করার জন্য উত্সর্গীকৃত হত .... যা ১৯৫৫-এ কেবল ঘটনাটি ছিল না Comp গণনা ব্যয়বহুল ছিল এবং এই উদ্দেশ্যে ব্যবহার করা হত না, যদিও আমি বিশ্বাস করি না যে এমন কোনও তারিখ রয়েছে যেখানে টিকি-টাক-টো কম্পিউটার দ্বারা "সমাধান" বলে বিবেচিত হয়েছিল, তবে আমি নিশ্চিত যে এটি প্রকৃত গণনার শক্তি থেকে পিছিয়ে আছে।

এছাড়াও, 45 বছরের মধ্যে 1000 ডলার গ্রহণ করুন এটি এখনকার চেয়ে 4 গুণ কম দামের হবে, তাই বেশি পরিমাণে অর্থ প্রকল্পের ক্ষেত্রে যেতে পারে যখন গণনা শক্তি আরও কমতে থাকবে।


9
"আপনি কি জানেন যে 1976 সালের শেষের দিকে ডিস্কো রেকর্ড বিক্রয় বিক্রি 400% বেড়েছে? যদি এই প্রবণতাগুলি অব্যাহত থাকে ... তবে আয়ে!" - ডিস্কো স্টু
জেরেমি ফ্রাইজনার

2
মুরের আইন - প্রতি 18 মাসে কম্পিউটারের শক্তি দ্বিগুণ হয় - 2015 এর প্রায়শই ব্যর্থ হওয়ার সম্ভাবনা রয়েছে Or বা কম্পিউটার প্রসেসরের নকশা একেবারে আলাদা হতে হবে। সুতরাং 2080 একটি বাস্তববাদী লক্ষ্য নয়।
ফিলিপ স্মিথ

3
@ ফিলিপ: ২০০৩ সাল থেকে ডেস্কটপ কম্পিউটারগুলির প্রসেসরের ঘড়ির গতি কেবল সামান্য বৃদ্ধি পেয়েছে, এবং তখন থেকে বর্ধিতকরণগুলি বেশিরভাগ ক্ষেত্রে ক্যাশে এবং একাধিক কোর বৃদ্ধি করা হয়েছে। যেহেতু 3 গিগাহার্টজ প্রসেসরের 4 ইঞ্চি / 10 সেন্টিমিটার হালকা আলো পড়ার সময় লাগে তার মধ্যে একটি ক্লকচক্র থাকে, তাই ঘড়ির গতি অনির্দিষ্টকালের জন্য বাড়ার আশা করা যায় না। তদুপরি, সমান্তরালতা সাধারণত শক্ত। সাত বছর আগে যখন এটি ভেঙে পড়া শুরু হয়েছিল তখন পঞ্চাশ বছর ধরে তাত্পর্যপূর্ণ বৃদ্ধি প্রকল্পটি নিরাপদ বাজি বলে মনে হয় না।
ডেভিড থর্নলি

1
@ ডেভিড - এটি সত্য। তবে পয়েন্টটি মিস করে। আপনি যদি চিপের উপরের উপাদানগুলির অর্ধেক আকারের হন তবে একই ঘড়ির গতিতে ইলেক্ট্রনগুলি দ্বিগুণ হয়ে যায়। এটিই মুরের আইনকে জ্বালানি দেয়।
ফিলিপ স্মিথ

3
@ ফিলিপ: অর্ধবৃত্তি অবশ্যই চিরকালের জন্য চলতে পারে না। একটি সিলিকন পরমাণু প্রায় ন্যানোমিটারের প্রায় এক চতুর্থাংশ, এবং চিপ বানোয়াট ইতিমধ্যে কয়েক ন্যানোমিটারের নিচে রয়েছে। তদুপরি, কোয়ান্টাম স্তরে কণা পরিসংখ্যানগত নিয়মগুলি মেনে চলেন, নিরঙ্কুশ নিয়মগুলি নয়, তাই বিপুল সংখ্যক আইনকে অনুরোধ করার জন্য পর্যাপ্ত ইলেকট্রনের চারদিকে চলা প্রয়োজন। এখনও অবধি, মুরের আইন একটি আইন এবং একটি স্ব-পরিপূর্ণ ভবিষ্যদ্বাণীগুলির মধ্যে কোথাও ছিল, তবে এটি বেশ কিছুদিনের মধ্যেই শেষ হবে।
ডেভিড থর্নলি

7

এটা আসলে সম্ভব দুই খেলোয়াড়ের মধ্যে কোন সু-ক্রম সঙ্গে অসীম খেলায় কৌশল বিজয়ী নিজের কাছে; তবে দাবা ভাল অর্ডার করা হয়। প্রকৃতপক্ষে, 50-পদক্ষেপের নিয়মের কারণে , গেমটি যে পরিমাণ চাল করতে পারে তার সীমাবদ্ধতার একটি উচ্চ-সীমা রয়েছে, এবং এইভাবে কেবল দাবার সম্ভাব্য অনেকগুলি গেম রয়েছে (যা ঠিক সমাধানের জন্য গণনা করা যেতে পারে .. তাত্ত্বিকভাবে, অন্তত :)


4
প্রযুক্তিগতভাবে পঞ্চাশ পদক্ষেপের নিয়ম, ত্রি-সরানো পুনরাবৃত্তির মতো (যা জিনিসগুলিকেও সীমাবদ্ধ করে - সম্ভাব্য পজিশনের একটি সীমাবদ্ধ সংখ্যা রয়েছে, সুতরাং সেই সংখ্যাটি তিনটি দিয়ে গুণ করা আমাদের একটি উচ্চতর সীমা দেয়) কোনও অঙ্কনের কারণ হয় না । বরং এটি খেলোয়াড়কে ড্র দাবি করার সুযোগ দেয় । সাধারণত, হেরে যাওয়া খেলোয়াড় এটি করবে তবে এটির প্রয়োজন নেই। অতএব, নিম্নলিখিতটি একটি সম্পূর্ণ আইনী খেলা: 1. এনসি 3 এনসি 6 2. এনবি 1 এনবি 8 3. এনসি 3 এনসি 6 4. এনবি 1 এনবি 8, চিরতরে পুনরাবৃত্তি হবে। এবং যদি আমি ভুল না হয়ে থাকি তবে এটি অস্বীকার করা হয়নি যে এটি সাদা এবং কালো হিসাবে খেলে দুটি নিখুঁত অ্যালগরিদমের ফলাফল নয়।
লেনোকাস

6

আপনার তর্কের সমাপ্তি আধুনিক দাবা প্রোগ্রামগুলি এখন যেভাবে কাজ করে তা দ্বারা সমর্থিত । তারা সেভাবে কাজ করে কারণ কোনও দাবা প্রোগ্রামকে নির্বিচারে পরিচালনার জন্য কোডটি দেওয়ার পক্ষে এটি খুব উত্স-তীব্র। তারা অগত্যা সবসময় সেভাবে কাজ করবে না । এটা সম্ভব যে কোনও দিন দাবা সমাধান করা হবে এবং যদি এটি ঘটে থাকে তবে সম্ভবত এটি কম্পিউটার দ্বারা সমাধান করা হবে।


5

রেকর্ডের জন্য, এমন কম্পিউটার রয়েছে যা চেকারদের সাথে জিততে বা টাই করতে পারে । আমি নিশ্চিত নই যে দাবাতেও এটি করা যায় কিনা। মুভের সংখ্যা অনেক বেশি। এছাড়াও, জিনিসগুলি পরিবর্তিত হয় কারণ টুকরোগুলি কেবল সামনে এবং পিছনের দিকে নয়, কোনও দিকেই যেতে পারে। আমি মনে করি যদিও আমি নিশ্চিত নই, দাবা নির্বিচারবাদী, তবে একটি যুক্তিসঙ্গত সময়ের জন্য কম্পিউটারের সমস্ত চালগুলি নির্ধারণের জন্য এখন অনেকগুলি সম্ভাব্য পদক্ষেপ রয়েছে।


1
এটি করা যেতে পারে তবে এটি সম্ভবত এমন কোনও কম্পিউটারে করা সম্ভব যা আমরা সম্ভবত দেখি?
বিসিএস

1
সম্ভবত আমাদের জীবদ্দশায় না। মাঠে সত্যই আকর্ষণীয় সমস্ত গবেষণা চলছে গেমের খেলাতে। :)
বিলটি

আইআইআরসি সর্বাধিক 6 বছরের বাচ্চারা যে কোনও কম্পিউটারে যেতে পারবেন।
বিসিএস

2
@ বিবিএস: আর নেই। সেরা গো প্রোগ্রামগুলি এখন ডান (পেশাদার) স্তরের খেলোয়াড়দের পরাজিত করছে।
বিলটি

1
@ ব্লুরাজা: এটি ২০০৮ সালে হয়েছিল the বর্তমান রেকর্ডটি কী তা আমি জানি না, তবে মোগো 19x19-এ 6 এবং 7 পাথর দিয়ে পেশাদারদের পরাজিত করেছে। ireport.cnn.com/docs/DOC-214010
বিল

5

আমার মনে হয় আপনি মারা গেছেন ডিপ ব্লু এবং ডিপ থট-এর মতো মেশিনগুলিকে বেশ কয়েকটি পূর্বনির্ধারিত গেমস, এবং সেই গেমগুলির শেষ প্রান্তে গাছগুলি পার্স করার জন্য চালাক অ্যালগরিদম দিয়ে প্রোগ্রাম করা হয়। এটি অবশ্যই একটি নাটকীয় ওভারসাম্প্লিফিকেশন। গেমের সময় বরাবর কম্পিউটারকে "বীট" করার সুযোগ থাকে। এর মাধ্যমে আমার অর্থ এমন একটি পদক্ষেপ যা কম্পিউটারকে এমন কোনও পদক্ষেপ তৈরি করতে বাধ্য করে যা সর্বোত্তম (যা কিছু হোক) এর চেয়ে কম। কম্পিউটারটি সরানোর সময়সীমাটির আগে যদি সর্বোত্তম পথটি না খুঁজে পায়, তবে এটি খুব কম-পছন্দসই পাথগুলির মধ্যে একটি বেছে নিয়ে ভুল করতে পারে।

দাবা প্রোগ্রামগুলির আরও একটি শ্রেণি রয়েছে যা প্রকৃত মেশিন লার্নিং বা জেনেটিক প্রোগ্রামিং / বিবর্তনীয় অ্যালগরিদম ব্যবহার করে। কিছু প্রোগ্রাম বিকশিত হয়ে গেছে এবং সিদ্ধান্ত নেওয়ার জন্য নিউরাল নেটওয়ার্ক, ইত্যাদি ব্যবহার করে al এই ধরণের ক্ষেত্রে, আমি কল্পনা করব যে কম্পিউটারটি "ভুল" করতে পারে, তবে এখনও একটি বিজয়ী হতে পারে।

ব্লন্ডি 24 নামে এই ধরণের জিপিতে একটি আকর্ষণীয় বই রয়েছে যা আপনি পড়তে পারেন। এটি চেকারদের সম্পর্কে, তবে এটি দাবাতে প্রয়োগ হতে পারে।


দাবাতে আপনি আজকের কম্পিউটারগুলিকে এভাবেই পরাজিত করেছেন। আগামীকাল ভাল হবে। আমি আপনার সাথে একমত হই না, যদিও, ব্লোনডি 24 চিত্তাকর্ষক।
বিল করুন

ব্যাক আপ ভোট দিয়েছেন। এই পোস্টটি নেতিবাচক স্কোর প্রাপ্য নয়।
সাইবিস

দুর্ভাগ্যক্রমে, দাবা খেলার সমস্যাটি মেশিন লার্নিংয়ের কাজ করার জন্য খুব বড় large তারা কখনও ভুলত্রুটি না করে এমনকি অবিস্মরণীয়ভাবে খেলতে শেখার দাবা প্রোগ্রাম পেতে পারে না। হিউরিস্টিক্স আরও ভাল। ব্রুট ফোর্স আরও ভাল ছিল। দাবা দিয়ে ব্যর্থতা থেকে মেশিন লার্নিংয়ের ক্ষেত্রটি কেবল শিখেছে।
lkessler

দাবা প্রোগ্রামগুলি স্বল্পমেয়াদী ভুল করে না এবং সেরা প্রোগ্রামগুলি বিশ্ব চ্যাম্পিয়নদের পরে আরও ভাল খেলায়। আমি মনে করি রাইবকা bit৪ বিটের সর্বশেষতম সংস্করণটি 3200 ইএলও
অ্যালেক্স

5

গেম তত্ত্ব থেকে, যা এই প্রশ্নটি সম্পর্কে, উত্তর হ্যাঁ দাবা পুরোপুরি খেলতে পারেন। গেমের স্পেসটি পরিচিত / অনুমানযোগ্য এবং হ্যাঁ যদি আপনার নাতি-নাতনিদের কোয়ান্টাম কম্পিউটার থাকে তবে আপনি সম্ভবত সমস্ত হিউরিস্টিক্সকে দূর করতে পারেন।

আপনি যে কোনও স্ক্রিপ্টিং ভাষায় আজকাল দিনে একটি নিখুঁত টিক-টাক-টো মেশিন লিখতে পারেন এবং এটি রিয়েল-টাইমে পুরোপুরি খেলতে পারে।

ওথেলো হ'ল আরেকটি গেম যা বর্তমান কম্পিউটারগুলি সহজেই নিখুঁতভাবে খেলতে পারে তবে মেশিনের মেমরি এবং সিপিইউকে কিছুটা সাহায্যের প্রয়োজন হবে

দাবা তাত্ত্বিকভাবে সম্ভব তবে ব্যবহারিকভাবে সম্ভব নয় (২০০৮ সালে)

আই-গো কৌশলটি জটিল, এটি মহাবিশ্বের পরমাণুর পরিমাণের বাইরে সম্ভাবনার স্থান হ'ল, সুতরাং একটি নিখুঁত আই-গো মেশিন তৈরি করতে আমাদের কিছুটা সময় নিতে পারে।



4
প্রযুক্তিগতভাবে, এটি সম্মিলিত গেম তত্ত্ব।
অ্যানাফরি

5

দাবাটি একটি ম্যাট্রিক্স গেমের উদাহরণ, যার সংজ্ঞা অনুসারে একটি সর্বোত্তম পরিণতি হয় (ভাবুন ন্যাশ ভারসাম্য)। যদি খেলোয়াড় 1 এবং 2 প্রত্যক্ষ অনুকূল পদক্ষেপ গ্রহণ করে তবে একটি নির্দিষ্ট ফলাফল সর্বদা পৌঁছে যাবে (এটি উইন-টাই-পরাজয় কিনা তা এখনও অজানা)।


5

১৯ 1970০ এর দশকের দাবা প্রোগ্রামার হিসাবে আমার অবশ্যই এ সম্পর্কে একটি মতামত রয়েছে। আমি প্রায় 10 বছর আগে যা লিখেছিলাম তা আজও মূলত সত্য:

"অসম্পূর্ণ কাজ এবং দাবা প্রোগ্রামারদের জন্য চ্যালেঞ্জ"

তারপরে, আমি ভেবেছিলাম আমরা দাবাটি নিয়মিতভাবে সমাধান করতে পারি, যদি সঠিকভাবে করা হয়।

চেকারগুলি সম্প্রতি সমাধান করা হয়েছিল (ইয়ে, আলবার্তো বিশ্ববিদ্যালয়, কানাডা !!!) তবে কার্যকরভাবে ব্রুট ফোর্সটি কার্যকর করা হয়েছিল। প্রচলিতভাবে দাবা করতে, আপনাকে আরও স্মার্ট হতে হবে।

অবশ্যই না থাকলে কোয়ান্টাম কম্পিউটিং বাস্তবে পরিণত হয়। যদি তা হয় তবে দাবা টিকি-ট্যাক-টোয়ের মতো সহজেই সমাধান করা হবে।

১৯ 1970০ এর দশকের গোড়ার দিকে সায়েন্টিফিক আমেরিকান শহরে একটি সংক্ষিপ্ত প্যারোডি ছিল যা আমার দৃষ্টি আকর্ষণ করেছিল। এটি এমন একটি ঘোষণা ছিল যে দাবা খেলাটি রাশিয়ান দাবা কম্পিউটারের দ্বারা সমাধান করা হয়েছিল। এটি স্থির করে দিয়েছিল যে সাদাদের জন্য একটি নিখুঁত পদক্ষেপ রয়েছে যা উভয় পক্ষের নিখুঁত খেলায় একটি জয় নিশ্চিত করবে, এবং সেই পদক্ষেপটি হল: 1. এ 4!


3

এখানে প্রচুর উত্তর গুরুত্বপূর্ণ গেম-তাত্ত্বিক পয়েন্টগুলি তৈরি করে:

  1. দাবা একটি সীমাবদ্ধ, গেমের অবস্থা সম্পর্কে সম্পূর্ণ তথ্য সহকারী গেম
  2. আপনি একটি সীমাবদ্ধ গেম সমাধান করতে এবং একটি নিখুঁত কৌশল চিহ্নিত করতে পারেন
  3. দাবা এতোটুকু বড় যে আপনি এটি একটি নিষ্ঠুর বল পদ্ধতি দ্বারা সম্পূর্ণরূপে সমাধান করতে সক্ষম হবেন না

তবে এই পর্যবেক্ষণগুলি একটি গুরুত্বপূর্ণ ব্যবহারিক বিষয় মিস করে: একটি অপরাজেয় মেশিন তৈরি করার জন্য পুরো গেমটি পুরোপুরি সমাধান করার প্রয়োজন হয় না

সম্ভবত এটি সম্ভবত সম্ভাব্য রাষ্ট্রের ক্ষুদ্র একটি ভগ্নাংশ অনুসন্ধান না করে আপনি একটি অপূরণীয় দাবা মেশিন তৈরি করতে পারেন (যেমন কখনই হারাবেন না এবং সর্বদা একটি জয় বা ড্র করতে বাধ্য করবেন) সম্ভবত এটি সম্ভবত সম্ভবত।

উদাহরণস্বরূপ নিম্নলিখিত কৌশলগুলি সমস্ত প্রয়োজনীয় অনুসন্ধানের স্থানকে হ্রাস করে:

  • আলফা / বিটা বা এমটিডি-এফের মতো গাছের ছাঁটাই করার কৌশল ইতিমধ্যে অনুসন্ধানের স্থানটি ব্যাপকভাবে হ্রাস করে
  • সরবরাহযোগ্য জয়ের অবস্থান। অনেকগুলি এই বিভাগে আসে: উদাহরণস্বরূপ আপনাকে কেআর বনাম কে অনুসন্ধান করার দরকার নেই এটি প্রমাণিত জয়। কিছু কাজের সাথে আরও অনেক গ্যারান্টিযুক্ত জয় প্রমাণ করা সম্ভব।
  • প্রায় নির্দিষ্ট জয় - কোনও বোকা ভুল ছাড়াই "যথেষ্ট ভাল" খেলার জন্য (ইএলও 2200+ সম্পর্কে বলুন?) অনেক দাবা পজিশন প্রায় নির্দিষ্ট জয়, উদাহরণস্বরূপ একটি শালীন পদার্থের সুবিধা (যেমন একটি অতিরিক্ত নাইট) কোনও ক্ষতিপূরণগত অবস্থানগত সুবিধা ছাড়াই। যদি আপনার প্রোগ্রামটি এমন একটি অবস্থানকে জোর করতে পারে এবং অবস্থানগত সুবিধা সনাক্ত করার জন্য যথেষ্ট হিউরিস্টিকস থাকে তবে এটি নিরাপদে ধরে নিতে পারে যে এটি জিতবে বা কমপক্ষে 100% সম্ভাবনার সাথে আঁকবে।
  • বৃক্ষ অনুসন্ধানের হিউরিস্টিক্স - যথেষ্ট পর্যায়ে প্যাটার্ন স্বীকৃতি সহ, আপনি দ্রুত "আকর্ষণীয়" পদক্ষেপের প্রাসঙ্গিক সাবসেটটিতে ফোকাস করতে পারেন। মানব গ্র্যান্ডমাস্টাররা এভাবে খেলেন তাই এটি স্পষ্টত কোনও খারাপ কৌশল নয় ..... এবং আমাদের প্যাটার্ন স্বীকৃতি অ্যালগরিদমগুলি ক্রমাগত উন্নত হচ্ছে
  • ঝুঁকি মূল্যায়ন - একটি অবস্থানের "ঝুঁকি" এর আরও ভাল ধারণাটি ফলাফলগুলি অনিশ্চিত যেখানে পরিস্থিতিগুলিতে কম্পিউটিং পাওয়ার উপর দৃষ্টি নিবদ্ধ করে আরও কার্যকর অনুসন্ধান সক্রিয় করতে সক্ষম করবে (এটি নিগ্রহের অনুসন্ধানের প্রাকৃতিক বর্ধন )

উপরোক্ত কৌশলগুলির সঠিক সংমিশ্রণের সাথে, আমি স্বাচ্ছন্দ্য বোধ করি যে "অপরাজেয়" দাবা খেলার মেশিনটি তৈরি করা সম্ভব। আমরা সম্ভবত বর্তমান প্রযুক্তি থেকে খুব বেশি দূরে নই।

নোট করুন যে এটি প্রমাণ করা প্রায় অবশ্যই কঠিন এই মেশিনটি পিটানো যায় না তা । এটি সম্ভবত রিমন অনুমানের মতো কিছু হতে পারে - আমরা পুরোপুরি নিশ্চিত হতে পারি যে এটি নিখুঁতভাবে খেলেছে এবং অভিজ্ঞতাগত ফলাফলগুলি দেখায় যে এটি কখনই হারাবে না (সহ কয়েক বিলিয়ন সরাসরি নিজের বিরুদ্ধে ড্র করেছে) তবে আমাদের আসলে ক্ষমতা রাখার ক্ষমতা নেই প্রমান কর.

"পরিপূর্ণতা" সম্পর্কিত অতিরিক্ত নোট:

গেম-তাত্ত্বিক অর্থে মেশিনটিকে "নিখুঁত" হিসাবে বর্ণনা না করার বিষয়ে আমি সতর্ক রয়েছি কারণ এটি অস্বাভাবিকভাবে শক্তিশালী অতিরিক্ত শর্ত বোঝায় যেমন:

  • বিজয়ী সংমিশ্রণ যত জটিলই হোক না কেন, জয়ের জন্য জোর করা সম্ভব এমন প্রতিটি পরিস্থিতিতে সর্বদা বিজয়ী হওয়া। জয়ের / ড্রয়ের সীমানায় এমন পরিস্থিতি থাকবে যেখানে এটি নিখুঁতভাবে গণনা করা অত্যন্ত কঠিন।
  • আপনার প্রতিপক্ষের খেলায় সম্ভাব্য অপূর্ণতা সম্পর্কে সমস্ত উপলভ্য তথ্যের অন্বেষণ, উদাহরণস্বরূপ অনুমান করা যে আপনার প্রতিপক্ষ খুব লোভী হতে পারে এবং ইচ্ছাকৃতভাবে এই কারণে যে আপনার প্রতিপক্ষকে ভুল করার জন্য প্ররোচিত করার সম্ভাবনা রয়েছে তার চেয়ে স্বাভাবিকের চেয়ে কিছুটা দুর্বল লাইন খেলতে পারে। অসম্পূর্ণ প্রতিপক্ষের বিরুদ্ধে হারাতে পারা এটি সর্বোত্তম হতে পারে যদি আপনি অনুমান করেন যে আপনার প্রতিপক্ষ সম্ভবত জোর করে জিততে পারে না এবং এটি আপনাকে নিজের জয়ের উচ্চতর সম্ভাবনা দেয়।

নিখুঁততা (বিশেষত অসম্পূর্ণ এবং অজানা বিরোধীদের দেওয়া) কেবল অপরাজেয় থাকার চেয়ে অনেক কঠিন সমস্যা।


অসম্পূর্ণ প্রতিপক্ষ হওয়া একটি আসল সমস্যা নয়। এটি কেবল নিখুঁত খেলোয়াড়কে কম পদক্ষেপে জয় / ড্র করে তোলে (কখনই নিখুঁত ফলাফল হয়) moves প্রতিটি অবস্থানে একটি অনুকূল পদক্ষেপ সর্বদা অন্যান্য সম্ভাব্য পদক্ষেপের (সংজ্ঞা অনুসারে) এর চেয়ে ভাল বা সমান। সুতরাং একটি সাবঅপটিমাল পদক্ষেপ আপনার প্রতিপক্ষকে সর্বোত্তম শেষের অবস্থানে (বিজয় / ড্র) আগে পৌঁছাতে বা এমনকি আরও ভাল ফলাফলকে বাধ্য করার অনুমতি দেয়। উদাহরণস্বরূপ, সাদা যদি নিখুঁতভাবে খেলে কালো সবসময় looseিলে ,ালা হয়ে যায়, তবে সাদাটি জয়ী হতে পারে, যদি সাদা মাত্র একটি একক সাবওটিমাল মুভ খেলে। তবে হ্যাঁ, এটি বিশ্লেষণের জটিলতাটি কিছুটা বাড়িয়ে তুলতে হবে।
এসডওয়ার্ফস

@Stefan - অপূর্ণ বিরোধীদের যদি আপনার পছন্দের একটি বিশাল সমস্যা হয় অনুকূল খেলা। আপনি যদি জানেন যে আপনার প্রতিপক্ষের ভুল করার সম্ভাবনা যথেষ্ট পরিমাণে রয়েছে তবে বিশেষত আপনি এমন পরিস্থিতিতে কল্পনা করতে পারেন যেখানে কোনও হারানো পদক্ষেপ (যেমন একটি পদক্ষেপ যেখানে একজন নিখুঁত প্রতিপক্ষ অবশ্যই আপনাকে পরাজিত করবে)।
মাইকেরা

আমার মতে অনুকূল খেলার অর্থ শূন্য ঝুঁকির সাথে সেরা সম্ভাব্য ফলাফল অর্জন করা। আপনার প্রতিপক্ষ সম্ভবত "দুর্বল" তবে আপনি যখন এই হারানো চালটি খেলেন তখন দুর্ভাগ্যক্রমে দুর্ঘটনাক্রমে তিনি ভাল পদক্ষেপ নিতে পারেন। সাবঅপটিমাল প্রতিপক্ষের যত্ন নেওয়া কেবলমাত্র তখনই প্রাসঙ্গিক যেখানে হারানো চালগুলির মধ্যে কেবলমাত্র একটি পছন্দ রয়েছে যেখানে তাদের মধ্যে একটি (সাবপটিমাল প্লেয়িং) প্রতিপক্ষের দ্বারা একটি ড্র বা জয়ের পক্ষে নেতৃত্ব দেওয়ার ভুলের উচ্চতর সম্ভাবনা রয়েছে।
এসডওয়ার্ফস

1
গেম তত্ত্বের এটি সর্বোত্তম সংজ্ঞা নয়। সর্বোত্তম অর্থ সাধারণত প্রত্যাশিত ফলাফলকে সর্বাধিক করে তোলা । যে ক্ষেত্রে, একটি অনুকূল খেলোয়াড় কিছু ঝুঁকি গ্রহণ করবে এটি প্রদান করে এটি গড়ে আরও ভাল ফলাফল পায় ।
মাইকেরা

সেক্ষেত্রে আপনি পুরোপুরি ঠিক!
এসডওয়ার্ফস

2

আপনি যদি প্লেয়ার 1/2 পদক্ষেপের সমস্ত সংমিশ্রণের পুরো স্থান অনুসন্ধান করেন তবে কম্পিউটার প্রতিটি পদক্ষেপে সিদ্ধান্ত নেয় এমন একক পদক্ষেপ হিউরিস্টিকের উপর ভিত্তি করে।

দুটি প্রতিযোগিতামূলক ধারণা আছে। একটি হ'ল আপনি প্রতিটি সম্ভাব্য পদক্ষেপটি অনুসন্ধান করেন এবং অন্যটি হ'ল আপনি কোনও হিউরিস্টিকের ভিত্তিতে সিদ্ধান্ত নেন। একটি হিউরিস্টিক একটি ভাল অনুমান করার ব্যবস্থা। আপনি যদি প্রতিটি সম্ভাব্য পদক্ষেপের সন্ধান করে থাকেন তবে আপনি আর অনুমান করছেন না।


আসলে, উক্তিটি সঠিক। প্রোগ্রামগুলি বর্তমান অবস্থানে উভয় পক্ষের সমস্ত সম্ভাব্য পদক্ষেপের দিকে নজর রাখে এবং কম্পিউটারের পক্ষে অনুকূল অবস্থানের দিক দিয়ে গেমটি চালানোর জন্য একটি ভাল পদক্ষেপ খুঁজে পেতে হিউরিস্টিক্স ব্যবহার করে।
বিলটি

1
না, তারা সম্ভাব্য সমস্ত পদক্ষেপের দিকে নজর দেয় না। তারা গাছকে ছাঁটাই করতে নাল-মুভ হিউরিস্টিক ব্যবহার করে।
অ্যালেক্স

2

"দাবা জন্য একটি নিখুঁত অ্যালগরিদম আছে?"

হ্যা এখানে. সর্বদা এটি হোয়াইটের পক্ষে জয়ের পক্ষে। সবসময় জয়ের জন্য এটি কালো for সম্ভবত এটি উভয়ের পক্ষে সর্বদা কমপক্ষে টাই করা উচিত। আমরা কোনটি জানি না এবং আমরা কখনই জানব না, তবে এটি অবশ্যই বিদ্যমান।

আরো দেখুন


1
বেশ সুন্দর দাবা খেলোয়াড় হওয়া এবং কয়েক বছর ধরে সমস্যাটি ব্যাপকভাবে পড়াশোনা করা, আমি 99.9% নিশ্চিত যে উভয় খেলোয়াড়ের জন্য দাবাতে থাকা প্রিফ্যাক্ট কৌশলটি ড্রয়ের ফলাফল দেয় (যাচাইকারীদের সাথে প্রমাণিত হয়েছে)। খেলোয়াড়ের শক্তি বাড়ার সাথে সাথে ড্রয়ের শতাংশও বেড়ে যায় বলে প্রমাণ রয়েছে।
মাইকের

2

জন ম্যাককিয়ারির এই নিবন্ধটি আমি পেয়েছি যা "গেম থিয়োরের জনক" আর্নস্ট ফ্রেড্রিখ ফেরদিনান্দ জেরেমেলোর কাজগুলি উল্লেখ করে । এটি নিম্নলিখিত উপসংহার টান:

দাবাতে সাদা কোনও জয়কে জোর করতে পারে, বা কালো জয়কে জোর করতে পারে, বা উভয় পক্ষই কমপক্ষে ড্র করতে বাধ্য করতে পারে।

যুক্তিটি আমার কাছে দৃ sound় মনে হয়েছে।


2

এটি পুরোপুরি সমাধানযোগ্য।

10 ^ 50 বিজোড় অবস্থান রয়েছে। আমার অবস্থান অনুসারে প্রতিটি অবস্থানের জন্য সর্বনিম্ন 64৪ রাউন্ড বাইট সংরক্ষণ করতে হবে (প্রতিটি বর্গক্ষেত্রে রয়েছে: ২ টি অনুমোদিত বিট, ৩ টুকরা বিট)। একবার তাদের জমায়েত হওয়ার পরে, চেকমেটগুলি যে অবস্থানগুলি সনাক্ত করা যায় এবং অবস্থানগুলি একটি সম্পর্ক গঠনের সাথে তুলনা করা যেতে পারে, এটি দেখায় যে কোন ফলাফলগুলি বড় ফলাফল গাছের অন্যান্য অবস্থানগুলিতে নিয়ে যায়।

তারপরে, প্রোগ্রামটির কেবলমাত্র সর্বনিম্ন এক পক্ষের চেকমেট শিকড়গুলি খুঁজে পাওয়া দরকার, যদি এই জাতীয় কোনও জিনিস বিদ্যমান থাকে। যে কোনও ক্ষেত্রে, দাবাটি প্রথম অনুচ্ছেদের শেষে মোটামুটিভাবে সমাধান করা হয়েছিল।


1

আমি মাত্র 99.9% এই দাবি দ্বারা নিশ্চিত যে রাষ্ট্রের জায়গার আকার কোনও সমাধানের আশা করা অসম্ভব করে তোলে।

অবশ্যই, 10 ^ 50 একটি অসম্ভব বড় সংখ্যা। আসুন রাষ্ট্রের স্থানের আকারকে কল করুন।

দীর্ঘতম গেমের গতিসংখ্যার সীমাবদ্ধ কী? যেহেতু সমস্ত গেমস একটি সীমাবদ্ধ সংখ্যায় চূড়ান্তভাবে শেষ হয় সেখানে এই ধরণের একটি আবদ্ধ উপস্থিত থাকে, তাই এটি মি।

প্রাথমিক অবস্থা থেকে শুরু করে, আপনি ও (এম) স্থানের সমস্ত এন চালগুলি গণনা করতে পারবেন না? অবশ্যই, এটি ও (এন) সময় নেয়, তবে মহাবিশ্বের আকার থেকে যুক্তিগুলি সরাসরি এটিকে দেখায় না। ও (এম) স্থান এমনকি খুব বেশি নাও হতে পারে। ও (এম) স্থানের জন্য আপনিও এই ট্র্যাভার্সাল চলাকালীন ট্র্যাক করতে পারেন নি, আপনি যে পথটি অনুসরণ করছেন তার পাশ দিয়ে কোনও রাজ্যের ধারাবাহিকতা ইয়েথারওয়াইন, ইয়েটারমায়ফোরসড্র, হোয়াইটময়ওয়াইন, হোয়াইটমে ওয়াইনআরফরাসড্রাউ, ব্ল্যাকমেওয়িন বা ব্ল্যাকমেওয়াইনআরফ্র্যাসড্রো বাড়ে? (যার পালা এটির উপর নির্ভর করে একটি জাল রয়েছে, জালির মিলনের সাথে আপনার ট্র্যাভারসালের ইতিহাসে প্রতিটি রাজ্যকে টিকিয়ে দিন))

যদি আমি কিছু অনুপস্থিত না করি, দাবা কোন সম্ভাব্য বিভাগে পড়ে তা নির্ধারণের জন্য এটি একটি (এন) সময় / ও (এম) স্পেস অ্যালগরিদম। উইকিপিডিয়া মহাবিশ্বের বয়স সম্পর্কে প্রায় 10 times 60 তম প্ল্যাঙ্ক সময়ে একটি অনুমান উদ্ধৃত করে। কোন মহাজাগতিক যুক্তিতে না গিয়ে, আসুন অনুমান করি যে মহাবিশ্বের তাপ / শীত / যাই হোক না কেন মৃত্যুর আগে তার অনেক বেশি সময় বাকি ছিল। এটি আমাদের প্রতি 10 ^ 10 তম প্ল্যাঙ্ক সময় বা প্রতি 10 ^ -34 সেকেন্ডে একটি পদক্ষেপের মূল্যায়ন করতে হবে leaves এটি একটি অসম্ভব স্বল্প সময়ের (সবচেয়ে কম 16 টি আকারের সবচেয়ে কম সময়ের অর্ডারটি সবচেয়ে কম সময়ের তুলনায় কম)। আসুন আমরা আশাবাদীভাবে বলতে পারি যে একটি সুপার-ডুপার-ভাল বাস্তবায়ন লাইনের শীর্ষে চলমান রয়েছে বা বর্তমানের-ফোর্সেন-নন-কোয়ান্টাম-পি-হ'ল একটি যথাযথ-সাবসেট-অফ-এনপি প্রযুক্তি যা আমরা মূল্যায়নের আশা করতে পারি (গ্রহণ করুন একক পদক্ষেপ এগিয়ে, মধ্যবর্তী রাষ্ট্র বা তিনটি প্রান্তের একটির হিসাবে ফলস্বরূপ রাজ্যটিকে শ্রেণীবদ্ধ করুন: 100 মেগাহার্টজ হারে (প্রতি 10 ^ -8 সেকেন্ডে একবার) হারে রাজ্যগুলিকে রাজ্য শ্রেণীবদ্ধ করুন। যেহেতু এই অ্যালগরিদমটি খুব সমান্তরাল, তাই এটির ফলাফল সংগ্রহ করার ক্ষমতা সহ আমাদের 10 such 26 তম কম্পিউটার বা আমার দেহের প্রতিটি পরমাণুর জন্য প্রায় একটির দরকার পড়ে।

আমি মনে করি একটি কার্যকর শক্তি সমাধানের জন্য সবসময় কিছুটা আশা রয়েছে। আমরা ভাগ্যবান হয়ে উঠতে পারি এবং শ্বেতের সম্ভাব্য উদ্বোধনের একটি মাত্র পদক্ষেপের অন্বেষণে উভয়ই একদম কম-নিম্ন-গড়ের চেয়ে কম ফ্যানআউট এবং এমন একটি বেছে নিতে পারেন যাতে সাদা সবসময় জয়ী হয় বা জেতা-বা ড্র হয়।

আমরা দাবা সংজ্ঞা কিছুটা সঙ্কুচিত করতে এবং সবাইকে বোঝাতে পারি যে এটি এখনও নৈতিকভাবে একই খেলা। ড্রয়ের আগে আমাদের কি 3 বার পুনরাবৃত্তি করার জন্য সত্যই দরকার? আমাদের কি সত্যিই দৌড়াতে যাওয়া পার্টিটি 50 টি পদক্ষেপের জন্য পালিয়ে যাওয়ার দক্ষতা প্রদর্শন করা দরকার? এমনকি কেউ কি বুঝতে পেরেছেন যে পাসের নিয়মের সাথে হেক কী চলছে ? ;) আরো গুরুত্ব সহকারে, আমরা সত্যিই সরাতে একটি প্লেয়ার বলপূর্বক (যেমন পারেন অঙ্কন বিরোধিতা বা হারানোর) প্রয়োজন যখন তার শুধুমাত্র চেক অব্যাহতি সরানো বা একটি অচলাবস্থা একজন প্রসঙ্গক্রমে ক্যাপচার? কাঙ্ক্ষিত অ রানী প্রচার যদি তাত্ক্ষণিকভাবে চেক বা চেকমেটকে না নিয়ে যায় তবে আমরা কী টুকরো টুকরোগুলি সীমাবদ্ধ রাখতে পারি?

দেরী গেমের রাজ্যগুলির একটি বৃহত ডাটাবেসে প্রতিটি কম্পিউটার হ্যাশ-ভিত্তিক অ্যাক্সেসের অনুমতি এবং তাদের সম্ভাব্য ফলাফলগুলি (যা বিদ্যমান হার্ডওয়্যার এবং বিদ্যমান শেষ গেমের ডেটাবেসগুলির সাথে তুলনামূলকভাবে কার্যকর হতে পারে) এর আগে অনুসন্ধানটি ছাঁটাই করতে কতটা সহায়তা করতে পারে তা সম্পর্কে আমিও অনিশ্চিত। স্পষ্টতই আপনি ও (এন) স্টোরেজ ব্যতীত পুরো ফাংশনটি স্মৃতিচারণ করতে পারবেন না, তবে আপনি একটি বৃহত পূর্ণসংখ্যা চয়ন করতে পারেন এবং স্মরণ করতে পারেন যে প্রতিটি এন্ডগেমগুলি প্রতিটি সম্ভাব্য (বা এমনকি সহজে সম্ভাব্য অসম্ভব নয়, আমি মনে করি) শেষের অবস্থা থেকে পিছনে গণনা করে।


1
আপনার এম = 5898. নিখরচায় দাবা নিয়মগুলি সংজ্ঞায়িত করে যে আপনাকে কমপক্ষে স্থানান্তরিত করতে হবে বা টুকরো টুকরো করতে হবে (এমন কিছু যা প্রত্যাবর্তনযোগ্যভাবে গেম পরিবর্তন করে) কমপক্ষে প্রতি 50 টি পদক্ষেপে (50 টি মুভসের নিয়ম বলে) বা খেলোয়াড়দের মধ্যে একটি ড্র দাবি করতে পারে। উভয় খেলোয়াড় যদি সহযোগিতা করে এবং যত তাড়াতাড়ি সম্ভব ড্রয়ের দাবি করে তবে সবচেয়ে দীর্ঘতম গেমটি 5898 মুভ দীর্ঘ বলে গণনা করা হয়েছে। দু'জন খেলোয়াড়ই যদি ড্র দাবি করতে পারে তবে খেলতে চালিয়ে যাওয়া বোধগম্য নয়। কোনও খেলোয়াড় যদি খেয়াল করে যে সে তার ক্ষতি করে তবে সে একই ফলাফল প্রদান করে ড্রয়ের দাবি করতে পারে। দেখুন: chess.com/blog/kurtgodden/the-longest-possible-chess-game
SDwarfs

1
দ্রষ্টব্য: মি = 5898 হ'ল "চালগুলি" এর সংখ্যা। অর্ধেক প্যাচসমূহ সর্বোচ্চ সংখ্যা হল (118-3) * 100 + 3 * 99 = 11797. আপনি এখানে প্রমাণ খুঁজে পেতে পারেন (জার্মান!): De.wikipedia.org/wiki/50-Z%C3%BCge-Regel# Schachmathematik
SDwarfs

1

আমি জানি এটি একটি বিড়ম্বনা, তবে আমার 5 সেন্ট মূল্য এখানে রাখতে হবে। কোনও জয় বা অচলাবস্থায় যে কোনও অংশীদার বা খেলায় অংশগ্রহণ করে এমন একটি দাবা খেলা শেষ করে দেওয়া কম্পিউটার বা এই বিষয়টির জন্য একজন ব্যক্তির পক্ষে সম্ভব।

তবে এটি অর্জনের জন্য আপনাকে অবশ্যই প্রতিটি সম্ভাব্য চলন এবং প্রতিক্রিয়া এবং প্রতিটি একক সম্ভাব্য গেমের ফলাফলের মাধ্যমে এবং অবশ্যই এটি কল্পনা করতে বা এই তথ্যটি বিশ্লেষণ করার সহজ উপায়টি অবলম্বন করতে হবে, ভেবে দেখুন এটি মনের মানচিত্র হিসাবে যা নিয়মিতভাবে শাখা করে।

সেন্টার নোডটি গেমের শুরু হবে। প্রতিটি নোডের বাইরে থাকা প্রতিটি শাখা একটি চলাচলের প্রতীক হবে, প্রত্যেকে তার ব্রেথেরেন মুভগুলির চেয়ে আলাদা। এটি এই ম্যানোয়ারে উপস্থাপন করাতে প্রচুর সংস্থান লাগবে, বিশেষত যদি আপনি কাগজে এটি করেন। কম্পিউটারে, এটি সম্ভবত কয়েকশো টেরাবাইট ডেটা গ্রহণ করতে পারে, কারণ আপনি শাখাগুলি ফিরে না তৈরি করা না হলে আপনার অনেক প্রচুর প্রজননমূলক পদক্ষেপ থাকবে।

এই জাতীয় ডেটা মুখস্ত করা, অসম্ভব না হলেও, শ্রবণযোগ্য হবে। তাত্ক্ষণিকভাবে সম্ভব 8 টি পদক্ষেপের বাইরে চলে যাওয়ার জন্য কোনও কম্পিউটারকে সর্বাধিক অনুকূল পদক্ষেপের স্বীকৃতি প্রদান করা সম্ভব হয়েছিল, তবে এটি প্রশংসনীয় নয় ... কারণ কম্পিউটারটিকে সেই পদক্ষেপের অতীতের সমস্ত শাখা প্রক্রিয়া করতে সক্ষম করার প্রয়োজন হবে, কোনও উপসংহারে যাওয়ার সমস্ত উপায়ে, জয় বা অচলাবস্থার ফলস্বরূপ এমন সমস্ত সিদ্ধান্তগুলি গণনা করুন, তারপরে সিদ্ধান্তটি হারাতে না পারার বিরুদ্ধে number নম্বর ওয়াইনিয় সিদ্ধান্তে কাজ করুন এবং এর জন্য টেরাবাইটে ডেটা প্রক্রিয়াকরণে সক্ষম র‌্যামের প্রয়োজন হবে, বা আরও বেশি! এবং আজকের প্রযুক্তির সাথে, এর মতো কম্পিউটারে বিশ্বের 5 ধনী পুরুষ এবং / বা মহিলাদের ব্যাংক ব্যালেন্সের চেয়েও বেশি প্রয়োজন হবে!

সুতরাং সমস্ত বিবেচনা পরে, এটি করা যেতে পারে, তবে, কেউ এটি করতে পারে না। এই জাতীয় কাজের জন্য আজ কেবলমাত্র দাবাতে নয়, বিজ্ঞান এবং কম্পিউটার প্রযুক্তিতেও উজ্জ্বল মনের 30 টি জীবন্ত মানুষের প্রয়োজন হবে এবং এই জাতীয় কাজটি কেবলমাত্র একটি (সম্পূর্ণরূপে এটি বেসিক দৃষ্টিকোণে রাখার জন্য) সম্পন্ন করা যেতে পারে ... চূড়ান্তভাবে হাইপার সুপার-ডুপার কম্পিউটার ... যা কমপক্ষে এক শতাব্দী ধরে থাকতে পারে। এটি সম্পন্ন করা হবে! শুধু এই জীবদ্দশায় না।


1

আপনার চিন্তার পরীক্ষায় দুটি ভুল রয়েছে:

  1. যদি আপনার ট্যুরিং মেশিনটি "সীমাবদ্ধ" না হয় (মেমরি, গতি, ...) তে আপনাকে হিউরিস্টিক ব্যবহার করার দরকার নেই তবে আপনি চূড়ান্ত অবস্থার (জয়, ক্ষতি, অঙ্কন) মূল্যায়ন করতে পারেন। নিখুঁত গেমটি সন্ধান করার জন্য আপনাকে প্রতিটি প্লেয়ারের অনুকূল চালগুলি গণনা করতে মিনিম্যাক্স অ্যালগরিদম ( http://en.wikedia.org/wiki/Minimax দেখুন ) ব্যবহার করতে হবে যা এক বা একাধিক অনুকূল গেমগুলির দিকে পরিচালিত করবে।

  2. ব্যবহৃত হিউরিস্টিকের জটিলতারও কোনও সীমা নেই। আপনি যদি নিখুঁত গেমটি গণনা করতে পারেন, তবে এটি থেকে একটি নিখুঁত হিউরিস্টিক গণনা করার উপায়ও রয়েছে। যদি প্রয়োজন হয় কেবল একটি ফাংশন যা দাবা পজিশনের মানচিত্রটি "যদি আমি এই পরিস্থিতিতে থাকি তবে আমার সেরা পদক্ষেপ এম"।

যেমন অন্যরা ইতিমধ্যে দেখিয়েছে, এটি 3 সম্ভাব্য ফলাফলের মধ্যে শেষ হবে: সাদা একটি জয়কে জোর করতে পারে, কালো একটি জোরকে জোর করতে পারে, তাদের মধ্যে একটি ড্র করতে বাধ্য করতে পারে।

নিখুঁত চেকার গেমসের ফলাফল ইতিমধ্যে "গণনা" করা হয়েছে। মানবতা যদি আগে নিজেকে ধ্বংস না করে, দাবারের জন্য কোনও দিন গণনাও করা হবে, যখন কম্পিউটারগুলি যথেষ্ট পরিমাণে স্মৃতি এবং গতি অর্জনের জন্য যথেষ্ট বিকশিত হয়েছিল। বা আমাদের কিছু কোয়ান্টাম কম্পিউটার রয়েছে ... বা কেউ (গবেষক, দাবা বিশেষজ্ঞ, প্রতিভা) এমন কিছু অ্যালগোরিদম খুঁজে না পাওয়া যায় যা গেমটির জটিলতা উল্লেখযোগ্যভাবে হ্রাস করে। একটি উদাহরণ দিতে: 1 এবং 1000 এর মধ্যে সমস্ত সংখ্যার যোগফল কত? আপনি হয় 1 + 2 + 3 + 4 + 5 ... + 999 + 1000 গণনা করতে পারেন বা আপনি সহজেই গণনা করতে পারেন: এন * (এন + 1) / 2 কে এন = 1000 দিয়ে; ফলাফল = 500500. এখন কল্পনা করুন যে সূত্রটি সম্পর্কে আপনি জানেন না, আপনি গাণিতিক আনয়ন সম্পর্কে জানেন না, আপনি কীভাবে সংখ্যাগুলি যুক্ত করতে বা যুক্ত করবেন তাও জানেন না ... সুতরাং, এটি সম্ভবত একটি অজানা অ্যালগরিদম রয়েছে যা চূড়ান্তভাবে এই গেমটির জটিলতা হ্রাস করে এবং একটি বর্তমান কম্পিউটারের সাথে সেরা পদক্ষেপ গণনা করতে এটি কেবল 5 মিনিট সময় নিতে পারে। আরও কিছু সময় দেওয়া হলেও এটি কলম এবং কাগজযুক্ত মানুষ হিসাবে বা আপনার মনে এমনকি এটি অনুমান করাও সম্ভব।

সুতরাং, দ্রুত উত্তরটি হ'ল: মানবতা যদি দীর্ঘকাল বেঁচে থাকে তবে এটি সময়ের ব্যাপার মাত্র!


0

এটি কেবলমাত্র সমাধানযোগ্য হতে পারে তবে কোনও কিছু আমাকে বিরক্ত করে: পুরো গাছটি যদি পারা যায় তবে প্রতিপক্ষের পরবর্তী পদক্ষেপের পূর্বাভাস দেওয়ার কোনও উপায় নেই। আমাদের অবশ্যই আমাদের পরবর্তী পদক্ষেপটি প্রতিপক্ষের অবস্থার উপর ভিত্তি করে তৈরি করতে হবে এবং "সেরা" পদক্ষেপটি উপলভ্য করতে হবে। তারপরে, পরবর্তী রাষ্ট্রের ভিত্তিতে আমরা আবার এটি করি। সুতরাং, আমাদের সর্বোত্তম পদক্ষেপটি অনুকূল হতে পারে যদি প্রতিপক্ষ একটি নির্দিষ্ট উপায়ে চলে। প্রতিপক্ষের কিছু পদক্ষেপের জন্য আমাদের শেষ পদক্ষেপটি সর্বোত্তম হতে পারে।

আমি কেবল প্রতিটি পদক্ষেপে "নিখুঁত" পদক্ষেপ নিতে পারে তা দেখতে ব্যর্থ হয়েছি।

তার ক্ষেত্রে এটি হওয়ার জন্য, প্রতি রাষ্ট্রের জন্য [বর্তমান খেলায়] গাছটিতে একটি পথ থাকা উচিত যা প্রতিপক্ষের পরবর্তী পদক্ষেপ (টিক-টেক-টু হিসাবে) নির্বিশেষে বিজয়ের দিকে নিয়ে যায় এবং আমার পক্ষে শক্ত সময় যে অনুমান।


5
নিখুঁত পদক্ষেপটি 'মিনিম্যাক্স' কৌশল দ্বারা সিদ্ধান্ত নেওয়া হয়: এটি এমন নড়াচড়া যা আপনার ন্যূনতম সম্ভাব্য স্কোরকে সর্বাধিক করে তোলে (প্রতিপক্ষের দ্বারা চালিত সমস্ত সম্ভাব্য পদক্ষেপের প্রেক্ষিতে)। বা অন্য কোনও উপায়ে বলতে গেলে, এটি ধরে নেয় প্রতিপক্ষও পুরোপুরি খেলে।
নিক জনসন

যদিও এটি একটি আকর্ষণীয় বিষয়। আপনার প্রতিপক্ষ যদি সেরা সম্ভাব্য পদক্ষেপ না নেয় তবে সর্বাধিক সম্ভাব্য পদক্ষেপের প্রতিক্রিয়া আপনাকে অসুবিধে করে ফেলতে পারে এমন পরিস্থিতি তৈরি হতে পারে? এর কী প্রভাব আছে?
নোনা আরবিজ

আমি গণিতজ্ঞ নই এবং খুব ভাল দাবা খেলোয়াড়ও নই; আমি ধরেও নিয়েছিলাম যে তত্ত্বের মধ্যে (পুরো গেম ট্রিটি জানা উচিত) এর উত্তর 'হ্যাঁ'। তবে, এখন আপনি এই সমস্যাটি [অন্য খেলোয়াড়ের পছন্দ] উল্লেখ করেছেন, এর অর্থ কি এই সিস্টেমটি সম্ভাব্যভাবে অনির্দেশ্য? গেমের মিড-পয়েন্ট রয়েছে যেখানে অন্য খেলোয়াড় কোনও অসুবিধা জোর করতে পারে? পার্সপিট্রন (নিউরাল নেট) 'ওআর' এবং 'ওআর' শিখতে পারে তবে 'এক্সওর' কখনই ধরে ফেলতে পারে না এই বিষয়টি কি ঠিক খানিকটা মতো? দাবা কি 'বিশৃঙ্খল' সিস্টেমের উদাহরণ? এফডাব্লুআইডাব্লু, আইএমএইচও আমি মনে করি উত্তরটি এই মুহুর্তে 'ডুনো' বলে মনে হচ্ছে।
মনোজোহনি

@ নোনা সংজ্ঞা অনুসারে, এই পদক্ষেপটি সেরা পদক্ষেপ হবে। কোন অনুমান নেই।
পিক্কলবো

@ পাইকোল্বো: সেরাতম পদক্ষেপগুলির মধ্যে অন্যতম সেরা। দাবাতে এমন পজিশন রয়েছে যেখানে একাধিক চাল চলার ফলে একই ফলাফল হয় (একই সংখ্যাতে চালানো, জয়, ড্র বা ক্ষতি)।
SDwarfs

0

গাণিতিকভাবে, দাবাটি মিনিম্যাক্স অ্যালগরিদম দ্বারা সমাধান করা হয়েছে , যা 1920 এর দশকে ফিরে আসে (হয় বোরেল বা ভন নিউমানের দ্বারা পাওয়া)। সুতরাং, একটি ট্যুরিং মেশিন সত্যই নিখুঁত দাবা খেলতে পারে।

যাইহোক, দাবা এর গণ্য জটিলতা এটিকে ব্যবহারিকভাবে অক্ষম করে তোলে। বর্তমান ইঞ্জিনগুলি বেশ কয়েকটি উন্নতি এবং হিউরিস্টিক্স ব্যবহার করে। শীর্ষস্থানীয় ইঞ্জিনগুলি আজ শক্তিশালী খেলার দিক দিয়ে সেরা মানুষকে ছাড়িয়ে গেছে তবে তারা যে বৌদ্ধিক ব্যবহার করছে তা অসীম সময় দেওয়ার পরে তারা নিখুঁতভাবে খেলতে পারে না (যেমন, হ্যাশের সংঘর্ষের ফলে ভুল ফলাফল হতে পারে)।

নিকটস্থ যে আমরা বর্তমানে নিখুঁত খেলার পরিপ্রেক্ষিতে আছে যুদ্ধের tablebases । এগুলি উত্পন্ন করার জন্য সাধারণ কৌশলটিকে রেট্রোগ্রেড বিশ্লেষণ বলা হয় । বর্তমানে, ছয়টি পিস পর্যন্ত সমস্ত অবস্থানের সমাধান করা হয়েছে।


-1

হ্যাঁ , গণিতে দাবা একটি নির্ধারিত খেলা হিসাবে শ্রেণীবদ্ধ করা হয়, এর অর্থ এটি প্রতিটি প্রথম খেলোয়াড়ের জন্য একটি নিখুঁত অ্যালগরিদম রয়েছে, এটি দাবা দাবা বোর্ডের পক্ষে এমনকি সত্য প্রমাণিত, সুতরাং একদিন সম্ভবত কোয়ান্টাম এআই সঠিক কৌশলটি খুঁজে পাবে, এবং খেলা শেষ

এই ভিডিওতে এটি সম্পর্কে আরও: https://www.youtube.com/watch?v=PN-I6u-AxMg

এছাড়া quantom দাবা, যেখানে গণিত প্রমাণ আছে নির্ধারিত খেলা যে http://store.steampowered.com/app/453870/Quantum_Chess/

এবং সেখানে আপনার কোয়ান্টাম দাবা সম্পর্কে বিশদ ভিডিও রয়েছে https://chess24.com/en/read/news/quantum-chess


-2

অবশ্যই বোর্ডে পিসামের পঞ্চাশ সম্ভাব্য সংমিশ্রণের শক্তি রয়েছে। এটি মনে রেখে, প্রতিটি সংকলনে খেলতে আপনার পঞ্চাশ পদক্ষেপের ক্ষমতার জন্য দশ বছরের কম বয়সী হবে (পুনরাবৃত্তিগুলি সেই সংখ্যাকে 3 দিয়ে গুণ করবে)। সুতরাং, দাবাতে একশ চালের শক্তি দশেরও কম। যারা চেকমেট বাড়ে তাদের কেবল বেছে নিন এবং আপনি যেতে ভাল to


-3

Bit৪ বিট গণিত (= চেসবোর্ড) এবং বিটওয়াইস অপারেটর (= পরবর্তী সম্ভাব্য পদক্ষেপগুলি) আপনার যা প্রয়োজন তা হ'ল। তাই সহজ। ব্রুট ফোর্স সাধারণত সর্বাধিক সেরা উপায়টি খুঁজে পাবেন। অবশ্যই, সমস্ত পদের জন্য কোনও সার্বজনীন অ্যালগরিদম নেই। বাস্তব জীবনে গণনাও সময় সীমিত, সময়সীমা এটি বন্ধ করে দেবে। একটি ভাল দাবা প্রোগ্রামটির অর্থ ভারী কোড (পাস করা, দ্বিগুণ পাউন্ড ইত্যাদি)। ছোট কোড খুব শক্তিশালী হতে পারে না। ডাটাবেসগুলি খোলার এবং শেষের জন্য প্রসেসিংয়ের সময়, এক প্রকার প্রাক প্রসেসড ডেটা বাঁচায়। ডিভাইস, আমি বলতে চাইছি - ওএস, থ্রেডিং সম্ভাবনা, পরিবেশ, হার্ডওয়্যার প্রয়োজনীয়তা সংজ্ঞায়িত করে। প্রোগ্রামিং ভাষা গুরুত্বপূর্ণ। যাইহোক, উন্নয়ন প্রক্রিয়া আকর্ষণীয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.