কম্পিউটারের মতে কোনও দাবা পদক্ষেপ কেন জয়ের সুযোগকে উন্নত করতে পারে?


14

Http://grandchesstour.org/ এ সিনকিফিল্ড কাপটি দেখার সময় , বিভিন্ন পদক্ষেপের চেষ্টা করা সম্ভব হয় এবং আপনার প্রস্তাবিত পদক্ষেপের পরে কম্পিউটার কীভাবে স্থিতির মূল্যায়ন করে তা দেখুন।

এখন, বেশিরভাগ পদক্ষেপগুলি আপনার অবস্থানকে ক্ষতিগ্রস্থ করবে, যদি এটি কম্পিউটারের দ্বারা সেরা পদক্ষেপ হিসাবে বিবেচিত না হয়। তবে কিছু পদক্ষেপের জন্য (বেশিরভাগ সময়) আপনি তাত্ক্ষণিকভাবে জয়ের আরও বর্ধিত সুযোগ পাবেন, সম্ভবত অর্ধ পয়সা সুবিধা। আমি এটি বুঝতে পারি না: যদি কোনও একক পদক্ষেপে খেলোয়াড়দের অবস্থান উল্লেখযোগ্যভাবে উন্নতি করার সম্ভাবনা থাকে, তবে কি এই পদক্ষেপের আগে বর্তমান অবস্থানটিতে ইতিমধ্যে প্রতিফলিত হওয়া উচিত নয়? আমার মনে, কম্পিউটারের সেরা পদক্ষেপ হিসাবে বিবেচিত না হওয়া যে কোনও পদক্ষেপটি প্রতিবন্ধী অবস্থানে নিয়ে যেতে পারে, যখন সেরা পদক্ষেপটি কেবল স্থায়ীভাবে রাখা উচিত, খেলোয়াড়ের অবস্থানের উন্নতি না করেই। কারণ, কম্পিউটার যদি জানে যে এই পদক্ষেপটি খেলোয়াড়দের অবস্থার উন্নতি করতে পারে, তবে এটি ইতিমধ্যে বর্তমান অবস্থানে থাকা প্লেয়ারদের অবস্থার উন্নতি করে বলা উচিত যে "সেরা খেলার সাথে, আপনি অর্ধশত ভাগ হয়ে আছেন"?

হুম, বা সম্ভবত এটি কীভাবে গ্র্যান্ডচ্যাস্টার.অর্গ.org এ ওয়েবসাইটটি প্রয়োগ করা হয় তার একটি ফলাফল?


4
কিছু ক্ষেত্রে, ইঞ্জিনগুলির সঠিক পদক্ষেপটি খুঁজে পেতে সমস্যা হয় তবে আপনি ম্যানুয়ালি প্রবেশ করার পরে এটি সঠিকভাবে মূল্যায়ন করে। এটি যদিও আপনি বর্ণনা করছেন তেমন সাধারণ নয়।
11684

উত্তর:


26

কম্পিউটারটি খেলার শেষে প্রতিটি পংক্তির মূল্যায়ন করতে সক্ষম হলে, মূল্যায়ন কখনই বদলাতে পারে না। প্রকৃতপক্ষে, প্রতিটি পদক্ষেপের মূল্যায়ন হয় "জয়", "হারা" বা "ড্র" হবে। এন্ডগেম টেবিলবেসে মূলত এটি ঘটে happens * যদি কম্পিউটারগুলি প্রতিটি পজিশনের জন্য এটি করতে পারে তবে কম্পিউটারের বিরুদ্ধে প্রতিটি খেলা কম্পিউটারের সমন্বয়ে গঠিত হয় পদক্ষেপ না নিয়েই পদত্যাগ করে, আপনাকে প্রাথমিক অবস্থানে একটি ড্র প্রদান করে বা বিরক্ত হয় যে আপনি পদত্যাগ করেন নি বা সেই ড্রয়ের প্রস্তাবটি স্বীকার করেন নি।

যাইহোক, কম্পিউটারগুলি এতদূর মূল্যায়ন করতে পারে না কারণ এটি অসম্ভব দীর্ঘ সময় নিতে পারে, উভয়ই কারণ গেমগুলি দীর্ঘ দীর্ঘ হতে পারে (নীতিগতভাবে শত শত চাল) এবং প্রতিটি পদক্ষেপে অনেকগুলি সম্ভাবনা রয়েছে বলে। সুতরাং, কম্পিউটারগুলিকে বেশ কয়েকটি শর্টকাট নিতে হবে। এর মধ্যে সর্বাধিক গুরুত্বপূর্ণ প্রার্থী পদক্ষেপগুলি কী তাড়াতাড়ি বের করার চেষ্টা করার চেষ্টা করা হয়েছে (একটি সুরক্ষিত টুকরো নেওয়া সম্ভবত একটি দুর্দান্ত পদক্ষেপ; আপনার রানিকে ঝুলানো সম্ভবত একটি ভয়াবহ পদক্ষেপ; ...) এবং বেশ কয়েকটি পদক্ষেপের পরে অনুসন্ধান বন্ধ করে কিছু হিউরিস্টিকস ব্যবহার করে পরিবর্তে আরও অনুসন্ধানের পরিবর্তে ফলাফলটি দেখতে ভাল লাগছে কি না তা সনাক্ত করার চেষ্টা করুন।

সমস্যাটি হ'ল এই শর্টকাটগুলি ভুল হতে পারে। কম্পিউটার সম্ভবত সিদ্ধান্ত নিতে পারে যে কোনও টুকরোগুলি ঝুলানো খারাপ it's এটি স্থির করতে পারে যে কোনও অবস্থান যখন সত্যই এটি হয় না তখন স্থিতিশীল হয়। কোনও নির্দিষ্ট পদক্ষেপের আসল পয়েন্টটি দেখার জন্য ভবিষ্যতে এতদূর পর্যন্ত দেখার যথেষ্ট ক্ষমতা নাও থাকতে পারে।

এখানে একটি সহজ উদাহরণ, যদিও এটি আর খুব বাস্তববাদী নয়। মনে করুন আপনি আমাকে চেক করতে চলেছেন তবে আমি আপনাকে বিলম্ব করতে পারে এমন দশটি চেকের সিরিজ রয়েছে। যদি আমি কেবল দশটি চাল আগেই দেখে থাকি তবে আমি মনে করি আমি ঠিক করছি: সম্ভবত আমি এমনকি একটি তড়িঘড়িও রয়েছি, তাই আমার মূল্যায়নটি "দশটি চালানোর পরেও, আমি এখনও একটি তড়িঘড়ি আপ, তাই আমি ভাল । স্কোর +1 "আমি আমার প্রথম চেকটি খেলি, আপনি প্রতিক্রিয়া জানালেন এবং এখন দেখছি এটি দশজনের মধ্যে সঙ্গী হয়ে পদত্যাগ করেছে। এটি তথাকথিত "দিগন্তের প্রভাব" যা আধুনিক প্রোগ্রামগুলি এড়াতে চেষ্টা করে (উদাহরণস্বরূপ, অনেকগুলি বাধ্যতামূলক পদক্ষেপ রয়েছে এমন রেখাগুলি আরও গভীরভাবে দেখে) তবে এটি সাধারণ নীতিটি চিত্রিত করে।

ইঞ্জিন যদি দেখতে পায়, বলুন, ভবিষ্যতে দশটি পদক্ষেপ নিয়ে যায়, তবে প্রতিটি পদক্ষেপটি তৈরি হওয়ার সাথে সাথে এটি খেলাটিকে আরও দূরে দেখছে। প্রারম্ভিক অবস্থানে, এটি বোর্ড 10 পদক্ষেপের মতো দেখতে দেখতে পারে; এক সরানোর পরে, এটি 11 এবং আরও কিছু সরানো দেখতে পাবে। (আবার এটি একটি সরলকরণ, যেহেতু কম্পিউটারগুলি আজকাল ভবিষ্যতের জন্য একটি নির্দিষ্ট দূরত্ব দেখায় না, তবে এটি আপনাকে সাধারণ ধারণা দেয়))

আপনি যে উদাহরণটি দিয়েছেন তা হ'ল আমি যে উদাহরণ দিয়েছি তার একটি কম নাটকীয় সংস্করণ। আরও নড়াচড়া করার সাথে সাথে কম্পিউটারটি গেমের আরও গভীরতর দিকে দেখতে পারে, সুতরাং এটি আরও সঠিক মূল্যায়ন দিতে পারে। এটি দেখার আরও একটি উপায় তথ্যের শর্তাবলী: আরও চাল চলার সাথে সাথে কম্পিউটারে আরও তথ্য রয়েছে। এটি আগে অনুমান করত যে আপনার 1.e4 এর প্রতিক্রিয়া কী হবে তবে এখন আপনি জানেন যে আপনি সিসিলিয়ান খেলেছেন, ইত্যাদি।


* এখানে একটি সামান্য উপকার আছে যে আপনাকে পুনরাবৃত্তি পজিশনগুলি এড়াতে আপনার আসলে জয়ের গতি সংখ্যার গণনা করতে হবে। উদাহরণস্বরূপ, কে কিউ বনাম কে এর শেষের দিকটি বিবেচনা করুন Every প্রতি পদক্ষেপ যা রানী জয়ের অচলতা বা আত্মসমর্পণ করে না, তাই কেবল এলোমেলোভাবে চলা এবং বলার অপেক্ষা রাখে না যে আপনার চেকমেটের দিকে যাত্রা করার জন্য একটি ব্যবস্থা দরকার, "বাহ, আমি পুরোপুরি যাচ্ছি এটি জিততে - প্রায় প্রতিটি পদক্ষেপে জয়ী হয়! "


দুর্দান্ত উত্তর! আমি কখনই সেই "দিগন্তের প্রভাব" এর কথা শুনিনি, প্রচুর অর্থবোধ তৈরি করেছি, খুব আকর্ষণীয়।
পেড্রো এ

স্পষ্টতার জন্য ধন্যবাদ। আমি বেশিরভাগই একটি পদক্ষেপের বৃহত প্রভাব সম্পর্কে ধোঁয়াশায় আছি, তবে আমি অনুমান করি যে কম্পিউটারটি কম্পিউটারে বিশ্লেষণ করার অনুমতি দেওয়ার সময় প্রশ্নবিদ্ধ ওয়েবসাইটটিতে যথেষ্ট সীমাবদ্ধ, প্রভাবটি আরও বড় করে তোলে।
jonasfh

4

কোনও অসঙ্গতি নেই। আপনি যখন কোনও পদক্ষেপ নেন, কম্পিউটারের আর আর পূর্ববর্তী অবস্থানটি অনুসন্ধান করতে হয় না। এটি এখন সমস্ত প্রসেসিং পাওয়ারকে নতুন অবস্থানে ফোকাস করতে পারে এবং সুতরাং মূল্যায়ন পরিবর্তন হতে পারে। গেম ট্রি খুব আলাদা হতে পারে।

এটি ঠিক যেভাবে আমরা দাবা খেলি like


4
আপনি এটি যোগ করতে পারেন যে অনলাইন দাবা ইঞ্জিনটি গভীরভাবে শুরু করতে অনেকগুলি চলা বিশ্লেষণ করছে না তাই বাড়তি প্লাইটি ঘরে বসে আপনার কম্পিউটারের চেয়ে অনেক বেশি তাৎপর্যপূর্ণ।
ব্রায়ান টাওয়ারস

হুঁ, আমি একরকম একমত তবুও, আমি আগ্রহী যে একক পদক্ষেপের জন্য এফেক্টটি এত বড়। আমি অনুমান করব যে কম্পিউটার প্রতিটি পরবর্তী পদক্ষেপের জন্য, বিশেষত প্রতিশ্রুতিবদ্ধদের জন্য যথেষ্ট তাৎপর্যপূর্ণ বিশ্লেষণ করে এবং এটি আবিষ্কার করা উচিত যে কোনও সম্ভাব্য পদক্ষেপের একটি আরও উন্নত অবস্থান দেবে এবং সে অনুযায়ী বর্তমান অবস্থানকে সামঞ্জস্য করবে কিনা। তবে আমি ব্রায়ানের মন্তব্য দেখতে পাচ্ছি যা অবশ্যই এখানে গুরুত্বপূর্ণ।
jonasfh
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.