কম্পিউটার মূল্যায়ন: তারা কতটা বিশ্বাসযোগ্য?


14

Rybka সহ ফ্রিটজ 12 আমার এক বন্ধুকে এই শেষের অবস্থানটিতে সাদাের জন্য +3 মূল্যায়ন দিয়েছে ,

সাদা সরানো

যা একটি ড্র হতে পরিণত। তবে আমি শুনেছি যে কম্পিউটার থেকে +3 মানে নিখুঁত প্লে সহ গ্যারান্টিযুক্ত জয়। আমি কি শুধু ভুল শুনেছি? কম্পিউটার মূল্যায়নের সাধারণভাবে কীভাবে ব্যাখ্যা করা উচিত? <.5 এর ওপেনিং সুবিধার অর্থ কী?


3
আমি "গ্যারান্টিযুক্ত জয়" মন্তব্যটিকে চ্যালেঞ্জ জানাব। মূল্যায়ন নম্বরটি হিউরিস্টিক সূচক, মূলত কম্পিউটারের অবস্থানের জন্য একটি "অনুভূতি" রয়েছে। এন্ডগেমগুলির "বিস্ময়কর" ফলাফল হতে পারে এবং কম্পিউটারটি সম্ভাব্য সমস্ত নিদর্শনগুলি সনাক্ত করার জন্য প্রোগ্রাম করা না হলে (বা এটি সমস্ত উপায়ে গণনা করতে পারে), এটি কিছু মিস করবে। এটি অন্যভাবে দেখার জন্য, যদি +3 সত্যিই গ্যারান্টিযুক্ত হয় তবে এটি +3 হবে না, এটি + অনন্ত হবে।
ড্যানিয়েল বি

রেকর্ডের জন্য, আমি লিকহেস 7-পিস টেবিলবেসগুলির সাথে এটি পরীক্ষা করেছি এবং এটি অবশ্যই একটি ড্র।
ফিশমাস্টার

উত্তর:


8

এখানে বেশ কয়েকটি জিনিস রয়েছে।

প্রথমত, প্রতিটি প্রোগ্রামের অবস্থানগুলি মূল্যায়নের নিজস্ব পদ্ধতি রয়েছে যাতে স্কোরগুলি সরাসরি তুলনা করা যায় না। উদাহরণস্বরূপ, আমি সম্প্রতি রাইবকার বিপক্ষে স্টক ফিশ চালাচ্ছিলাম এবং স্টকফিশের স্কোর রাইবকার তুলনায় দ্বিগুণ ছিল। আমি এতে অবাক হয়েছি, তবে এটি খুব পরিষ্কার যে 1 এর স্কোরটি সর্বদা "1 পয়সা" বোঝায় না। আমি মনে করি আমাদের কী তাকানো উচিত তা হল স্কোরটি কীভাবে পরিবর্তিত হয়। আমি গতকাল আরও একটি কৌতূহল দেখেছি (আপনার অন্যান্য প্রশ্নের কোনও উত্তর দেওয়ার সময়, কাকতালীয়ভাবে) স্টকফিশের মূল্যায়ন অ্যালগরিদম বিজোড় সংখ্যা খুব বেশি পছন্দ করে না। আসলে বেশিরভাগ স্কোর ছিল .04 এর গুণক। মানটির পরিমাণটি নির্বিচারে দেওয়া হয়ে থাকে, আমি কোনও নির্দিষ্ট মান মানে "নিশ্চিত জয়" ধরে নিব না যতক্ষণ না মেশিন দাবি করে যে এটি সাথীর সন্ধান পেয়েছে।

দ্বিতীয়ত, শেষ গেমের টেবিলগুলি তৈরি করা হয়েছিল কারণ শেষ গেমগুলি সমাধান করার জন্য অনুসন্ধানের গভীরতার অনেক প্রয়োজন। টুর্নামেন্টের গতিতে খেলা কম্পিউটারগুলি কেবল এটি ভাল করে না। আমি কিছুদিন আগে একটি ভিন্ন গেমের মধ্য দিয়ে কাজ করছি এবং এই সাইটে ঘোষণা দিয়েছিলাম যে এক পক্ষের একটি সুবিধা ছিল। এড কোনও টেবিলবেস ব্যবহার করে দেখিয়েছিলেন যে কোনও অবস্থানে রহস্য নেই - এটি তাত্ত্বিকভাবে অঙ্কিত হয়েছিল। অবশ্যই, নিখুঁত-প্লে-ড্র এবং ড্রয়ের মধ্যে একটি বিশাল পার্থক্য রয়েছে; খেলোয়াড়দের সঠিক পদক্ষেপগুলি খুঁজে পেতে হবে।


গেমটির প্রথম পর্যায়ে সাধারণত হোয়াইটকে দেওয়া ছোট মানটির অর্থ হ'ল সাদা আরও মূল্যবান রিয়েল এস্টেট দাবি করতে পারে। উদাহরণস্বরূপ, পদক্ষেপ 1 এ, হোয়াইট ই 4 দাবি করতে পারে এবং ই 5 এবং এফ 5 আক্রমণ করতে পারে। কালো পাল্টা দিতে পারে। তবে তারপরে হোয়াইট এনসি 3 খেলতে এবং আক্রমণ / বলস্টার এ 4, বি 5, ডি 5 এবং ই 4 খেলতে পারে। তবে ব্ল্যাক কাউন্টার করতে পারে। সুতরাং এটি খুব সামান্য মানে।


অবশেষে, আপনার সাবজেক্ট লাইনে প্রশ্নের উত্তর দেওয়ার জন্য - মূল্যায়নগুলি খুব বিশ্বাসযোগ্য কারণ সেগুলি শক্ত তথ্য এবং একটি চিত্তাকর্ষক অনুসন্ধান গভীরতার উপর ভিত্তি করে। অবশ্যই, মেশিনগুলি অপরিবর্তনীয় নয়। তবে আমাদের খ-খেলোয়াড়দের অবশ্যই স্মরণ রাখতে হবে যে স্টকফিশ (বা রাইবকা) জিএম শক্তিতে সামান্য হার্ডওয়্যারে খেলেন। সেরা সাধারণ হার্ডওয়্যার-এ, তারা তাদের রেটিং FIDE 3200 এ অনুমান করে This এটি এত বেশি যে কেবল সেরা মানবেরা না হারানোর সামান্য সুযোগ পান।

এর অর্থ কী তা বিবেচনা করুন; আমার (ইউএসসিএফ 1650-ইশ) কোনও ব্যক্তির বিরুদ্ধে কোনও সুযোগ নেই (বলুন, ইউএসসিএফ 2050) যার কোনও ব্যক্তির বিরুদ্ধে কোনও সুযোগ নেই (বলুন, ইউএসসিএফ 2450) যার কোনও ব্যক্তির বিরুদ্ধে কোনও সুযোগ নেই (বলুন, ইউএসসিএফ 2850) যার স্লিভার রয়েছে একটি শীর্ষ ফ্লাইট বাণিজ্যিক প্রোগ্রামের বিরুদ্ধে একটি সুযোগ (FIDE 3200)।

সুতরাং, যখন স্টকফিশ বলে যে একটি পদক্ষেপ অন্যের চেয়ে ভাল, আমি সাধারণত এটি মুখের মানকে নিয়ে যাই। যখন আমি এন্ডেগেম টেবিলগুলি হুক করি তখন এই জিনিসটি সাথ-ইন -30-র ঘোষণা করা শুরু করবে, লোল।


1
খুব সুন্দর প্রতিক্রিয়া। আমি সর্বদা ভেবেছিলাম যে 1 এর মূল্যায়নের অর্থ 1 পয়সা মূল্যমানের উপাদান। এছাড়াও, চেস্টেম্পো বলেছে যে এর সমস্যাগুলির মধ্যে সেরা পদক্ষেপগুলি হ'ল যা কমপক্ষে 2 পাউন্ড মূল্যের উপাদান জিতবে, তাই আমি কোনও গেমের পর্যায়ে নির্বিশেষে +2 বা তারও বেশি ইঞ্জিন মূল্যায়ন বিবেচনা করেছি। তবে, আমি স্টকফিশের বিশ্লেষণটি এর আগেও ত্রুটিযুক্ত বলে খুঁজে পেয়েছি এবং দেখেছি কীভাবে এটি এন্ডগেমগুলি সঠিকভাবে মূল্যায়ন করতে ব্যর্থ হয়। এই নোটটিতে, আপনি কি জানেন যে আমি এন্ডগেমগুলির একটি টেবিলবেস কোথায় খুঁজে পাব?
chubbycantorset

এখানে অনলাইন 6-লোকের টেবিলবেস
টনি এনিস


14

বিভিন্ন ইঞ্জিনের সংখ্যাসূচক মূল্যায়নের জন্য বিভিন্ন "স্কেল" রয়েছে। উদাহরণস্বরূপ, প্রচুর খেলার বামের সাথে একটি সাধারণ মিডলগেম পজিশনে, যখন হৌদিনি +2.00 বা আরও ভাল বলে, হোয়াইটের একটি জয়ের সুবিধা রয়েছে (যদিও এখানে আমি কোনও কারণে যোগ্যতা অন্তর্ভুক্ত করেছি) এটি খুব সম্ভবত। তবে বিবেচনা করুন: একজন হউদিনির উত্স কোডটি সংশোধন করতে পারে এবং মূল্যায়নের সাথে জড়িত সমস্ত সংখ্যার পরম মানের দ্বিগুণ করতে পারে; এক অভিন্ন শক্তির একটি ইঞ্জিন পায় যা অভিন্ন খেলা তৈরি করে, তবে এখন +4.00 অর্থ +2.00 এর অর্থ কী। এটি চিত্রিত করে যে ইঞ্জিনগুলির মধ্যে সাধারণত কোনও অভিন্ন সংখ্যার প্রান্তিকের আশা করা উচিত নয় যা সাধারণত একটি বিজয়ী সুবিধা নির্দেশ করে।

এর চেয়েও বেশি, তবে এটি বোঝা গুরুত্বপূর্ণ যে কোনও অবস্থানের সংখ্যার ইঞ্জিন মূল্যায়ন (অনিবার্য সাথীর প্রকাশ্য বিপরীত হিসাবে) কখনও কোনও একক, নির্দিষ্ট ইঞ্জিনের জন্য "বিজয়ী গেম" তে কঠোরভাবে অনুবাদ করে না । একটি মূল বিষয় হ'ল সংখ্যার মূল্যায়নের বিস্তৃত দাবা শব্দের কোনও স্পষ্ট-কাট "অর্থ" নেই, বরং এটি বোধগম্য চিন্তাধারার বিকল্প মাত্র যা কোনও ইঞ্জিনকে যান্ত্রিকভাবে সাধারণভাবে আকাঙ্ক্ষিত ফলাফলের দিকে পরিচালিত করতে প্রভাবিত করে যা প্রতিটি পয়েন্টে এটি নির্বাচিত করে তা প্রভাবিত করে are খেলা; এই আলোকে, কোনও ইঞ্জিনের খেলার ক্ষেত্রে চূড়ান্তভাবে গুরুত্বপূর্ণটি হ'ল পরম মান সম্পর্কে কিছুই না করে সম্ভাব্য পদক্ষেপের জন্য নির্ধারিত মূল্যায়নের পার্থক্য isজড়িত। সংখ্যাগুলি ইঞ্জিনের জন্য নিজেই দরকারী, যার একটির উপরের দিকে চলাচল করার সিদ্ধান্ত নেওয়ার জন্য কংক্রিটের কিছু প্রয়োজন, তবে আমাদের মানবেরা "+ এক্স" এর মত চিন্তাগুলির সাথে জড়িত তাত্পর্যগুলির আরও অর্থ পড়তে খুব দ্রুত হওয়া উচিত নয় means একটি জয়। "

বিশেষত, আরও এবং আরও আমরা মিডল গেমের বিপরীতে এন্ডগেমের দিকে যাই, জয়ের পক্ষে যথেষ্ট একটি নির্দিষ্ট প্রান্তিকতা সম্পর্কে আমরা থাম্বের নিয়মটি যত কম ব্যবহার করতে পারি (উপরের মিডল গেমগুলিতে হুদিনির জন্য আমার +2.00 এর মতো)। এর অন্যতম মূল কারণ ইঞ্জিনগুলি দুর্গগুলি স্বীকৃতি দেওয়ার অসুবিধা হ'ল যেখানে অতিরিক্ত পরিমাণে অতিরিক্ত পরিমাণে এখনও জয়ের পক্ষে যথেষ্ট নয়। উদাহরণস্বরূপ, আমি যখন স্টকফিশকে এই অবস্থানটি খাওয়াই,

এনএন - এনএন

কয়েক মিনিট ভাবার পরে এটি প্রায় +7.00 মূল্যায়ন করছে এবং একটি সাধারণ অবস্থানে, যখন স্টকফিশ বলে যে, আপনার হাতে অবশ্যই জয় আছে। তা সত্ত্বেও, এটি একটি ডেড ড্র এবং কোনও মানুষ সহজেই বুঝতে পারে যে কৃষ্ণ মাত্র f6 এবং h6 এর মধ্যে নূতন স্থানটি পরিবর্তন করতে পারে এবং তাই (1) এইচ-প্যাডটি অকেজো, এবং (২) সাদা রাজা কখনও সাদা রানির আক্রমণে সহায়তা করতে সক্ষম হবেন না। অবশেষে , স্টকফিশটি এখানেও একটি অঙ্কনটি স্বীকৃতি দেবে, একবার এটি 50 টি মুভের বিরুদ্ধে দাঁড়ায়, বলুন বা অবশেষে চেষ্টা করার জন্য বিভিন্ন পদক্ষেপের বাইরে চলে যায় এবং শেষ পর্যন্ত কোনও পুনরাবৃত্তি এড়াতে পারে না, তবে এই ঘটনাগুলি অনুসন্ধানের গভীরতার লাইনের নিচে।

আপনার আগের প্রশ্নটি থেকে শেষের অবস্থানটি যা আপনি সংযুক্ত করেছেন এই ধরণের দুর্গের সাথে সমান, এতে অতিরিক্ত সংযুক্ত মন্ত্রীদের কাছে হোয়াইটের রয়েছে সুন্দর এবং সব কিছু, তবে শেষ পর্যন্ত সেই অবস্থানে জয়ের পক্ষে যথেষ্ট নয়। যদি কোনও ইঞ্জিন টেবিলবেজে থাকা তথ্য হিসাবে যথেষ্ট পরিমাণের জন্য পর্যাপ্ত পরিমাণ গণনা করে, তবে এর মূল্যায়নটি 0 এ নেমে আসবে তবে এর মধ্যে, এর মূল্যায়ন অ্যালগরিদমকে এর জন্য + দেওয়ার চেয়ে আরও ভাল কিছু দেওয়া উচিত নয় অতিরিক্ত উপাদান (এটি এখনও জানেন না যে অর্থহীন)।


+1 এর জন্য "তবে এর চেয়েও গুরুত্বপূর্ণ এটি বোঝা গুরুত্বপূর্ণ যে কোনও অবস্থানের সংখ্যার ইঞ্জিন মূল্যায়ন (অনিবার্য সাথীর সম্পূর্ণ ঘোষণার বিপরীতে) কখনই কোনও জয়ের গেমটিতে অনুবাদ করে না"
ফেরিট

8

আমি মনে করি এই চিত্রটি পরিস্থিতিটি বেশ ভালভাবে বর্ণনা করেছে। এটি 400k গেমস থেকে তৈরি করা হয়েছিল এবং কেবল প্লেইন টুকরোগুলি বিবেচনা করে।

বিজয় সম্ভাবনা / বন্ধন সুবিধা

উত্স: বন্ধকী অ্যাডভান্টেজ, উইন পার্সেন্টেজ এবং ইএলও


1
দুর্দান্ত অবদান! +1 টি
ferit

@ থমাস আহলে: গ্রাফটি আকর্ষণীয়। তবে মূল নিবন্ধটি আর উপলভ্য নয়, উইকিস্পেসের লিঙ্কটি দুঃখজনকভাবে নীচে নেমে গেছে। আপনি ডাব্লু = উইন সম্ভাবনার সঠিক অর্থটি মনে রেখেছেন? এটি কি জয় বনাম ড্র উপেক্ষা করে হেরে গেল? নাকি ড্রগুলি আমলে নিয়ে "প্রত্যাশিত স্কোর" ছিল?
ডায়ারডশ

@ ডায়ারডশ আমি লিঙ্কটি আপডেট করেছি
টমাস আহলে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.