আমি মনে করি যদি আমি আপনার দ্বিতীয় পয়েন্টটি আলফাজিরো এবং স্টকফিশের মধ্যে গেম 1-তে একটি উদাহরণ পদক্ষেপ সহ বিস্তারিতভাবে বর্ণনা করি যা আজ আমার কৌতূহলকে মেটানোর জন্যও কাজ করেছিল।
1 মিনিট / সরানোর সময়সীমা (কীভাবে এই স্টকফিশের ক্ষতি হবে?)
স্টকফিশের পারফরম্যান্স সময়সীমা এবং হার্ডওয়্যার কনফিগারেশন উভয়েরই উপর নির্ভরশীল , সুতরাং যখন কেউ সিপিইউ থ্রেডকে দ্বিগুণ করে, তখন স্টকফিশের প্রথম কনফিগারেশনের চেয়ে সমাধানটি খুঁজতে কম সময় (প্রয়োজনীয় অর্ধেক নয়) প্রয়োজন।
দাবা.কম-এ পোস্ট করা প্রথম প্রতিবেদনে কেউ দাবি করেছিলেন যে স্টকফিশ অনুকূলভাবে খেলছে না কারণ তিনি একই স্টকফিশটি কম্পিউটারে একই ফলাফল পুনরুত্পাদন করতে পারেননি। তিনি বলেছিলেন যে নীচের অবস্থানে (গেম 1 - মুভ 11) স্টকফিশ কেজি 1-এইচ 1 খেলেছে (এর রাজা স্থানান্তরিত হয়েছে) যা মোটেই কোনও অর্থবোধ করেনি। অন্যদিকে, তার কম্পিউটারের স্টকফিশ Be3 (অন্ধকার বর্গাকার বিশপটি সরান) এর মতো আরও বিকাশশীল পদক্ষেপ দেখিয়েছে, অবস্থানটি দেখতে দিন:
হ্যাঁ, এটি একটি প্যাসিভ পদক্ষেপ ছিল এবং মনে হয় স্টকফিশের আরও উন্নয়নশীল পদক্ষেপ নেওয়া উচিত ছিল। তবে সে ভুল ছিল। কেন? কারণ তিনি স্টকফিশটি 15 সেকেন্ডের জন্য দৌড়েছিলেন এবং যদি তিনি এটি এক ঘন্টা চালাতেন তবে তিনি কেজি 1-এইচ 1 অর্জন করতে পারতেন সেই অবস্থানের সেরা পদক্ষেপ হিসাবে। সম্ভাব্য সমস্ত পদক্ষেপগুলি আরও গভীরতার সাথে বিশ্লেষণ করলে স্টকফিশ তার সিদ্ধান্ত পরিবর্তন করে। আমার উত্তরে আমি মূলত যা বলেছিলাম তা এখানে :
আমি পজিশনে সর্বশেষ স্টকফিশটি চালিয়েছি (১১ পদক্ষেপে):
- প্রথমদিকে, ইঞ্জিনটি প্রায় এক মিনিটের জন্য চলতে থাকলে এটি সর্বোত্তম পদক্ষেপ হিসাবে বি 4 দেয়। এর পরে, এটি সিদ্ধান্ত নেয় বি 3 আরও ভাল।
তবে আমার হার্ডওয়্যারে 5 মিনিটের পরে যা 1,400k নোড / গুলি চালিত হয় এটি Kh1 এর সাথে সর্বোত্তম পদক্ষেপ হিসাবে যাওয়ার সিদ্ধান্ত নেবে।
কাগজে বলা হয়েছে যে স্টকফিশ প্রতি সেকেন্ডে 70০,০০০ কে পজিশন গণনা করে এবং তা প্রতি মিনিটে এক মিনিটের জন্য চালানো হয়, এটি আমার হার্ডওয়ারের চেয়ে প্রায় 50 গুণ বেশি, তাই আমি আমার 50 মিনিটের জন্য চালিয়ে দেব ... কেজি 1-এইচ 1 এখনও আছে স্টকফিশ জন্য পছন্দ।
সময় সীমা কী
উপরের ক্ষেত্রে, স্টকফিশ দু'বার সময় দৌড়ালে সম্ভবত খুব বেশি কিছু যায় আসে না কারণ সিদ্ধান্তটি একই হত, তবে পরবর্তী পদক্ষেপে অবশ্যই তা হবে :
এই অবস্থানে স্টকফিশ বাম দিকে (এ 4-এ 5 ) প্যাঁচকে সরানো বেছে নিয়েছিল । আসুন ধরা যাক আমার কাছে একটি কম্পিউটার রয়েছে যা প্রতি সেকেন্ডে 1,400k নোডের গতিতে স্টকফিশ ইঞ্জিন চালায়, যা বাস্তব গেমের স্টকফিশের চেয়ে প্রায় 50 গুণ কম ( কাগজে লেখা আছে এটি 70,000kn / s)) সুতরাং আমি যদি প্রতি পদক্ষেপে 50 মিনিটের জন্য এটি চালাই তবে আমি গেমটি অনুকরণ করতে পারি। ঠিক আছে.
আমি উপরের অবস্থানের উপর স্টকফিশ বিশ্লেষণ চালিয়েছি এবং আমি নিম্নলিখিত ফলাফল পেয়েছি:
- স্টকফিশ কিছু চালচলনের পরামর্শ দিয়েছিল, তবে আমার কম্পিউটারে 6 মিনিটের পরে ( রিয়েল গেমের স্টকফিশের সাথে 7.2 সেকেন্ডের সাথে মিলে যায়) গেমটি যেমন চলছে তেমন এটি a4-a5 পছন্দ করে ।
এটি ভাল, তবে আমি এই খেলায় স্টকফিশের গণনা পৌঁছাতে পুরো 50 মিনিটের জন্য এটি চালিয়ে রেখেছিলাম যাতে 1 মিনিটের অনুমতি ছিল:
দুঃখজনক সত্যটি আমি বিশ্বাস করি যে সময়সীমার কারণে স্টকফিশ তার সমস্ত গেম হারিয়েছিল। সময় পার হওয়ার সাথে সাথে স্টকফিশ আরও গভীরতর অনুসন্ধান এবং মূল্যায়ন পায় এবং গেমটিতে এটি একটি উদ্বোধনী বই ব্যবহার করার অনুমতি দেয় নি যা এটি অগভীর গভীরতায় বহু পদক্ষেপ বিবেচনা করে। নোট করুন যে আসল খেলায় a4-a5 খেলা হয়েছিল যা দেখায় যে (এটি ধরে নিয়ে যে প্রতি সেকেন্ডে 70 মিলিয়ন অবস্থানের মূল্যায়ন করতে পারে) গেমের স্টকফিশ এই পদক্ষেপে 21.6 সেকেন্ডের বেশি ব্যয় করেনি। অন্যথায়, এটি আসল গেমের অন্য তিনটি পদক্ষেপে তার সিদ্ধান্ত পরিবর্তন করে। এর কারণটি এখনও আমার কাছে স্পষ্ট নয় যেহেতু আমার স্টকফিশটিও কম স্মৃতি গ্রহণ করছিল ( মূল পেপারে উল্লিখিত 1 জিবি তুলনায় র্যামের প্রায় ~ ১৩০ এমবি, এটি ধরে নিচ্ছে যে এটির সবগুলি হ্যাশ টেবিলগুলিতে যায়)।
উপসংহার
স্টকফিশ যে হার্ডওয়্যারটি চালিয়েছিল, আমি উল্লেখ করেছিলাম, আমার বিশ্লেষণ করা চালনার উপর ভিত্তি করে খনি (আপডেট: একটি একক কোর) এর চেয়ে 18 গুণ বেশি দ্রুত ছিল। আমি নিশ্চিত নই যে আলফাজেরো 4 ঘন্টার মধ্যে তার নেটওয়ার্কগুলি প্রশিক্ষণের জন্য এই জাতীয় হার্ডওয়্যারটি সত্যই ব্যবহার করতে পারত, আমি কেবল দাবির মতো গেমের জন্য এটি খুব কম বলে ধরে নিতে পারি। তদতিরিক্ত, আলফাজেরো সেই ঘন্টাগুলি শেখার জন্য ব্যয় করেছিল যার মধ্যে দৃ solid় উদ্বোধনগুলিও অন্তর্ভুক্ত রয়েছে (এবং কাগজটি উল্লেখ করেছে যে নির্দিষ্ট খোলার চেয়ে পছন্দগুলি)। অন্যদিকে, স্টকফিশ খোলার ক্ষেত্রে প্রতিবন্ধী ছিল এবং এটি প্রতিটি পদক্ষেপে 60 সেকেন্ডের জন্য প্রতি সেকেন্ডে 70 মিলিয়ন অবস্থানের মূল্যায়ন করে না।
চূড়ান্ত নোট হিসাবে, আমি যা বলেছি সেগুলি আমার অনুমানের উপর ভিত্তি করে। অবশ্যই, আলফাজিরো এবং গেমগুলির ফলাফল আমার কাছে অত্যন্ত আকর্ষণীয় ছিল। তবে আমি এমন একটি খেলা দেখতে পছন্দ করতাম যেখানে আমার কম্পিউটারেও স্টকফিশের খেলা ঠিক একই রকম হয়। এটি হল, আরও সময় এবং একটি খোলার বই অনুমোদিত। প্রতিটি পদক্ষেপের উপর স্টকফিশ বিশ্লেষণের ফলাফলগুলি পাওয়াও সহজ, এবং আমি আশা করি তারা এটি কতটা কার্যকর করেছে তা প্রদর্শনের জন্য তারা এটি ছেড়ে দেয় release