স্টকফিশের বিপক্ষে আলফাজিরোর জয়ে দাবা বিশেষজ্ঞরা কেন অবাক হয়েছিলেন?

10

সম্প্রতি এটি আমার নজরে আনা হয়েছিল যে দাবা বিশেষজ্ঞরা এই বিখ্যাত ম্যাচের ফলাফলকে হতাশার কারণ হিসাবে গ্রহণ করেছিলেন।

দেখুন: দাবার নতুন সেরা খেলোয়াড় হলেন এক নির্ভীক, স্বশবকলিং অ্যালগরিদম

দাবা এবং দাবা এআইয়ের অ-বিশেষজ্ঞ হিসাবে, আমার ধারণাটি ছিল আলফাগোয়ের পারফরম্যান্সের ভিত্তিতে এবং মিশ্রিত গেমগুলির ক্ষেত্রে এই জাতীয় পদ্ধতির বৈধতা অনুসারে, পুরানো এআইয়ের কোনও সুযোগ থাকবে না।

আলফাজিরোর জয়ের বিস্ময় কেন?

chess alphazero

— ডিউকঝৌ
সূত্র

14

ভাল প্রশ্ন.

প্রথম এবং সর্বাগ্রে হ'ল গো ডিপ মাইন্ডে চ্যালেঞ্জ জানাতে কোনও অতিমানবিক প্রতিপক্ষ ছিল না। গো ইঞ্জিনগুলি শীর্ষ মানব খেলোয়াড়দের সর্বোচ্চ স্তরের কাছাকাছি কোথাও ছিল না। দাবাতে, তবে ইঞ্জিনগুলি শীর্ষস্থানীয় মানব খেলোয়াড়ের চেয়ে 500 টি ইএলও পয়েন্ট শক্তিশালী। এটি একটি বিশাল পার্থক্য। সমসাময়িক দাবা ইঞ্জিনগুলিতে যে পরিমাণ কাজ হয়েছে তা বিস্ময়কর। আমরা প্রোগ্রামিংয়ে কয়েক ঘন্টা, কয়েক হাজার পুনরাবৃত্তির কথা বলছি। এটি জ্ঞান এবং কাজের একটি বৃহত সংস্থা। 4 ঘন্টা এর মধ্যে সমস্ত অতিক্রম এবং অতিক্রম করা বিস্ময়কর।

দ্বিতীয়ত এটি খুব বেশি ফলস্বরূপ নয় যা দাবা মাস্টারদের জন্য আশ্চর্যজনক নয় বরং এর পরিবর্তে এটি কীভাবে আলফাজেরো দাবা খেলেন। এটি অত্যন্ত বিদ্রূপজনক যে একটি সিস্টেম যা মানুষের জ্ঞান বা দক্ষতা ছিল না আমাদের মতোই সবচেয়ে বেশি অভিনয় করে। ইঞ্জিনগুলি কুৎসিত চেহারার চালগুলি খেলার জন্য কুখ্যাতিযুক্ত, যেগুলির মধ্যে সম্প্রীতির অভাব রয়েছে ইত্যাদি নন-দাবা খেলোয়াড়কে বোঝানো কঠিন তবে সমসাময়িক ইঞ্জিনগুলির মতো প্রায়শই একটি "কৃত্রিম পদক্ষেপ" বলে কিছু আসে। আলফাজিরো মোটেও এইভাবে খেলে না। এটির মতো মানুষের মতো স্টাইল রয়েছে যেখানে এটি প্রতিপক্ষের টুকরোকে গভীর কৌশলগত খেলা এবং অত্যাশ্চর্য অবস্থানের ত্যাগের সাথে প্রাধান্য দেয়। ইঞ্জিন গণনার যথাযথতার সাথে গভীর অবস্থানগত বোঝার সমন্বয় করে আলফাফেরো আমরা যেভাবে আকাঙ্ক্ষিত সেভাবে অভিনয় করে।

ওহ সম্পাদনা করুন এবং আমি ফলাফল সম্পর্কে নিজেই কিছু উল্লেখ করতে ভুলে গেছি। আপনি যদি কম্পিউটার দাবা সাথে পরিচিত না হন তবে এটি অচল মনে হবে না তবে এটি is

আজকাল শীর্ষে সমসাময়িক ইঞ্জিনগুলিকে পৃথককারী বিজয়ের মার্জিনগুলি ক্ষুরের পাতলা। একটি 100 গেমের ম্যাচে আপনি আরও ভাল ইঞ্জিন নির্ধারণের জন্য 85 গেমস ড্র, 9 টি বিজয় এবং 6 টির মতো ফলাফল দেখার আশা করতে পারেন।

আলফাজিরো 28 জিতেছে এবং শূন্যের ক্ষতি সহ 72 টি ড্র করে বিশ্বজুড়ে নিষ্পেষণ করা হয়েছিল এবং এটি ঘটে যাওয়া মুহুর্ত পর্যন্ত সম্পূর্ণ কল্পনাতীত ছিল।

— ক্রিস ডি
সূত্র

চমৎকার উত্তর. এআই এর পুনরায় দাবা এর মধ্যে তুলনা সম্পর্কে আপনার বক্তব্য দাবা 'লুপনেস এবং উইন / লস / ড্র ট্রাইডের উপর ভিত্তি করে সীমাবদ্ধতার ক্ষেত্রে আকর্ষণীয়। (সম্ভবত, ভবিষ্যতে, আমাদের সীমাবদ্ধ, অবিচলিত গেমগুলির প্রয়োজন হবে যা ফলাফলের ক্ষেত্রে আরও দানাদার বিশ্লেষণের অনুমতি দেয়।) আমি দাবা ইঞ্জিনগুলির ইতিহাস এবং প্রচুর পরিশ্রম এবং মানব জ্ঞানের সাথে পরিচিত যা তাদের মধ্যে গিয়েছিল তবে সাফল্যের অভাবের প্রসঙ্গে পুনরায়: আরও জটিল 19x19 গোয়ের আমার বিপরীত প্রভাব ছিল।

— ডিউকঝৌ

বিশেষত, আমার ধারণাটি ছিল যে আলফাগো যদি উল্লেখযোগ্যভাবে আরও জটিল খেলায় শীর্ষ মানুষকে পরাজিত করতে পারে, তবে এটি যুক্তিসঙ্গত বলে মনে হয়েছিল যে এটি কেবল শীর্ষ মানুষকেই নয়, অন্য কোনও খেলায় শীর্ষের এআইদেরও পরাজিত করবে।

— ডিউকঝৌ

কৃত্রিম পদক্ষেপ সম্পর্কে বিটটি বেশ গুরুত্বপূর্ণ এবং এমন কিছু নয় যা আমি নন-দাবা খেলোয়াড়দের নিয়ে কথা বলতে দেখেছি। +1

— স্টেলা বিডারম্যান

4

দাবাতে এমসিটিএস সাহিত্যে সামান্য সাফল্যের সাথে চেষ্টা করা হয়েছিল। ধারণা করা হয়েছিল আলফাগোর দৃষ্টিভঙ্গি কখনও দাবাতে কাজ করবে না , হতে পারে গোতেও কিন্তু দাবাতে নয়। হঠাৎ গুগল ঘোষণা করেছিল যে এই পদ্ধতিটি কাজ করছে এবং এটি বিশ্বের সবচেয়ে শক্তিশালী দাবা প্রোগ্রামকে খুব স্বল্পতম ব্যবধানে পরাজিত করছে।

গুগলের আগে, সমস্ত দাবা প্রোগ্রামারদের ইঞ্জিন প্রোগ্রামিংয়ে কারুটিং হুরিস্টিক শেখানো হত মেশিন লার্নিংয়ের চেয়ে ভাল কৌশল। আপনি কীভাবে নিউরাল নেটওয়ার্কগুলি প্রয়োগ করেছেন তা বিবেচনাধীন, এটি 64৪-বিট বিটবোর্ড নির্দেশাবলীর একগুচ্ছের চেয়ে দ্রুত কখনই দৌড়াতে পারত না। আলফাগো বেশ ধীর গতিতে চলছিল , তবে এটি শক্তিশালী দাবা খেলেছে।

— ওহে বিশ্ব
সূত্র

2

আমি দেখতে পাচ্ছি, আপনি যে নিবন্ধগুলি সরবরাহ করেছেন তার উপর ভিত্তি করে, জয়ের ক্ষেত্রে অনেক স্তরের বিস্ময়:

দাবা মাস্টার্সের পক্ষে শক্ত খেলা এবং পাল্টা অংশে বিশ্বের সেরা অনুশীলন ছিল, আলফাজিরোতে তাবুল রস ছিল।

শিখতে চার ঘন্টা সময় লেগেছিল এবং আলফাজিরো 100 টির কোনও ম্যাচই হারাতে পারেনি।

খেলার শৈলী হ'ল চালানো, আক্রমণাত্মক এবং কিছু সময় বোকামির মতো বলিষ্ঠ মনে হয়েছিল এমন কোনও পরকীয়া মিশ্রণ ছিল যাঁর কোনও ধারণা নেই তবে তারা ভবিষ্যতের অবস্থা আরও দৃ strong় করে তুলছে।

প্রতি পদক্ষেপে অ্যাকাউন্টে নেওয়া সম্ভাবনার পরিমাণগুলি পাল্টা অংশের চেয়ে কম ছিল, আলফাজেরোর একটি রহস্যজনক অন্ত্র অনুভূতি বা অন্তর্দৃষ্টি ছিল।

আলফা জেরো নিজেই তৈরি করেছেন এমন ট্রেনিং উপাদান এবং সময় সীমা থেকে এই বিরক্তিকর অনুভূতিটি এসেছে, এটি সম্ভবত traditionalতিহ্যবাহী মেশিনটিকে ন্যায্য পরিমাণ সময় দেয়নি।

— ফ্ল্যাশ
সূত্র

Aaah। সুতরাং এটি নতুন এআই পদ্ধতিতে আত্মবিশ্বাসের অভাব থেকে উদ্ভূত হয়েছিল। এটা বোধগম্য.

— ডিউকঝৌ