আমি বিষয়টির বিশেষজ্ঞ নই, এবং আমার প্রশ্ন সম্ভবত খুব নিষ্পাপ। আলফাগো প্রোগ্রামে ব্যবহৃত শক্তিবৃদ্ধি শেখার ক্ষমতা এবং সীমাবদ্ধতা বোঝার জন্য এটি একটি প্রবন্ধ থেকে উদ্ভূত হয়েছে।
আলফাগো প্রোগ্রামটি অন্যান্য জিনিসগুলির মধ্যে (গাছের মন্টি-কার্লো এক্সপ্লোরেশন ইত্যাদি) ব্যবহার করে তৈরি করা হয়েছে, নিউরাল নেটওয়ার্কগুলি যা মানব-খেলানো গো গেমগুলির একটি বিশাল ডাটাবেস থেকে প্রশিক্ষিত হয় এবং যা এরপরে সংস্করণগুলি খেলার মাধ্যমে আরও শক্তিশালী করা হয় The নিজেকে বিরুদ্ধে বহুবার প্রোগ্রাম।
এখন আমি ভাবছি কি হবে আমরা মানব ডেটাবেস ছাড়াই এই জাতীয় একটি প্রোগ্রাম তৈরি করার চেষ্টা করেছি, অর্থাত্ বৃক্ষগুলি অন্বেষণ করার নিয়ম এবং কিছু পদ্ধতি জানা এবং গোপনীয়তার নিউরাল নেটওয়ার্কের উন্নতি করার জন্য নিজের বিরুদ্ধে খেলতে দেওয়ার একটি প্রাথমিক প্রোগ্রাম দিয়ে শুরু করা। আমরা কি নিজের বিরুদ্ধে অনেক খেলা করার পরে, এমন কোনও প্রোগ্রামে পৌঁছে যাব যা সেরা মানব খেলোয়াড়দের সাথে প্রতিযোগিতা করতে বা পরাজিত করতে সক্ষম? এবং যদি তা হয় তবে এর জন্য কতগুলি গেমের (মাত্রার ক্রমে) প্রয়োজন হবে? বা বিপরীতে, এই জাতীয় প্রোগ্রামটি কি অনেক দুর্বল খেলোয়াড়ের দিকে রূপান্তরিত করবে?
আমি ধরে নিয়েছি যে আলফাগো এত সাম্প্রতিক হওয়ায় পরীক্ষাটি করা হয়নি। তবে উত্তরটি কোনও বিশেষজ্ঞের কাছে সুস্পষ্ট হতে পারে। অন্যথায় কোনও শিক্ষিত অনুমানই আমাকে আগ্রহী করবে।
"সরল" গেমগুলির জন্যও একই প্রশ্ন জিজ্ঞাসা করা যেতে পারে। যদি আমরা আলফাগো-র জন্য প্রায় একইভাবে পুনর্বহালনের-শেখার প্রযুক্তিগুলি ব্যবহার করি তবে মানবিক ডাটাবেস ব্যবহার না করে, দাবা প্রোগ্রামের জন্য, আমরা কি শেষ পর্যন্ত একটি সেরা প্রোগ্রামকে সেরা মানুষকে পরাতে সক্ষম একটি প্রোগ্রাম পাব? এবং যদি তাই হয়, কত দ্রুত? এটি চেষ্টা করা হয়েছে? বা যদি দাবা নয়, তবে চেকার্স, বা আরও সহজ গেমগুলির কী হবে?
অনেক ধন্যবাদ.