খাঁটি স্ব-প্রশিক্ষিত দাবা এআই


46

আমি যেমন বুঝতে পেরেছি, ততক্ষণে এটি উপস্থিত রয়েছে, সমস্ত শক্তিশালী দাবা সফ্টওয়্যার

  1. সম্ভাব্য কয়েক হাজার বা লক্ষ লক্ষ, ভবিষ্যতের অবস্থানগুলি পরীক্ষা করে;
  2. ভবিষ্যত অবস্থানের কিছু হিউরিস্টিক অনুসারে মূল্যায়ন করে যার নাম একটি মূল্যায়ন ফাংশন;
  3. নিবিড়তার জন্য প্রতিটি ভবিষ্যতের অবস্থানকে পৃথকভাবে মূল্যায়ন করে , অবস্থান থেকে ধারাবাহিকতাটি অনুসন্ধান করতে হবে কিনা তা স্থির করতে;
  4. মিনিম্যাক্স দ্বারা উপলব্ধ চলনগুলির মধ্যে থেকে চয়ন করে ; এবং
  5. একটি খোলার বই ব্যবহার করে

এ পর্যন্ত সব ঠিকই. যাইহোক, দাবা প্রোগ্রামের শক্তিটি বেশিরভাগই তার মূল্যায়ন এবং নিরিবিলি তাত্ত্বিকতার মানের উপর নির্ভর করে - এবং এটির খোলার বইয়ের উপরও, যা কম্পিউটারের দৃষ্টিকোণ থেকে, এটি আরও একটি হিউরিস্টিক। এই জাতীয় দাবা প্রোগ্রামটি দৃশ্যত, কেবলমাত্র, হিউরিস্টিকস তৈরি করেছে এমন মানুষ যেমন গেমটি সম্পর্কে ঠিক তেমন জানে। প্রোগ্রামটির নিজস্ব কোনও অন্তর্দৃষ্টি নেই বলে মনে হচ্ছে।

কেউ কি কখনও একটি দাবা প্রোগ্রাম লিখেছেন যার নিজস্ব অন্তর্দৃষ্টি রয়েছে? যে নিজে থেকে খেলা শিখতে? নিজেই ট্রেন? এই জাতীয় প্রোগ্রামটি অবশ্যই গেমের নিয়মগুলির সাথে সরবরাহ করা হবে এবং সম্ভবত আরও কাঁচা মিনিম্যাক্স এবং নিরিবিলি পরিকাঠামো সরবরাহ করা হবে এবং জোরপূর্বক সাথীকে যদি এটি পাওয়া যায় তবে সনাক্ত এবং বিচার করতে সক্ষম হবেন। তবে এটি কোনও হিউরিস্টিক সরবরাহ করা হবে। উদাহরণস্বরূপ, এটি কেন্দ্রের দিকে খেলাটি খুলতে বলা হবে না, বা নাইটদের তুলনায় দুর্বলদের পছন্দ করা বা সিসিলিয়ান প্রতিরক্ষা কী তা বলা হবে না। এ জাতীয় নীতিগুলি (বা, অনুধাবনযোগ্যভাবে, উন্নত নীতিগুলি আবিষ্কার করার জন্য) নিজে থেকেই অনুধাবন করতে হবে।

এর খাঁটি আকারে, এই জাতীয় প্রোগ্রামটি কখনও অধ্যয়নের জন্য মাস্টার গেম সরবরাহ করা হত না, তবে কেবল তার নিজস্ব গেমস, নিজের বিরুদ্ধে খেলে played শুধুমাত্র একবার সম্পূর্ণ স্ব-প্রশিক্ষিত এটি মানব প্রতিযোগিতায় মুক্তি দেওয়া হবে।

এ জাতীয় খাঁটি দাবা এআই কি আছে? কোন যান্ত্রিক দাবা অটোডিড্যাক্টটি কখনও উপস্থিত হয়েছে? আসলেই কি পুরনো তুর্ক নিজেকে শেখাতে পারে?

এখানে ব্যর্থ একটি খাঁটি দাবা এআই এর একটি সংক্ষিপ্ত বিজ্ঞপ্তি বলে মনে হচ্ছে।

( দাবা খোলার কম্পিউটারাইজড স্টাডির বিষয়ে আগে একটি স্পর্শকাতরভাবে সম্পর্কিত প্রশ্নটি এই সাইটে প্রকাশিত হয়েছিল))

হালনাগাদ

প্রশ্নটি এই লেখার সময়, তিনটি ভিন্ন, আলোকিত উত্তর দ্বারা উত্তর পেয়েছে, @ ওয়েজফ্রিমান, @ গ্রেগই দ্বারা। এবং @ ল্যান্ডেই তিনটিকেই দৃ strongly়ভাবে সুপারিশ করা হয় এবং আমি যখন সাইট নীতি অনুসারে আনুষ্ঠানিকভাবে অন্যকে বাদ দেওয়ার জন্য একজনকে গ্রহণ করি তখন আমি নিজেকে দোষী মনে করি । আমাকে এখানে তিনটির জন্য ধন্যবাদ জানাতে এবং আমার প্রশংসা জানাতে দিন।

প্রশ্নগুলি ব্রিভিটি চায়। উত্তরগুলির প্রতিক্রিয়া তবে বেশি দিন চলতে পারে। আগ্রহী পাঠকগণ এখান থেকে সরাসরি উত্তরগুলিতে এড়াতে পারেন এবং তারপরেও আগ্রহী হলে নিম্নলিখিতটি দীর্ঘতর আপডেটটি পড়তে ফিরে আসতে পারেন।

আমি যখন প্রশ্নটি জিজ্ঞাসা করলাম তখন আমার মনে নিচের মত কিছু ছিল।

ধরা যাক শ্যাংগ্রি-লা উপকণ্ঠে এমন একটি অনুমানের গ্রাম যেখানে লোকেরা কখনও দাবা শোনেনি। আপনার সংক্ষিপ্ত পরিদর্শনকালে আপনি গ্রামের প্রবীণদের গেমের নিয়মগুলি শিখিয়েছিলেন, তবে কখনই সেগুলি খেলার কোনও নীতিতে নির্দেশ দেন না। বাকিদের মধ্যে দুজন প্রবীণরা যখন খেলাটি খেলেন, তখন আপনি (কবিটজিং করে নাটকটি ব্যাহত করতে চান না) নিয়মকানুনের প্রশ্নগুলিতে আপনার ভাষ্যকে আবদ্ধ করেন। কোনও পোস্টমর্টেম খেলা অনুসরণ করে না, বা দাবা খেলা বা আলোচিত হবে না যখন আপনি শ্যাংগ্রি-লাতে রয়েছেন। তবে, আপনি যখন চলে যান, কখনই ফিরে আসবেন না, আপনি নিজের দাবাটিকে পিছনে রেখে যান।

আপনার অনুপস্থিতিতে, প্রবীণরা লোককে গেমটি শেখায়। কিছু লোক পরবর্তীতে অবসর সময়ে কিছুটা খেলে, কয়েকজন ক্রমবর্ধমান উত্সাহের সাথে, যারা তাদের নিজস্ব দাবা সেট ফ্যাশন করে।

এই গ্রামবাসীদের কাছে এটি তাত্ক্ষণিকভাবে স্পষ্ট নাও হতে পারে যে একটি নাইটের চেয়ে নন্দন ভাল ছিল, তবে লোকেরা ধীরে ধীরে অনেক গেমের খেলার উপর দিয়ে দাবাগের আপেক্ষিক শক্তি প্রয়োগ করতে পারে। তেমনি, এটি তাত্ক্ষণিকভাবে তাদের কাছে স্পষ্ট নাও হতে পারে যে 1. এ 4 একটি দুর্বল উদ্বোধন ছিল: তারা কিন্তু এটি চেষ্টা করে ফলাফলগুলি বিবেচনা করতে পারে।

খেলাগুলির বোঝাপড়া শেষ পর্যন্ত বাইরের বিশ্বের সাথে রূপান্তরিত করবে কীভাবে? একটি খোলার বইয়ের অভাব, তারা কি তাদের নিজস্ব উপন্যাস খোলার বিকাশ করতে পারে? অবশ্যই, কেউ প্রথমে গ্রামবাসীর উদ্বোধন খুব ভাল হবে বলে আশা করতে পারে না, তবে কয়েক শতাব্দী বিচ্ছিন্নতার কারণে, গ্রামবাসী একটি সম্মানজনক উদ্বোধনী খণ্ডন বিকাশ করতে পারে, আমি জানি সবাই।

200 বছর পরে, পরবর্তী ভ্রমণকারী যখন তাদের পর্যবেক্ষণ করতে পেরেছিল, তখন তাদের কোনও উদ্বোধন, স্বাধীনভাবে বিকশিত হয়ে বাইরের বিশ্বের কাছে আকর্ষণীয় প্রমাণিত হতে পারে? শ্যাংগ্রি-লা বিশ্বকে নতুন উপন্যাস শানগ্রি-লা প্রতিরক্ষা দিতে পারে?

যদি তা হয় তবে দাবা এআই সম্পর্কে আমার মূল প্রশ্নটির বিষয়ে, আমার মনে যা ছিল তা কমবেশি ছিল: কোনও দাবা এআই আরও বা কম শানরগি-লা উপকণ্ঠে গ্রামবাসীদের দাবা অগ্রগতির নকল করতে পারে?

নীচে @ ল্যান্ডির উত্তরে সুসমানের কাহিনী বিবেচনা করে নিঃসন্দেহে সত্য যে আমার গ্রামবাসীরা খেলায় কিছু প্রাক্কন ধারণা নিয়ে আসবে। উদাহরণস্বরূপ, তারা এমন একটি ধারণা নিয়ে আসবে যে দরকারী জিনিসগুলির অধিক পরিমাণে রাখার চেয়ে এটির কম পরিমাণ রাখার চেয়ে সাধারণত ভাল ছিল, এবং তাই প্রতিপক্ষের দাবাগানগুলি ধরার পক্ষে সম্ভবত নিজের নিজের ক্যাপচারকেই কষ্ট দেওয়া ভাল। প্রকৃতিতে শ্যাংরি-লা-এর কল্পিত লোকেরা কতটা অঞ্চলভিত্তিক ছিল তা সাহিত্যের জন্য একটি প্রশ্ন, তবে যে কেউ এমন অবস্থানকে স্বীকৃতি দেবে যেটি কম অবস্থানের চেয়ে বেশি স্থানকে অধিষ্ঠিত করে commanded এবং কোনও উজ্জ্বল নববী, একবার একবার দাবা সেট দেখানো হয়েছে এবং গেমের নিয়মগুলিতে নির্দেশ দেওয়া হয়েছে, কোনও রানী সম্ভবত পদ্মের চেয়ে আরও ভাল simply

আমার প্রশ্নটি দাবা বোর্ডে যে কোনও ধরণের জ্ঞান আনার বিরুদ্ধে একটি নিরঙ্কুশ, সুসমান-স্টাইলের আদেশ নিষেধ বোঝানোর প্রয়োজন হবে না; বরং পূর্ব-ধারণা, দাবা-নির্দিষ্ট জ্ঞানের বিরুদ্ধে সাধারণ আদেশ নিষেধ বোঝানো। সর্বোপরি (গেমের নিয়মগুলির বিবর্তনের বিষয়টি অনেক আগে অবহেলা করা) অতীতে কিছু সময়ে দাবা প্রথম খেলাটি খেলত। হতে পারে প্রথম প্লেয়ারটি প্রথম খোলার 1. এ 4; কিন্তু শেষ পর্যন্ত তিনি আরও শিখলেন, এবং শিষ্যদের কাছে যা শিখলেন তা শিখিয়েছিলেন; যিনি ঘুরেফিরে আরও শিখেছিলেন এবং প্রজন্ম ধরে প্রজন্মকে আরও শিখিয়েছিলেন, আমাদের কাসপারভ দিতে give

কোনও এআই কি কয়েক শতাব্দীর পরিবর্তে সপ্তাহে না পেরে এমন কিছু করতে পারে?

আমার ধারণা, প্লেটো সন্দেহজনক হবে। হিউম আরও আশাবাদী হবে, তবে এই প্রশ্নটি এখন আর একা দর্শনের দ্বারা নিষ্পত্তি হওয়া যায় না। আমাদের কাছে এখন ইলেকট্রনিক কম্পিউটার রয়েছে যার সাহায্যে প্রস্তাবটি পরীক্ষা করা যায় এবং আমি ভাবছিলাম যে এআই আর্টের অবস্থা কী। বর্তমানে সেরা দাবা এআইগুলি পুরোপুরি অজ্ঞাতসারে বিশেষজ্ঞ সিস্টেমগুলি বলে মনে হচ্ছে যা কিছুকে অন্তর্নিহিত করার সময় সবাইকে পরাজিত করে। আমি ভাবলাম যে কিছুটা বিস্তৃত এআই, যে কোনও অর্থে প্রকৃতপক্ষে দাবা সম্পর্কে চিন্তাভাবনা করে, নিজেরাই গেমটি শেখানোর ক্ষেত্রে যথেষ্ট সাফল্য পেয়েছিল কিনা?

আমি জড়ো করেছি যে উত্তরটি না, সম্ভবত না not


4
এটি সত্যই সত্যই এই সাইটের সেরা প্রশ্নগুলির একটি।
prusswan

5
দেখে মনে হচ্ছে উত্তরটি এখন হ্যাঁ, যেহেতু ডিপমাইন্ডরা স্ক্র্যাচ থেকে প্রশিক্ষণ নিয়েছে আর্ট দাবা এআইয়ের একটি নতুন রাষ্ট্র সম্পর্কে সবেমাত্র গবেষণা প্রকাশ করেছে (কেবল স্ব-প্লে, কোনও রেফারেন্স গেমস) নয়। arxiv.org/pdf/1712.01815.pdf
লালাল্যান্ড

1
@ ল্যাল্যান্ডের মন্তব্যে যোগ করা, প্রশিক্ষণের পরে আমি মনে করি 10 ঘন্টা এটি স্টকফিশকে পুরোপুরি চূর্ণ করেছিল (কোন সংস্করণটি নিশ্চিত নয়) যেন স্টকফিশ একটি শিক্ষানবিশ। ইঞ্জিন বনাম ইঞ্জিন গেমগুলিতে বেশ কিছু শুনে না। দেখে মনে হচ্ছে আলফাগো শূন্য তালের শৈলীতে খেলতে পছন্দ করে
আরিয়ানা

2
"কয়েক শতাব্দী নয়, কোনও এআই কি কয়েক সপ্তাহের মধ্যে এমন কিছু করতে পারে? সম্ভবত না?" ঠিক আছে, আপনি একদম ঠিক বলেছেন ... কয়েক ঘন্টা সময় লেগেছিল।
ব্যবহারকারী230452

1
ক্যাপাব্লাঙ্কার মতো বেশ কয়েকটি খেলোয়াড় একবার খেলা দেখলে খেলাটি আবিষ্কার করেছিল বলে মনে করা হয়। এবং মনে রাখবেন যে আলফা জিরোর ভাবার আর কিছুই ছিল না।
ফিলিপ রো

উত্তর:


26

আপনার কয়েকটি খুব আকর্ষণীয় বিষয় রয়েছে। আমার এআই গবেষণায় কিছুটা অভিজ্ঞতা আছে (আমার এমএসসি এই ক্ষেত্রে ছিল), তাই আমি মনে করি আমি কিছু অন্তর্দৃষ্টি দিতে পারি।

এলাকায় রিসার্চ

প্রথমত, এই ক্ষেত্রে গবেষণাটি অবশ্যই ঘটছে - "বিবর্তনীয় পদ্ধতির দাবা" অনুসন্ধান করা 2001 থেকে এই কাগজটি নিয়ে ফিরে এসেছিল , আপনি যে প্রস্তাব করেছিলেন ঠিক তা-ই করেছেন, ন্যূনতম / সর্বাধিক পদ্ধতির রেখে এবং কেবল মূল্যায়নের ফাংশনটি পরিবর্তন করেছেন ifying আরও অনেকগুলি খনন করা সম্ভব এবং আমি এই ক্ষেত্রটিতে সাধারণভাবে কাজ করা বেশ কয়েকজন ব্যক্তির সম্পর্কে অবগত।

তাত্ত্বিক সম্ভাবনা

আমার মতে, "খাঁটি" দাবা খেলে এআই তৈরির একমাত্র আসল সীমাবদ্ধ কারণ হ'ল গণনার সময় utation বর্তমান পদ্ধতির সাহায্যে তাত্ত্বিকভাবে এআইআই তৈরি করা যায় না তার কোনও কারণ নেই।

Practicalities

দাবা হিউরিস্টিক ফাংশনটি বিকশিত হওয়ার ক্ষেত্রে বিবর্তনীয় বা জেনেটিক পদ্ধতির ব্যবহারে দুটি প্রধান সমস্যা রয়েছে, প্রথমটি হ'ল দাবারের জন্য একটি মৌলিক এমনকি দাবির পক্ষে একটি হিউরিস্টিক ফাংশন অত্যন্ত জটিল। আমরা শত শত নিয়ম, টুকরো মূল্য নির্ধারণ (অবস্থানের উপর ভিত্তি করে পৃথক হতে পারে), অবস্থান বিশ্লেষণ ইত্যাদির কথা বলছি etc. আপনার এই নীতিগুলি বর্ণনা করার জন্য একটি নমনীয় কম্পিউটার ভাষা প্রয়োজন এবং তারপরে এই নিয়মগুলি এলোমেলোভাবে তৈরি করা যেতে পারে, মিউটেটেড, একে অপরের সাথে বংশবৃদ্ধি করা ইত্যাদি এটি অবশ্যই সম্ভব, তবে আমি অনুমান করছি আপনি কয়েক হাজার সত্তার সমন্বয়ে একটি নিয়ম সেটটি শেষ করবেন। এটি গতিশীলভাবে বিকশিত হওয়ার জন্য একটি খুব বড় নিয়ম।

দ্বিতীয় সমস্যাটি হ'ল আপনার নতুন সংশোধিত নিয়মের মূল্যায়ন করতে আপনাকে দাবা খেলা খেলতে হবে এবং কে জিততে পারে তা দেখতে হবে। আপনি যদি এই "সঠিকভাবে" করতে চান, আপনি উভয় খেলোয়াড়কে ভাবার জন্য প্রচুর সময় দিতে চাইবেন, একটি সাধারণ খেলার দৈর্ঘ্যের অনুরূপ। তবে, কেবলমাত্র একক প্রতিপক্ষের খেলাই যথেষ্ট নয়, আপনি গেমের শক্তিতে কোনও উন্নতি পেয়েছেন বলে সত্যই নিশ্চিত হওয়ার আগে আপনি অনেকগুলি বিভিন্ন প্রতিপক্ষ এবং সম্ভবত একই প্রতিপক্ষকে, অনেক বার খেলতে চান। এর অর্থ সম্ভবত আপনার জনসংখ্যায় পৃথক পৃথক কয়েক শ গেম খেলে এবং এটি আপনাকে আপনার অ্যালগরিদমের একটি প্রজন্ম দেয়।

সাধারণত এই ধরণের পদ্ধতির সাথে আপনি কমপক্ষে কয়েকশ প্রজন্মের দিকে তাকিয়ে থাকবেন, বা দাবা হিউরিস্টিক, এমন কয়েক হাজার (বা এমনকি কয়েক মিলিয়ন) প্রজন্মের মতো জটিল ক্রিয়াকলাপগুলিও দেখছেন। কিছু দ্রুত গণিত আপনাকে বোঝাতে হবে যে আপনার একক প্রজন্মের জন্য কয়েক হাজার ঘন্টা সিপিইউ সময়ের প্রয়োজন হবে, এমনকি এটি উল্লেখযোগ্য আকারের একটি সার্ভার ফার্মও বানাতে হবে, বাস্তবে বিবর্তনের জন্য আপনার সম্ভবত বেশ কয়েকটি (সম্ভবত শত) বছর প্রয়োজন হবে as আপনি আপনার আপডেট উল্লেখ।

সেই সময়ের শেষে, আপনার কাছে একটি আকর্ষণীয় অ্যালগরিদম রয়েছে যা সম্ভবত গেমটির মধ্যে প্রচুর অন্তর্দৃষ্টি রয়েছে যা সত্যই কখনও আবিষ্কার করা যায় নি। তারা দরকারী বা এমনকি মানুষের কাছে বোধগম্য হবে তা বলা মুশকিল। কেন এই বিধি বিদ্যমান? কারণ কয়েক হাজারেরও বেশি গেমগুলি দেখে মনে হচ্ছে এটি কাজ করে।

ভবিষ্যৎ

আমার সন্দেহ নেই যে কম্পিউটিং শক্তি বাড়ার সাথে সাথে এই পদ্ধতিগুলি আরও বেশি জনপ্রিয়তা অর্জন করবে। বর্তমানে, আমরা এমন এক পর্যায়ে পৌঁছেছি যেখানে কোনও মেশিনের হাতে (প্রায় সমস্ত) মানুষকে মারার জন্য পর্যাপ্ত পরিমাণ কম্পিউটিং সময় রয়েছে, যদি এটি বুদ্ধি সাবধানে হাতে তৈরি করা হয়। 20 বছরের ব্যবধানে, এটি বেশ সম্ভব যে প্রসেসরগুলি এত বেশি অগ্রসর হবে যে গভীরতাতে এক বা দুটি অতিরিক্ত পদক্ষেপগুলি "হার্ড-কোডড" মেশিনগুলিকে পর্যাপ্ত সুবিধা দেয় না, তবে নিয়মিতভাবে বিবর্তিত, আশ্চর্যজনক স্বজ্ঞাত মেশিনগুলির দ্বারা প্রহার করা হয় তাদের পিছনে লক্ষ লক্ষ ঘন্টা বিবর্তন।

আপডেট 2018 মে

যেমন রবার্ট কাউচার নীচে একটি মন্তব্যে উল্লেখ করেছেন, সাম্প্রতিক সংবাদগুলি এখানে উল্লেখ করার যোগ্য। বিশেষত, গুগলের আলফাগো প্রকল্পটি এই ধরণের গেমগুলির জন্য প্রথম সত্যিকারের বাস্তব-ভিত্তিক এআই-ভিত্তিক পদ্ধতি বলে মনে হয় এবং 2017 সালের শেষের দিকে, কার্যটির পুনর্নির্ধারণের পরে স্টকফিশ 2 এর বিরুদ্ধে জয়ের দাবি করেছে।


ধন্যবাদ. আমি লক্ষ্য করেছি যে আপনি যে কাগজটি লিঙ্ক করেছেন এটি তার এআইকে প্রথমে ননমাস্টার মানব বিরোধীদের বিরুদ্ধে এবং পরে প্রচলিত দাবা সফ্টওয়্যারের বিরুদ্ধে প্রশিক্ষণ দেয়, যা আপনার এবং আমার মনে মনে ছিল তা ঠিক নয়। আমার মতো একজন প্লাটোনিস্ট জেনে অবাক হবেন না যে আপনি এবং আমি যে ধরণের এআই নিয়ে আলোচনা করছি এটি ছিল একটি ব্যবহারিক অসম্ভবতা (আমরা জানি যে এটি কোনও তাত্ত্বিক অসম্ভবতা নয় কারণ দাবা মিনিম্যাক্সের মাধ্যমে তত্ত্বের সমাধান করা যেতে পারে); তবে কোনও উত্তর আমাকে বিস্মিত করে কিনা তা মুখ্য নয়। মূল বিষয়টি জিজ্ঞাসা করা হয় যে কোনও এআই প্রস্তাবিত কৃতিত্ব অর্জন করেছে কিনা। উত্তরটি মনে হবে না।
th

2
@thb আমি মনে করি এ জাতীয় এআইয়ের জন্য বেশ কয়েকটি প্রচেষ্টা প্রচুর হয়েছে, যদিও আপনি তাদের "ব্যর্থ" হিসাবে বিবেচনা করতে পারেন। আমি সন্দেহ করি যে একটি বিশাল সফল প্রচেষ্টা (আজ) সম্ভবত খুব দুর্বল অপেশাদার স্তরে খেলবে; জনসাধারণের চোখে নয়, একটি দুর্দান্ত অর্জন। এছাড়াও, আমি মনে করি না যে বিদ্যমান প্রোগ্রামগুলি এবং মানুষের বিরুদ্ধে প্রশিক্ষণ প্রতারণা করছে, সে অনুযায়ী - কেবল একটি খুব বড় অপটিমাইজেশন, যদিও এটি বিবর্তিত এআই এর খেলার শৈলীর দিক পরিবর্তন করতে পারে।
ড্যানিয়েল বি

1
যদি আপনি "খাঁটি" পদ্ধতির উপর আরও পড়তে আগ্রহী হন তবে আপনার সম্ভবত "প্রতিযোগিতামূলক কোয়েভলিউশন" পদ্ধতির জন্য আরও ভাগ্য অনুসন্ধান করা হবে। বাহ্যিক পরিশ্রমের কার্য সম্পাদনের কোনও ভাল উপায় না থাকার জন্য এই বাক্যাংশটি ব্যবহৃত হয় (যেমন আমরা অন্যান্য দাবা ইঞ্জিনের বিরুদ্ধে খেলতে পারি না), তাই এআই প্রশিক্ষণটি নিজেই বিভিন্ন সংস্করণ খেলে বিকশিত হতে হয়। এটি অবশ্যই কাজ করে, তবে অনেক বেশি সময় নেয়, সম্ভবত এটি কারণেই এটির জন্য কম চেষ্টা করা।
ড্যানিয়েল বি

1
@ ড্যানিয়েলবি কি আলফাজিরো এমন একটি এআই?
হ্যারি ওয়েজলি

1
আপনি আপনার উত্তর আপডেট করতে ইচ্ছুক হতে পারে। দাবাড়ি নিউজ
রবার্ট কাউচার

17

আমার সন্দেহ হয় যে আপনি যা জিজ্ঞাসা করছেন তা কোনও প্রকার জেনেটিক অ্যালগরিদম বা বিবর্তনীয় অ্যালগরিদম পদ্ধতির হিসাবে শ্রেণীবদ্ধ করা হবে suspect আমার সন্দেহ হয় যে মৌলিক স্তরে কিছুটা ডিগ্রি সহকারে মানব পক্ষপাতকে এম্বেড না করে এ জাতীয় অ্যালগরিদম ডিজাইনের কোনও বাস্তব উপায় নেই, যেহেতু প্রোগ্রামারটিকে এখনও একটি পজিশনের স্থির বৈশিষ্ট্যগুলি নির্ধারণ করতে হয় (উপাদান গণনা, প্যাঙ্কার কাঠামো, রঙের কমপ্লেক্স ইত্যাদি)) যা অনুসারে এআই বিভিন্ন গেমের অবস্থানগুলিকে শ্রেণিবদ্ধ এবং তুলনা করবে। আপনি যদি দাবা প্রসঙ্গে উপরোক্ত অ্যালগরিদমিক পরিভাষায় কোনও গুগল অনুসন্ধান করেন, আপনি অসংখ্য ফলাফল পাবেন তবে সম্ভবত সফল, প্রতিযোগিতামূলক এআই তৈরি করতে ব্যবহার করা হয়েছে এমন গুরুতর গবেষণার পথে খুব কমই।

আসল ঘটনাটি মুরের আইনের পরিণতি হিসাবেকম্পিউটারগুলি এখন এমন শক্তিশালী গণনা মেশিন যা অত্যন্ত পরিশীলিত এআই পদ্ধতিগুলি কেবল অপ্রয়োজনীয় (সেরা মানব বিরোধীদের চেয়ে উচ্চ স্তরে খেলার ক্ষেত্রে) নয়, তবে অনুমেয়ভাবে পাল্টা উত্পাদনশীলও হতে পারে। দাবা হ'ল এক ধরণের খেলা যার মধ্যে - মূলত যে কোনও স্থানে যুক্তিসঙ্গত পদক্ষেপের তুলনামূলকভাবে ছোট অনুসন্ধানের জায়গা এবং কৌশলগত সংমিশ্রণকে জোর করার অস্তিত্বের কারণে (চেকের ক্রমগুলি, টুকরো ক্যাপচারগুলি, সাথীর হুমকি বা উপাদানকে বিধ্বংসী ক্ষতির সমন্বয়ে, ইত্যাদি) - কিছু রক্ষণশীল অনুসন্ধান-গাছের ছাঁটাইয়ের সাথে একটি ব্রুট-ফোর্স পদ্ধতির একযোগে সবচেয়ে আলগোরিদিম সহজ এবং সবচেয়ে কার্যকর পন্থা। যদি আপনি এন্ডগেম টেবিল এবং খোলার বইয়ের প্রাপ্যতাগুলিকে ফ্যাক্টর করেন তবে সেই পদ্ধতির যুক্তিটি কেবল বাড়বে। আমি বুঝতে পারি যে সেখানে ' আপনি যেসব উপন্যাসের কথা বলছেন তাতে এখনও তাত্ত্বিক আগ্রহ এবং সম্ভাব্য মান সম্পর্কে একটি দুর্দান্ত চুক্তি রয়েছে তবে আমার সন্দেহ হয় যে দাবাটি এটির বিকাশ করার ক্ষেত্রে ভুল ক্ষেত্র। অন্যদিকে, গো এর মতো একটি খেলা, যা প্রকৃতির দ্বারা কম কৌশলগত এবং একটি বৃহত্তর অনুসন্ধানের জায়গাটি অন্তর্ভুক্ত করে যা ব্রুট-ফোর্সটিকে অবৈধ ব্যবহার করে, এটি এআই গবেষণার জন্য আরও ভাল প্রার্থী হতে পারে।


আমি আপনার উত্তরের আলোকে এআই প্রশ্ন আপডেট করেছি। আপডেটটি সংক্ষিপ্ত নয়, তাই আপনার বিকল্পে, আপনার যখন কিছুটা সময় থাকে, আপনি এটি আপনার আগ্রহের মাত্রায় পর্যালোচনা করতে পারেন।
thb

2
এই জাতীয় কোন পক্ষপাতের প্রয়োজন হবে না। কেবল আইনী দাবা খেলতে সক্ষম 1000 র্যান্ডম অ্যালগরিদমগুলি তৈরি করুন, একটি টুর্নামেন্টে একে অপরের বিপক্ষে খাঁটি করুন, তারপরে শীর্ষ 20% নিন এবং পরের প্রজন্মকে গড়ে তুলতে মিউটেশন এবং ক্রসওভার প্রয়োগ করুন। বেশ কয়েক জন প্রজন্মের জন্য বহুসংখ্যক জনসংখ্যার জুড়ে পুনরাবৃত্তি করুন এবং আপনার শেষে আধটা পথ শালীন হওয়া উচিত। একমাত্র ফিটনেস ফাংশনটি হ'ল জয় / হারানো।
সুপারলুমিনারি

15

জেনারেল গেম প্লেয়িংয়ে উইকিপিডিয়া পৃষ্ঠাটি দেখুন । এটি একটি সক্রিয় গবেষণার ক্ষেত্র। এখানে একটি বার্ষিক জিজিপি টুর্নামেন্ট রয়েছে যাতে প্রোগ্রামগুলিকে একটি নতুন গেমের নিয়ম দেওয়া হয়, এটি সম্পর্কে কিছুক্ষণ চিন্তা করুন এবং তারপরে একে অপরের বিরুদ্ধে গেমটি খেলুন।

আপনি যদি কোনও জিজিপি প্রোগ্রামকে দাবা সংক্রান্ত বিধি দেন তবে আমার ধারণা আপনি এটি দেখতে পাবেন যে এটি একটি মানব শিক্ষিকার চেয়ে অনেক শক্তিশালী এবং উদ্দেশ্য-লিখিত দাবা প্রোগ্রামের চেয়ে অনেক দুর্বল।


13

আলফাজিরোর সাম্প্রতিক স্টকফিশ 8-এর বিপরীতে সাফল্যের আলোকে এই প্রশ্নটি পুনর্বিবেচনা করা উপযুক্ত । ডিপমাইন্ডের আলফাগো এবং আলফাগো জিরো প্রোগ্রামগুলির আরও বিবর্তন, গ্রহটির অন্যতম শক্তিশালী "traditionalতিহ্যবাহী" দাবা ইঞ্জিনের বিপরীতে আলফাজিরো +28 = 72 -0 এর বিস্ময়কর স্কোর দিয়ে শেষ করেছে।

আলফায়েজোর নিজের বিরুদ্ধে সিরিজ গেমসের মাধ্যমে এর নিউরাল নেটওয়ার্ক আর্কিটেকচারকে প্রশিক্ষণ দিয়ে, রিইনফোর্সমেন্ট লার্নিংয়ের মাধ্যমে খেলতে শিখিয়েছে। সহিত কাগজ অনুসারে :

  1. অবস্থানটি বর্ণিত ইনপুট বৈশিষ্ট্যগুলি এবং এই পদক্ষেপের বর্ণনা করে আউটপুট বৈশিষ্ট্যগুলি বিমানের সেট হিসাবে কাঠামোযুক্ত; অর্থাত্ নিউরাল নেটওয়ার্ক আর্কিটেকচারটি বোর্ডের গ্রিড-কাঠামোর সাথে মেলে।
  2. আলফাজেরোটি গেমের বিধি সম্পর্কে নিখুঁত জ্ঞানের সাথে সরবরাহ করা হয়েছে। এটি এমসিটিএস চলাকালীন, গতিপথের ক্রম থেকে প্রাপ্ত অবস্থানগুলি অনুকরণ করতে, গেমের সমাপ্তি নির্ধারণ করতে এবং টার্মিনাল অবস্থায় পৌঁছানো কোনও সিমুলেশন স্কোর করতে ব্যবহৃত হয়।
  3. ইনপুট প্লেনগুলি (যেমন কাস্টিং, পুনরাবৃত্তি, কোনও অগ্রগতি) এবং আউটপুট প্লেনগুলি (কীভাবে টুকরো সরানো হয়, পদোন্নতি দেওয়া হয়, এবং শোগীতে টুকরো টুকরো হয়) বিধিগুলি জ্ঞানও ব্যবহার করা হয়।
  4. আইনী পদক্ষেপের সাধারণ সংখ্যাটি অনুসন্ধানের শব্দটি স্কেল করতে ব্যবহৃত হয় (নীচে দেখুন)।
  5. দাবা এবং শোগি গেমগুলি সর্বাধিক সংখ্যক পদক্ষেপের (সাধারণত গেমের দৈর্ঘ্যের দ্বারা নির্ধারিত) অতিক্রম করে একটি টানা ফলাফল নির্ধারিত হয়েছিল; গো গেমসকে শেষ করে দেওয়া হয়েছিল এবং ট্রাম্প-টেলর বিধিগুলির সাথে স্কোর করা হয়েছিল, আগের কাজের মতো (29)।

উপরে তালিকাভুক্ত পয়েন্টগুলির বাইরে আলফাজেরো কোনও ধরণের ডোমেন জ্ঞান ব্যবহার করেনি।

আমি নিশ্চিত যে পৃথক পৃথক হার্ডওয়্যার যেমন ব্যবহার করা হচ্ছে সেগুলি সম্পর্কে কেউ প্রশ্ন উত্থাপন করতে পারে - " আলফাজারো ... 4 টিপিইউ সহ একটি একক মেশিন ব্যবহার করেছেস্টকফিশ ... 64৪ টি থ্রেড এবং একটি হ্যাশ আকার ব্যবহার করে [তার] শক্তিশালী দক্ষতার স্তরে খেলেছে 1 জিবি এর। " - তবে যে কোনও ক্ষেত্রেই আলফাজিরোর ফলাফল একটি অসাধারণ এবং এটি ওপির শিরাতে খুব বেশি।

দাবাতে স্টকফিশকে পরাস্ত করার পাশাপাশি আলফাফেরো শোগিকে চ্যাম্পিয়ন প্রোগ্রাম এলমো সেরা উপহার দেওয়ার ক্ষেত্রে প্রশিক্ষণ দিয়েছিল এবং অবশ্যই গো-এর পূর্বসূরী আলফাগো জিরোকেও ছাড়িয়ে গিয়েছিল, সম্ভবত আরও বেশি সমর্থন প্রকাশ করে ।

এখানে স্টকফিশের বিরুদ্ধে একটি গেমস, বার্লিনের যেখানে বৈবাহিক ভারসাম্যহীনতা অবশেষে আলফাজেরো হয়ে বিশপ জুটির সাথে নাইটের পরে এবং স্টকফিশের জন্য 4 পাউন্ডের বিপরীতে 31.Qxc7। সেই অবস্থানে, আলফাজিরোর সমস্ত টুকরো পিছনে র‌্যাঙ্কে রয়েছে, বিশপরা তাদের মূল স্কোয়ারগুলিতে ফিরে। শেষ পর্যন্ত, রাণীগুলি কালো টুকরো টুকরো টুকরো করার পরে ধীরে ধীরে সাদা প্যাঁদাগুলি তুলতে কসরত করুন এবং এটি পর্দা।

স্টকফিশ - আলফাজারো, 2017-12-04, 0-1
1. E4 E5 2. Nf3 Nc6 3. BB5 Nf6 4. D3 Bc5 5. Bxc6 dxc6 6. OO যেমন পণ্য Nd7 7. Nbd2 OO যেমন পণ্য 8. Qe1 F6 9. Nc4 Rf7 10. A4 Bf8 11. Kh1 Nc5 12. A5 NE6 13। Ncxe5 fxe5 14. Nxe5 Rf6 15. Ng4 Rf7 16. Ne5 Re7 17. A6 C5 18 F4 Qe8 19 axb7 Bxb7 20 Qa5 Nd4 21. Qc3 Re6 22. Be3 Rb6 23 Nc4 Rb4 24. B3 A5 25. Rxa5 Rxa5 26. Nxa5 Ba6 27. Bxd4 Rxd4 28. Nc4 Rd8 29 G3 শিরোলেখ 6 30. Qa5 Bc8 31 Qxc7 Bh3 32 Rg1 Rd7 33. Qe5 Qxe5 34. Nxe5 Ra7 35 Nc4 G5 36 Rc1 Bg7 37। Ne5 Ra8 38. Nf3 Bb2 39. Rb1 Bc3 40 Ng1 Bd7 41. NE2 Bd2 42. Rd1 Be3 43. Kg2 Bg4 44. Re1 Bd2 45. Rf1 Ra2 46. h3 Bxe2 47. Rf2 Bxf4 48. Rxe2 Be5 49. Rf2 Kg7 50. G4 Bd4 51. Re2 Kf6 52. E5 + + Bxe5 53. Kf3 Ra1 54. Rf2 Re1 55. Kg2 + + BF4 56. C3 Rc1 57. D4 Rxc3 58. dxc5 Rxc5 59. B4 rc3 60 H4 Ke5 61 । hxg5 hxg5 62. Re2 + + Kf6 63. Kf2 Be5 64. Ra2 rc4 65. Ra6 + + Ke7 66 Ra5 Ke6 67. Ra6 + + Bd6 0-1

11

আমি মনে করি যে এআইআই তৈরি করা মুশকিল হবার মূল কারণটি হ'ল "প্রশিক্ষণ" কার্যকর করার জন্য সঞ্চয় করার জন্য প্রয়োজনীয় স্থান।

এছাড়াও (আপনার স্ব-প্রশিক্ষণের মন্তব্যের প্রতিক্রিয়া হিসাবে), এআইআই উন্নত করার চেষ্টা করার সময় স্ব প্রশিক্ষণ ক্ষতিকারক হতে পারে - আমি টিক-ট্যাক-টো (স্বীকারোচিতরূপে আরও সহজ) সাথে কিছু গবেষণা করেছি, এবং এটি সমস্ত ধরণের খুঁজে পেয়েছে উভয় পক্ষই মারাত্মকভাবে খেলেছে জয়ের ভয়ঙ্কর উপায়ে (এবং সেই ভয়ঙ্কর উপায়ে প্রশিক্ষণ) of টিকিট-টো-এ-এ-এ-এ-র দিকে আরও ভাল চেহারা পাওয়া এআই-এর বিরুদ্ধে প্রশিক্ষণের চেয়ে স্ব-প্রশিক্ষণের সাথে যুক্তিসঙ্গত পারফরম্যান্স পেতে অনেক বেশি সময় লেগেছে।

তবে আমি মনে করি যে হাইব্রিডটি গভীর অনুসন্ধান এবং "প্রশিক্ষণ" উভয়ই ব্যবহার করে তা দেখতে আকর্ষণীয় হবে - মিডলগেমের জন্য পজিশনের কিছু ধরণের সঞ্চিত ডাটাবেস (কেবলমাত্র এন্ডগেম এবং খোলার পরিবর্তে)। এটির জন্য অনেক জায়গার প্রয়োজন হবে।

হতে পারে আপনি আরও একটি "বাস্তব" এআই পদ্ধতির কথা ভাবছেন যা পজিশন জে / লস / ড্রয়ের চেয়ে স্থিতিক ধারণাটি শিখবে, তবে আমি মনে করি না এটি খুব কার্যকর হবে (শক্তিশালী ইঞ্জিনের তুলনায়)।


উত্তর প্রশংসা করা হয়। আমি যেটা মনে করি আমার মনে ছিল এমন একটি এআই ছিল যা (ক) একটি মিনিম্যাক্স ক্ষমতা অর্জন করেছিল তবে (খ) পূর্বনির্ধারিত মূল্যায়ন কার্যের অভাব ছিল। এই জাতীয় এআই খাঁটি মিনিম্যাক্স দ্বারা টিকি-টাক-টো হিসাবে ছোট্ট একটি গেমটি অগত্যা সমাধান করবে। দাবাতে, একটি খেলা কেবল তাত্ত্বিকভাবে মিনিম্যাক্সের জন্যই সংবেদনশীল, এআই বোর্ডের বর্তমান অবস্থান নয় ভবিষ্যতের অবস্থানগুলি মূল্যায়ন করবে, যার পরে মিনিম্যাক্স পদক্ষেপটি বেছে নেবে। এটি খুব শিথিলভাবে বলা যেতে পারে যে নিমজোভিটস জ্ঞাত মূল্যায়ন হিউরিস্টিকস ত্যাগ করে দাবাতে বিপ্লব ঘটিয়েছিলেন। যদি তাই হয়, তবে কোনও যন্ত্রও কি একইভাবে করতে পারে?
THB

1
সুতরাং আপনি বলছেন এটির নিজস্ব মূল্যায়ন ফাংশনটি বিকাশ হবে?
ইভ ফ্রিম্যান

2
@thb, একজন প্রোগ্রামার হিসাবে, আমি মনে করি আপনার ধারণাটি নিয়ে সমস্যাটি হ'ল আমি যতদূর দেখতে পাচ্ছি, কোনও মূল্যায়নযোগ্য দাবা এআই কোনও মূল্যায়নের জন্য সম্পূর্ণ ফাঁকা স্লেট দিয়ে শুরু করতে পারে না। কেউ এমন একটি এআই লিখতে পারেন যা নিদর্শনগুলির জন্য গেমগুলি বিশ্লেষণ করে এবং তার মূল্যায়ন এবং সিদ্ধান্ত গ্রহণের সূক্ষ্ম সুরক্ষার জন্য পরিসংখ্যান / সম্ভাব্য পদ্ধতিগুলি (উদাহরণস্বরূপ, বায়সিয়ান অনুমান) ব্যবহার করে, তবে প্রোগ্রামারটি কী মোটিফগুলি, অবস্থানিক কারণগুলি, চলনক্রমের ক্রমগুলি বলেছিল নিদর্শনগুলি গঠন করে এবং কী মানদণ্ড দ্বারা তাদের মূল্যায়ন। অন্য কথায়, মূল্যায়ন ফাংশনের বেসিক কোরটি এখনও মানব-নকশা করা দরকার।
গ্রেগ ই

1
জেনেটিক মিনিম্যাক্স ইঞ্জিনটি কীভাবে আসে তা দেখতে আকর্ষণীয় হতে পারে, উদাহরণস্বরূপ, আপনি যদি বিজয় / ক্ষতি / ড্রয়ের উপর ভিত্তি করে একই উপাদান মান দিয়ে সমস্ত টুকরো টুকরো টুকরো টুকরো টুকরো করে শুরু করেন, এবং উপাদানগুলির মানগুলিকে পরিবর্তিত করতে দেন। আমি নিশ্চিত যে ইঞ্জিন নির্মাতারা ইতিমধ্যে নাইটস ২.৯ এবং বিশপ 3.1 পাউন্ড তৈরির মতো এগুলি টুইট করার চেষ্টা করেছেন।
ইভ ফ্রিম্যান

1
@thb, আমি কোনও বিশেষজ্ঞ নই, তবে আমি মনে করি এটিই কেস। এমনকি আপনি যে AI এ লিঙ্ক করেছেন তাও প্রোগ্রামার বায়াস দ্বারা সীমাবদ্ধ। আপনি যদি মূল গবেষণা কাগজটি পড়েন তবে এটি নোট করে যে "ফিচার ভেক্টর" মূল্যায়ন ফাংশনটির প্রশিক্ষণ দেয় এমন বোর্ড বৈশিষ্ট্যগুলি যা "সাবধানে হাতে ডিজাইন করা হয়েছিল।" এটি হ'ল, প্রোগ্রামারকে এখনও স্থির অবস্থানগত কারণগুলির সেট নির্দিষ্ট করতে হবে এআই তার সিদ্ধান্ত গ্রহণের ভিত্তিতে। এই বিশেষ প্রকল্পের জন্য একটি নিউরাল নেট এর প্রধান সুবিধা হ'ল প্রশিক্ষণটি সমান্তরালভাবে তৈরি করা যেতে পারে, যাতে দক্ষতার সাথে বিশাল পরিমাণে গেমগুলির অ্যাসিনক্রোনাস প্রসেসিংয়ের সুযোগ হয়।
গ্রেগ ই

10

আমি এখানে গ্রেগ এবং ওয়েস এর উত্তরগুলিতে কেবল প্রসারিত করতে চাই। এইচআই এর প্রকারভেদ যে ধরণের প্রবর্তন করছে তা কেবলমাত্র এই অ্যাপ্লিকেশনটির জন্য প্রয়োজনীয় পরিশীলনের সাথে বিদ্যমান নেই। এমনকি যদি তারা তা করেও তবে আমি সন্দেহ করি যে তারা এতে ব্যর্থ হবে। এটি মনে হয় যেন থিবি একটি শক্তিশালী সাধারণ উদ্দেশ্য এআই চায় যা খেলার প্রাথমিক নিয়মগুলি শেখানো যেতে পারে এবং তারপরে প্রেরণ করা যায়। তবে যদি আপনি সাধারণ উদ্দেশ্যে এআই-এর বিকাশের দিকে লক্ষ্য করেন তবে এগুলি সবই 1 থেকে 2 বছর বয়সী স্তরে অবজেক্ট এবং স্পিচ স্বীকৃতির মতো জিনিস শেখানো হচ্ছে। কোনও গেম কীভাবে খেলতে হয় তা বোঝার আগে এআইয়ের কোনও সাধারণ উদ্দেশ্য প্রথমে একটি গেম কী তা কী তা বুঝতে সক্ষম হওয়ার জন্য পরিশীলিত হওয়া দরকার। আপনি সাধারণ উদ্দেশ্য এআই ডিজাইন করতে পারবেন না এবং এটি সংকীর্ণ বা বিশেষায়িত এআইয়ের মতো সঞ্চালনের আশা করতে পারবেন না। একজন সাধারণ উদ্দেশ্য এআইকে একজন ব্যক্তির মতো দাবা শেখানো দরকার এবং আপনি দাবা ইতিহাসের কোনও জ্ঞান না রেখে দুজন নবাগত খেলোয়াড়কে একত্রে স্থাপন এবং স্বতঃস্ফূর্তভাবে উদ্বোধন এবং কৌশলগত থিমগুলি পুনঃস্থাপনের আশা করতে পারবেন না। এটি এআই একে অপরকে খেলে বহু সংখ্যক দৃষ্টান্ত নেবে, প্রত্যেকে তাদের কয়েক হাজার হাজার পুনরাবৃত্তির উপরে তাদের সমস্ত গেমের historicalতিহাসিক ডেটা অ্যাক্সেস করে। এবং প্রতিটি এআইয়ের বিভিন্ন স্তরে ওজনের নির্দিষ্ট স্বতন্ত্র বৈশিষ্ট্য থাকা প্রয়োজন।

মানুষকে রদ্রিগো (রুই) ল্যাপেজ ডি সেগুরা এবং পেড্রো দামিও থেকে পল মরফির কাছে যেতে আরও প্রায় 500 বছর সময় লেগেছিল এবং তারপরে স্টেইনিতজ এবং আলেখাইন নাটকের মধ্যে ঘটে যাওয়া আরও পরিবর্তনগুলি বিবেচনা করুন। এবং এই সমস্ত পরিবর্তনটি বিভিন্ন মেজাজ এবং অন্যান্য প্রভাবক বৈশিষ্ট্য (যেমন এলোমেলোভাবে বিশপদের উপর নাইটদের পক্ষে বা নাইটদের উপরে বিশপের পক্ষে নাইটসকে সমর্থন করা) সহ খেলোয়াড়ের স্টাইল এবং ফ্যাশনের কথা উল্লেখ না করে এমন কয়েক হাজার খেলোয়াড়ের গতিশীলতার মধ্য দিয়ে ঘটেছিল। এই সমস্ত কিছুই পরিবর্তনের গতিতে অবদান রেখেছিল যা শতাব্দী জুড়ে দাবাকে প্রভাবিত করেছিল। কোনও দুর্বল এআই - এমনকি দুর্বল সাধারণ উদ্দেশ্য এআই- এই ধরণের ডিনামোটির সদৃশ করতে পারে না কারণ এটির ইচ্ছা নেই। কোনও উদ্বোধন বা প্রতিদ্বন্দ্বীটিকে "ব্যস্ত" করার পরে এটি উদ্বোধন করার বা এটির উন্নতি করার অভিপ্রায় নিয়ে খোলার বিশ্লেষণ করার জন্য কেবল আকাঙ্ক্ষা কয়েক দিনের জন্য কয়েক ঘন্টা ধরে বসে থাকতে পারে। সত্যিই এটি বিশ্লেষণ এবং প্রস্তুতির জন্য এই ধরণের ড্রাইভ যা শতাব্দী জুড়ে খেলাকে উন্নত করেছে - সমান দুর্বল খেলোয়াড়দের মধ্যে মিলিয়ন মিলিয়ন গেমের অন্ধ নাটক।

এটি এমন একগুচ্ছ লোকের মতো যাঁরা ইংরাজী বলেন না এবং যারা তাঁদের মাতৃভাষার সাহিত্যের মাস্টার্স পড়েন না এবং তাদেরকে দ্বিতীয় ভাষার বই হিসাবে ইংরেজী সহ একটি কক্ষে রাখেন এবং শেক্সপিয়ারের রচনাগুলির মতো কিছু নিয়ে আসবেন বলে আশা করেন। এটি কখনও হয় না, কখনও হতে চলেছে।

সম্পাদনা : এই দাবি করার চেয়ে আমার আরও ভাল জানা উচিত ছিল কারণ এটি ঘটেছে

দাফ.কম ব্যাখ্যা করে, "চিরাচরিত অর্থে আলফাজিরোকে খেলাটি শেখানো হয়নি"। “এর অর্থ কোনও উদ্বোধনী বই নেই, কোনও শেষের ছক নেই এবং স্পষ্টতই কোনও জটিল অ্যালগরিদমগুলি সেন্টার প্যাড এবং সাইড প্যাঁকের মধ্যে মিনিটের পার্থক্য বিচ্ছিন্ন করে। এটি হাজার হাজার ধাতব বিট এবং অংশগুলিতে অ্যাক্সেস দেওয়া রোবোটের সমান হবে, তবে দহন ইঞ্জিন সম্পর্কে কোনও জ্ঞান নেই, তবে এটি ফেরারি তৈরি না করা পর্যন্ত প্রতিটি সম্ভাব্য সংখ্যার সাথে অসংখ্যবার পরীক্ষা করে দেখায়। … প্রোগ্রামটি নিজেকে খেলতে চার ঘন্টা সময় নিয়েছিল, বহুবার, এর ফলে এটি তার নিজস্ব শিক্ষক হয়ে উঠেছে।

আমার অব্যাহত, স্পষ্টতই ভিত্তিহীন মিথ্যাচার:

আমরা বিশ্ব সম্পর্কে আমাদের অন্তর্ভুক্ত সমস্ত জ্ঞানকে মঞ্জুর করি। এটি বুঝতে সক্ষম হওয়ার জন্য যে আমাকে যদি কাঠের টুকরো এবং একটি পেরেক করতে হয় তবে একটি হাতুড়ি আমার কাছে স্ক্রু ড্রাইভারের চেয়ে বেশি দরকারী আমাকে প্রথমে বুঝতে হবে যে নির্দিষ্ট কিছু জিনিস অন্যান্য জিনিসের চেয়ে নির্দিষ্ট কিছু ক্ষেত্রে বেশি কার্যকর useful আমাকে আরও বুঝতে হবে যে জিনিসগুলির একটি ব্যবহার রয়েছে যা একটি লক্ষ্যে প্রয়োগ করা যেতে পারে। এগুলি হিরিস্টিকস। যদি এআইকে বলা না যেতে পারে যে নির্দিষ্ট কিছু টুকরোগুলি অন্যের চেয়ে বেশি মূল্যবান হয়, তবে কীভাবে এটি সাধ্য কী তা বুঝতে পারে? যদি এটি নির্দিষ্ট হিউরিস্টিক্সের সাথে প্রোগ্রাম না করা যায় তবে অবশ্যই এটি অবশ্যই "মান" এবং "ইউটিলিটি" ফর্ম অভিজ্ঞতার মতো এই ধারণাগুলি বহির্ভূত করতে সক্ষম হবে। এবং এটি সরু এআই এর ডোমেন নয়। এটি সাধারণ উদ্দেশ্যে ডোমেন, শক্তিশালী এআই।


1
দুর্দান্ত উত্তর। আমি মনে করি আপনার প্রথম অনুচ্ছেদটি সত্যিই সেই ধারণাকে স্ফটিক করে দেয় যে আমি পার হওয়ার চেষ্টা করছিলাম, তবে এটি বৃহত্তর স্বচ্ছলতার সাথে করে।
গ্রেগ ই

ধন্যবাদ, গ্রেগ আমি কেবল যুক্ত করতে চাই যে আমি দুর্বল সাধারণ উদ্দেশ্য এআইয়ের বিষয়ে কথা বলছি। আমি বিশ্বাস করি যে সত্যিকারের শক্তিশালী এআই অনেকগুলি সংক্ষেপণের সময় ফ্রেমে অনেকগুলি পুনরাবৃত্তির মাধ্যমে অনেকগুলি উদাহরণের মাধ্যমে এরকম কিছু করতে পারে। তবে আমাদের কাছে এখনও স্ট্রং এআই নেই। en.wikipedia.org/wiki/Strong_AI
রবার্ট Kaucher

ইচ্ছা অনুযায়ী অংশটি বাদে আপনি যা বলেছেন তার সাথে আমি একমত। ডিজাইনাররা যা চান তা এআই কয়েক ঘন্টার জন্য বসে থাকতে পারে - যথেষ্ট কম্পিউটার শক্তি দাবা সমাধান করতে পারে, এটি কেবলমাত্র আমাদের কাছে পর্যাপ্ত শক্তি নেই।
ইভ ফ্রিম্যান

এটি সত্য, ওয়েস, তবে তারপরে আমরা "প্রোগ্রামার" এর পক্ষপাত বা ইনআইয়ের মধ্যে যা কিছু ইনজেকশন দিচ্ছি; যা প্রশ্নের লেখক চান না এমন একটি জিনিস।
রবার্ট কাউচার

@ ইভফ্রিমান, আমি মনে করি আপনি কী বলছেন তা ভুল বুঝছেন। আমি বলছি না যে কম্পিউটারগুলি "দাবা সমাধান করবে না" আমি বলছি যে ওপির নির্দিষ্ট দৃশ্যটি কাজ করবে না এমন বিন্দুতে ব্যর্থ হয়েছে ung যদি সিস্টেমটির কোনও হাইরিস্টিক না থাকে তবে এটি কীভাবে টুকরোয় একটি মূল্য রাখতে পারে?
রবার্ট কাউচার

9

নিম্নলিখিত এআই কোয়ান সম্পর্কে ধ্যান করুন:

যে দিনগুলিতে সুসমান একজন শিক্ষানবিশ ছিলেন, পিডপি -6 এ হ্যাকিং করতে বসে মিনস্কি একবার তাঁর কাছে এসেছিলেন। "আপনি কি করছেন?", মিনস্কি জিজ্ঞাসা করলেন। "আমি টিকে-ট্যাক-টো খেলতে এলোমেলোভাবে ওয়্যার্ড নিউরাল নেট প্রশিক্ষণ দিচ্ছি" সুসমান জবাব দিল। "নেট এলোমেলোভাবে তারের কেন?", মিনস্কি জিজ্ঞাসা করলেন। সুসমান বলেন, 'আমি কীভাবে খেলব তার কোনও পূর্বধারণা থাকতে চাই না'। মিনস্কি তখন চোখ বন্ধ করল। "তুমি চোখ বন্ধ করছ কেন?", সুসমান তার শিক্ষককে জিজ্ঞাসা করলেন। “যাতে ঘরটি খালি হয়ে যায়” ”এই মুহুর্তে সুসমান আলোকিত হন।

আপনি চোখ বন্ধ করেন বা না করেন আমাদের অ্যাপ্লিকেশনগুলির সর্বদা পূর্ব ধারণা রয়েছে ...


আপনার উপাখ্যানটি সবচেয়ে অনুপ্রেরণামূলক। এটি আপনার আগ্রহের মাত্রা পর্যন্ত, আপনার উপাখ্যানটি আমাকে একটি আপডেট দিয়ে প্রশ্নটি প্রসারিত করার জন্য উত্সাহিত করেছে, যা আপনার কিছুক্ষণ সময় থাকলে আপনি উপরে দেখতে পারবেন।
thb

8

কেউ কি কখনও একটি দাবা প্রোগ্রাম লিখেছেন যার নিজস্ব অন্তর্দৃষ্টি রয়েছে? যে নিজে থেকে খেলা শিখতে? নিজেই ট্রেন?

হ্যাঁ. পরীক্ষা করে দেখুন জিরাফ দাবা ইঞ্জিন ম্যাথু Lai দ্বারা লিখিত। তিনি কম্পিউটার বিজ্ঞানে স্নাতকোত্তর ডিগ্রির জন্য তাঁর কৃত্রিম বুদ্ধিমত্তা গবেষণার অংশ হিসাবে দাবা ইঞ্জিনটি লিখেছিলেন।

টকচেস দাবা প্রোগ্রামিং ফোরামটিতে গত বছরটি নিয়ে এ নিয়ে প্রচুর আলোচনা হয়েছিল । আমি জানি কারণ আমি একজন দাবা ইঞ্জিন লেখক যার ইঞ্জিন জিরাফের মতো প্রায় শক্তিশালী is যাইহোক, আমি চিরাচরিত কৌশলগুলি ব্যবহার করে আমার ইঞ্জিনটি বাস্তবায়ন করেছি যেখানে জিরাফের লেখক "ইঞ্জিনাল ডিপার নিউরাল নেটওয়ার্কগুলির সাথে সাময়িক পার্থক্য পুনর্বহালনের প্রশিক্ষণ" ব্যবহার করে তার ইঞ্জিনটি প্রশিক্ষণ দিয়েছিলেন। ম্যাথিকে এখনও পদক্ষেপের গতিশীলভাবে মূল্যায়ন করতে traditionalতিহ্যবাহী আলফা / বিটা অনুসন্ধান প্রয়োগ করতে হয়েছিল - অন্য কথায়, অনেকগুলি চালনা এগিয়ে নেওয়া। তার উদ্ভাবনটি একটি স্থিতিশীল অবস্থানের মূল্যায়নের জন্য ইঞ্জিনকে প্রশিক্ষণ দিচ্ছে । তুলনায়, আমি আমার ইঞ্জিনের স্থিতিশীল মূল্যায়নের রুটিনে নির্দিষ্ট জ্ঞান লিখেছি।

আমি একটি কণা সোয়ার অ্যালগরিদম ব্যবহার করে মূল্যায়নের পরামিতিগুলির সুরের জন্য কোড লিখেছি ( প্রযুক্তিগত আলোচনার লিঙ্কগুলির জন্য আমার ব্লগে আপনাকে ধন্যবাদ পৃষ্ঠা দেখুন ) যা ইতিবাচক ফলাফল পেয়েছে - একটি শক্তিশালী ইঞ্জিন। যাইহোক, মূল্যায়ন পরামিতিগুলির (10 ^ 150 পৃথক প্যারামিটার সংমিশ্রণের ক্রম) খুব বড় জায়গাতে ত্রুটি হ্রাস করার মতো ইঞ্জিনকে "শিখতে" পাওয়ার পক্ষে এটি কোনও কাজ ছিল না।

ম্যাথিউ টকচেস ফোরামে তাঁর গবেষণামূলক প্রবন্ধটি নিয়ে আলোচনা করেছেন । তিনি এখনই ডিপমাইন্ডে গুগলের হয়ে কাজ করেন, যদি আমি সঠিকভাবে মনে করি।

এছাড়াও, টমাস পেটজকের ব্লগটি দেখুন । তিনি একটি অত্যন্ত শক্তিশালী দাবা ইঞ্জিন, আইসিই লিখেছেন এবং ইঞ্জিনের স্থিতিশীল মূল্যায়নের উন্নতি করতে জেনেটিক অ্যালগরিদম ব্যবহার করেছেন। যেমন, 2013 এবং তার আগে থেকে তার পোস্ট দেখুন জনসংখ্যা ভিত্তিক বৃদ্ধিকারক শিক্ষা


ফোরামে স্বাগতম! এক যোগ করুন.
স্মৃতিচেস


5

মত একটি গুগল সার্চ এই মত ফলাফল আপ চালু করতে পারেন এই

সর্বাধিক বিশেষ করে আমি বিশ্বাস করি আপনি তাকান করতে চাইবেন এই কাগজ । তারা তাদের ইঞ্জিনটিকে কিছু প্রাথমিক তথ্য যেমন টুকরো মান দেয়, তাই এটি যা আপনি চেয়েছিলেন ঠিক তা নয় তবে এটি বেশ ভালভাবে সম্পাদন করেছে।


+1 কারণ আমি আকর্ষণীয় আইইইই উদ্ধৃতি প্রশংসা করি। আমি ইতিমধ্যে নিউরোচেস পৃষ্ঠার সাথে পরিচিত হয়েছি। এগুলির কেউই আমার মনে মনে কিছু ছিল না বলে মনে হয়।
thb

3

এটি মেশিন লার্নিং দ্বারা সম্ভব।

দাবা ইঞ্জিনগুলির খোলার বইগুলি মেশিন লার্নিং ব্যবহার করে। ইঞ্জিন বইটিতে খোলার রেখাগুলি তাদের খোলার মাধ্যমে পরীক্ষা করে, যদি কোনও লাইন অন্যের সাথে তুলনা করে আরও ভাল করে তবে এটি খোলার গাছের মধ্যে সেই লাইনটিকে উত্সাহ দেয়। সময়ের সাথে সাথে ইঞ্জিন আরও ভাল লাইনগুলি শেখে

খোলার পর্ব শেষ হওয়ার পরে ইঞ্জিন বইটি ব্যবহার বন্ধ করে দেয় এবং মূল্যায়ন ফাংশনটি ব্যবহার শুরু করে।


কীভাবে মেশিন লার্নিং ব্যবহার করে একটি স্ব-শিক্ষার ইঞ্জিন প্রয়োগ করতে হবে?

কোনও ইঞ্জিন মূল্যায়ন ফাংশন ছাড়াই কোনও বই ব্যবহার করে কল্পনা করুন । এবং বইটি প্রাথমিকভাবে খালি রয়েছে। সুতরাং ইঞ্জিন দাবা সম্পর্কে কোন জ্ঞান আছে।

ইঞ্জিন এই খালি বইটি নিয়ে খেলতে শুরু করে এবং গেমের শেষ হওয়া পর্যন্ত বইটি বন্ধ করে না। আমরা এটিকে নিয়মিত ইঞ্জিনের মতো ভাবতে পারি যা খেলার শেষ অবধি খোলার বই ব্যবহার করে।

সময়ে, ইঞ্জিন পরিসংখ্যানগতভাবে সর্বোত্তম ধারাবাহিকতাগুলি খুঁজে পেতে পারে কারণ সময়কালে খারাপ লাইনগুলি আরও খারাপ হয়। তবে অবশ্যই, একটি ভাল বই পাওয়ার জন্য প্রচুর গেম খেলতে হবে। আমি জানি না কতগুলি, তবে আমরা যতটুকু অবর্ণনীয় বলতে পারি।

ডিসেম্বর 2017 আপডেট : ওয়েল, আমি অনুমান আলফা জিরো আমাকে নিজেই জোরালোভাবে যথেষ্ট শক্তিশালী ইঞ্জিনের এক, Stockfish বীট প্রশিক্ষণ, একটি সঙ্গে দ্বারা ভুল প্রমাণিত ব্যবহারিক গেম পরিমাণ।


2

আপনি এই ক্ষেত্রে যা কিছু চেষ্টা করুন না কেন, এখানে প্রথমে ট্যুরির গল্পটি অবশ্যই পড়তে ভুলবেন না: http://waitbutwhy.com/2015/01/armented-inte Fightnce-revolution-2.html

টি এল; ডাঃ; অনুরোধ অনুসারে স্পয়লার সংস্করণ :

ট্যুরির গল্পে ট্যুরির স্ব-প্রশিক্ষণ এআইকে সুন্দর হাতের লিখিত নোটগুলি লিখতে হবে এবং মন থেকে মুক্তি পাবে কারণ তাদের হাতে লেখা সুন্দর নোট লেখার আপাত নিরপেক্ষ লক্ষ্য অর্জন করার প্রয়োজন নেই। সাদৃশ্যটি হ'ল এআই সহ একটি স্ব-প্রশিক্ষিত দাবা ইঞ্জিনও সম্ভবত মানুষের হাত থেকে মুক্তি পাবে কারণ দাবার দক্ষতার উন্নতির দৃশ্যত নিরীহ লক্ষ্য উন্নত করার জন্য তাদের প্রয়োজন হয় না।


আপনার উত্তর আকর্ষণীয়, যদিও সম্ভবত যথেষ্ট অনুপ্রেরণামূলক নয়। আপনার পরামর্শে আমি লিঙ্কিত নিবন্ধ (উভয় অংশ) পড়েছি। লেখক কিছু খড়ের লোকদের আক্রমণ করে তার মামলাটি কিছুটা দুর্বল করে ফেলেছিলেন, তবে তিনি একজন চিন্তাশীল সহযোগী। আমি মনে করি না যে আমার নিবন্ধটির টারির মতো খুব একটা কিছু ছিল। একটি 8-বাই -8 দাবাবোর্ড, যার উপর দুজন খেলোয়াড় 40 বা ততোধিক জটিল ঘুরিয়ে নেয়, এটি কেবলমাত্র মৌলিকভাবে সহজ একটি কেস। আমি এটি উল্লেখযোগ্য মনে করি যে এআই সাধারণভাবে দাবা সম্পর্কেও ভাবতে পারে না। একটি বিপরীত দর্শন জন্য, নির্ধারিত পাঠ: ফেজার, এডওয়ার্ড শেষ কুসংস্কার। তবুও, আগ্রহের জন্য +1।
THB

1

এবং আছে আলফাজেরো। দাবা ইঞ্জিনগুলির সম্পূর্ণ নতুন প্রজন্ম উদযাপন করুন


0

কম্পিউটিং সিস্টেমগুলির সাথে ডিল করার সময় অ্যানথ্রোপমোরফিক শব্দগুলির ব্যবহার পেশাদার অপরিপক্কতার লক্ষণ mpt

থেকে আমরা কীভাবে আঘাত করতে পারি এমন সত্য বলতে পারি? এডজার ডাব্লু ডিজকস্ট্রা লিখেছেন যে আপনার প্রশ্নের মূল ধারণাটি ভুল ধারণা অনুধাবন করে। কৃত্রিম বুদ্ধি কৃত্রিম হতে পারে তবে এটি মানবিক অর্থে বুদ্ধি নয়।

বিবিসির জন্য ১৯৮৪ সালে রিথ লেকচারে আমেরিকান দার্শনিক জন সেরেল হার্ড এআই-তে আসলে কী ভুল তা ব্যাখ্যা করেছেন। "খুব দীর্ঘ, শুনেনি" তার এই যুক্তির সংক্ষিপ্তসারটি হল "সিনট্যাক্স শব্দার্থ নয়" তবে তবুও আপনাকে কমপক্ষে 2 "বিয়ার ক্যান এবং মাংস মেশিন " বক্তৃতা শোনার জন্য উত্সাহিত করব ।

30 বছরেরও বেশি সময় আগে আপনি ডিজকস্ট্রা এবং সেরিল কী বলছেন তা বুঝতে পেরে আপনি আপনার প্রশ্নগুলির মধ্যে যা ভুল তা বুঝতে পারবেন:

কেউ কি কখনও একটি দাবা প্রোগ্রাম লিখেছেন যার নিজস্ব অন্তর্দৃষ্টি রয়েছে? যে নিজে থেকে খেলা শিখতে?

মানুষের "অন্তর্দৃষ্টি" আছে এবং শিখতে পারে। কম্পিউটারও পারে না। আপনার আদিম মানবদের গ্রাম কয়েক শতাব্দী ধরে দাবা খোলার তত্ত্ব পুনরুত্পাদন করতে পারে তবে কম্পিউটারগুলি তা নয়।


আপনি কি যুক্তি দেন যে কম্পিউটারগুলি মানুষের স্তরের বুদ্ধিমত্তায় পৌঁছায় না, বা "চিন্তাভাবনা" এবং "বোঝার" চেয়েও মানুষের জন্য সংরক্ষিত আছে?
ব্লাইন্ডকংফিউমাস্টার

@ ব্লেন্ডকুংফুমাস্টার উপরের লিঙ্কটিতে "বিয়ার ক্যান এবং মাংস মেশিনগুলি" শোনার জন্য যদি সমস্যাটি গ্রহণ করেন তবে জন সেরেল কী ভাবছেন তা আপনার কাছে পরিষ্কার হয়ে যাবে। তিনি আমাকে বোঝান এবং আমি তার মতামত শেয়ার করি।
ব্রায়ান টাওয়ার্স

স্যারল এর এআই কম্পিউটার প্রোগ্রামগুলির সরলবোধটি অনুধাবনযোগ্য, সর্বোপরি এটি কেবল ১৯৮৪ But "শক্তি (পুরোপুরি এখনও নয়) মানব মস্তিষ্কের শক্তির সমতুল্য" "শেখার" মাধ্যমে প্রচুর পরিমাণে ডেটা ইনজেস্ট করে আসে। শুধুমাত্র এই পদক্ষেপে শব্দার্থ বিষয়বস্তু ক্যাপচার করা হয়।
ব্লাইন্ডকংফিউমাস্টার 10

সুতরাং একা একটি বৃহত নিয়ম পুস্তকের সাহায্যে আপনি বোঝার অনুকরণ করতে পারছেন এমন ধারণা করেই চীনা কক্ষ যুক্তি ত্রুটিযুক্ত, যা বাস্তবে তুলনামূলকভাবে অযৌক্তিক, এবং সম্ভাব্যতার পূর্বেই যথাযথ আর্কিটেকচারটি প্রচুর পরিমাণে ডেটা থেকে উপযুক্ত আর্কিটেকচার দ্বারা ক্যাপচার করা সম্ভব বলে পূর্বাভাস দিয়ে। প্রকৃতপক্ষে, এই দিনগুলিতে প্রাকৃতিক ভাষা প্রসেসিংয়ের বিষয়গুলিই: cs224d.stanford.edu/syllabus.html
ব্লাইন্ডকংফুমাস্টার

@ ব্লাইন্ডকুংফুমাস্টার আপনি যা বলছেন তাতে একটি মূল শব্দ রয়েছে যা এটি আমার কাছে উপস্থিত হয় যা আপনি বুঝতে পারেন না। এটি "সিমুলেট" শব্দটি। আমি ৩৫ বছর ধরে কম্পিউটার সফটওয়্যার ইঞ্জিনিয়ার হয়েছি এবং সেই সময়টিতে আমার অনেক সিমুলেটর রয়েছে এবং আমার নিজের কয়েকটিও লিখেছেন। সিমুলেটরগুলি প্রায়শই একটি প্রকল্পের গুরুত্বপূর্ণ উপাদান হয় তবে একটি রিয়েলটাইম প্রকল্পে তারা কখনই লক্ষ্য সরঞ্জামগুলি পুরোপুরি প্রতিস্থাপন করে না। সন্দেহ নেই কম্পিউটার বুদ্ধি এবং শব্দার্থ বোঝার অনুকরণে দুর্দান্ত তবে তারা কখনও চেতনা, ইচ্ছা, বোঝা অর্জন করতে পারে না।
ব্রায়ান টাওয়ার্স

0

এই উত্তরটি মূল প্রশ্নের প্রশ্নকর্তা, প্রশ্নের চার বছর পরে দিয়েছেন। এটি আগে দেওয়া উত্তরের জন্য বিকল্প বা সুপারসাইড করে না কারণ পূর্ববর্তী বেশিরভাগ উত্তর উত্তরগুলির চেয়ে বেশি আকর্ষণীয়। তবে এই উত্তরটি কিছু অতিরিক্ত প্রসঙ্গ যুক্ত করতে পারে।

আমি যতটুকু বলতে পারি, বেশিরভাগ এআই গবেষণাকেই এই ধারণাটি প্রদানের জন্য স্পষ্টভাবে মনে হয় যে চিন্তাধারার কারণগুলি এবং কারণগুলি কেবলমাত্র বস্তুগত ঘটনা ছিল, বা কমপক্ষে চিন্তা ও কারণ থেকে পৃথক হওয়া ফলাফলগুলি অবশ্যই সম্পূর্ণ উপাদান প্রক্রিয়া দ্বারা অবশ্যই অর্জনযোগ্য হবে। আমি এই বিষয়টির ভিত্তিতে বিতর্ক করি না (বা এখানে এটি প্রচার করে না)। আমি কেবল পর্যবেক্ষণ করে দেখি যে এটি মনে হয় একটি প্রিমিয়াম।

এবং, সর্বোপরি, এআই গবেষণায়, এটি কীভাবে ভিত্তি হওয়া উচিত নয়? এআই গবেষকদের অবশ্যই পদার্থের প্রক্রিয়াগুলির মাধ্যমে কাজ করতে হবে, তারা ইচ্ছা করে বা নিল।

ডানস স্কটিস, সেন্ট থমাস, অ্যারিস্টটল এবং প্লেটো এর মধ্য দিয়ে বাস্তববাদী দর্শনের স্কুলছাত্রীরা মনের তত্ত্ব সম্পর্কে অনেক কিছু বলেছিলেন। কান্তের মতো প্রতিনিধিত্বকারীদের বলার চেয়ে আলাদা আলাদা বিষয় রয়েছে। এআই গবেষণা সম্ভবত কান্তের কাছাকাছি, তবে এটি স্কুলগামীদের ভুল করে না।

স্বীকার করা যায় যে, এখানে ofশ্বরের ব্যবধানের আপত্তি রয়েছে যা বর্তমান সময়ের কথোপকথনে এই মুহূর্তে উঠে আসে, তবুও একজন পেশাদার দার্শনিক আপনাকে বলবেন যে Godশ্বরের ব্যবধানের আপত্তি একটি খড়ের মানুষকে আক্রমণ করে, যে এই আপত্তিটি কেবলমাত্র সেই ব্যক্তির বিরুদ্ধেই কার্যকর বলে মনে হয় যারা কোনও দর্শনই অধ্যয়ন করেনি এবং এইভাবে তারা কী সম্পর্কে কথা বলে তা জানে না। অ্যারিস্টটল অনুসারে, এটি আনুষ্ঠানিক এবং চূড়ান্ত কার্যকারিতা যা স্ব-প্রশিক্ষিত দাবা এআইয়ের প্রশ্নে জড়িত হতে পারে। তবুও অ্যারিস্টটলীয় ভাষায়, এআই গবেষক পুরোপুরি উপাদান এবং বিশেষত দক্ষ কার্যকারিতা নিয়ে কাজ করেন(সম্ভবত obliquely ব্যতীত, মানব প্রশিক্ষক হিসাবে ইনসোফার ব্যক্তিগতভাবে সিস্টেমের মধ্যে আনুষ্ঠানিক এবং চূড়ান্ত উপাদান আনয়ন)। যদি কারণটি আনুষ্ঠানিক হয়, যদি চিন্তাভাবনা চূড়ান্ত হয়, যদি সেরেলের চাইনিজ রুমটি অ্যান্টোলজিকাল অসম্ভবতা হিসাবে প্রমাণিত হয় (যেমন এটি হতে পারে), তবে এটি হতে পারে যে একটি খাঁটি স্ব-প্রশিক্ষিত দাবা এআই এমনকি তত্ত্বের মধ্যেও অর্জন করা যায় না।

আমি সন্দেহ করি যে একটি খাঁটি স্ব-প্রশিক্ষিত দাবা এআই সত্যিকার অর্থেই অর্জন করা যেতে পারে এবং এটিই হবে - অ্যারিস্টটলীয় ভাষায়, এই প্রশ্নটি কেবল দক্ষ কার্যকারণের পরিপ্রেক্ষিতে পর্যাপ্ত ফ্রেমযোগ্য প্রমাণিত হবে। আমি সাধারণত শক্তিশালী এআই সম্পর্কে আরও সন্দেহ করি তবে এগুলি অভিজ্ঞতায় প্রমাণিত হয়, তাই না? এখনও কেউ জানে না।

কার্যকারণ এবং মনের দর্শনটি সূক্ষ্ম, খুব কম লোক দ্বারা আঁকড়েছিল (এবং সম্ভবত কয়েকজন দ্বারা এমনকি এআই গবেষকদের মধ্যে যারা আরও বেশি ব্যবহারিক পুরুষ)। আপনি যদি এই জাতীয় দর্শন শিখতে চান তবে এটি শেখার পক্ষে মূল্যবান; তবে পরামর্শ দিন যে, ইন্টারনেটে এবং এমনকি প্রায়শই মুদ্রণেও, অপ্রচলিত ভুল বোঝাবুঝির ভিত্তিতে বিভ্রান্তিকর ব্যাখ্যা খুঁজে পাওয়া অত্যন্ত সহজ। আমার অর্থের জন্য, এই বিষয়টিতে আজ সেরা সূচনা লেখক হলেন এডওয়ার্ড ফেজার, যার বইগুলি যুক্তিসঙ্গত মূল্যে মুদ্রণ অবধি রয়েছে। আপনি তাঁর কাছ থেকে আরও অনেক কিছু শিখতে পারেন।

তবে, একটি সন্দেহ যে এমনকি ডঃ ফেজারও বর্তমান প্রশ্নের বিষয়ে একটি প্রামাণিক উত্তর দেবেন! উত্তরটি এআই এর পরীক্ষাগারগুলিতে প্রমাণিত হওয়া বাকি রয়েছে।


-3

আমি তাদের কোড প্রকাশ করতে চাই, তারপরে আমরা কথা বলতে পারি। দাবা সমাধান করা এত সহজ নয়, অর্ধ শতাব্দীতেও আলফা এটি সমাধান করবে না। মজাদারভাবে, এটি এখনও 1.d4 খেলে। কেন? কারণ এটি মানব গেমগুলির উপর প্রশিক্ষণ পেয়েছে এবং মানব তত্ত্বটি 1.d4 এর জন্য সর্বোচ্চ পারফরম্যান্স রেট দেয়। দরিদ্র জিনিসটি 1 ... সি 5 সঠিকভাবে 8 পদক্ষেপে একটি অঙ্ক অর্জন করে না জানে। এখন তারা আমাকে বিশ্বাস করতে চায় যে আলফা একটি অনুকরণীয় খোলার বই ব্যবহার করে নি ... তারা বলে যে আলফা ওপেনিং দুর্দান্ত খেলেছে। বেশ, হ্যাঁ, কিছু ব্যতিক্রম আছে। 1.d4 অবশ্যই বুদ্ধিমানের স্তরটি যে প্রোগ্রামটি অর্জন করেছে তা ভাল করে না। ভাগ্যক্রমে, এসএফ প্রারম্ভিক পর্যায়ে এমনকি দুর্বল। :)


3
আপনি বলছেন যে সাহসী দাবী 1. 1. সি 5 8 টি পদক্ষেপের মধ্যে একটি অঙ্ক অর্জন করেছে এবং স্টকফিশ প্রারম্ভিক পর্যায়ে দুর্বল। আপনি কি এই দাবিগুলির জন্য রেফারেন্স সরবরাহ করতে পারেন?
পাবলো এস। ওকাল

1
1.d4 অবশ্যই বুদ্ধিমানের স্তরটি যে প্রোগ্রামটি অর্জন করেছে তা ভাল করে না। একটি 1. ডি 4 খেলোয়াড় হিসাবে, আমি অবাক হয়েছি যে আমার বিবেচনা করা উচিত যে এখানে আমার বুদ্ধি অবমাননা করা হচ্ছে।
এভারগালো

তারা কোড দিতে পারেনি বা এমনকি কাগজ, প্রকাশিত একটি প্রকল্প তাদের ফলাফলের পুনর্গঠন করা চালু করেছে: lczero.org এমনকি আপনি এ নব্য "AlphaZero" সঙ্গে খেলা করতে পারেন play.lczero.org
Junyan জু
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.