কোন মেশিনকে কী অনুপ্রাণিত করবে?


12

বর্তমানে, এআই বিকাশের ক্ষেত্রের মধ্যে, মূল ফোকাসটি প্যাটার্ন স্বীকৃতি এবং মেশিন লার্নিংয়ের দিকে রয়েছে বলে মনে হচ্ছে। প্রতিক্রিয়া লুপের উপর ভিত্তি করে শিখতে অভ্যন্তরীণ ভেরিয়েবলগুলি সমন্বয় করা about

মাসলোর প্রয়োজনীয়তার শ্রেণিবিন্যাস হ'ল আব্রাহাম মাসলো প্রস্তাবিত মনোবিজ্ঞানের একটি তত্ত্ব যা দাবি করেছেন যে ব্যক্তিদের উচ্চ-প্রাথমিক প্রয়োজন অর্জনের জন্য প্রেরণা পাওয়ার আগে তাদের বেশিরভাগ মৌলিক চাহিদা অবশ্যই পূরণ করতে হবে।

কোনও মেশিনকে কীভাবে অভিনয় করতে প্ররোচিত করতে পারে? কোনও মেশিনে কি এমন কোনও ডিএনএ-জাতীয় কাঠামো থাকা উচিত যা তার প্রয়োজনের শ্রেণিবিন্যাসকে বর্ণনা করবে (মাসলোর তত্ত্বের অনুরূপ)? মেশিনের মৌলিক চাহিদা কী হতে পারে?


1
আকর্ষণীয় প্রশ্ন, এবং এআই আপনাকে স্বাগতম! (গেম তত্ত্বের সাথে সম্পর্কিত, এবং অন্যান্য অবদানকারীরা
বিষয়টিতে

1
সহজভাবে বললে এটি ইউটিলিটি ফাংশন হবে । এই উত্তরটি সাহায্য করতে পারে
উগনেস

উত্তর:


5

অনুপ্রেরণা বাস্তবায়নের বর্তমান পদ্ধতিটি একরকম কৃত্রিম পুরষ্কার। উদাহরণস্বরূপ ডিপমাইন্ডের ডিকিউএন গেমের স্কোর দ্বারা চালিত। স্কোর যত বেশি, তত ভাল। এআই সর্বাধিক পয়েন্ট পেতে এবং এর ফলে সর্বাধিক পুরষ্কার পেতে এর ক্রিয়াগুলি সামঞ্জস্য করতে শেখে। একে রিইনফোর্সমেন্ট লেয়ারিং বলা হয় । পুরষ্কার এআইকে তার ক্রিয়াকলাপগুলি মানিয়ে নিতে উত্সাহিত করে, তাই কথা বলতে।

আরও প্রযুক্তিগত পদে, এআই ইউটিলিটি সর্বাধিক করতে চায়, যা বাস্তবায়িত ইউটিলিটি ফাংশনের উপর নির্ভর করে । ডিকিউএন এর ক্ষেত্রে এটি খেলায় সর্বাধিকতর হবে।

মানুষের মস্তিষ্ক একটি অনুরূপ ফ্যাশনে কাজ করে, যদিও কিছুটা আরও জটিল এবং প্রায়শই সরল সামনে না। মানুষ হিসাবে আমরা সাধারণত ডোপামিন এবং সেরোটোনিনের একটি উচ্চ আউটপুট উত্পাদন করতে আমাদের ক্রিয়াগুলি সামঞ্জস্য করার চেষ্টা করি । এটি শক্তিবৃদ্ধি শেখার সময় এআইগুলিকে নিয়ন্ত্রণ করতে ব্যবহৃত পুরষ্কারের মতো similar মানব মস্তিষ্ক শিখে যে কোন ক্রিয়াগুলি those পদার্থগুলির সর্বাধিক পরিমাণ উত্পাদন করে এবং আউটপুট সর্বাধিককরণের কৌশলগুলি সন্ধান করে। এটি অবশ্যই এই জটিল প্রক্রিয়াটির সরলীকরণ, তবে আপনি ছবিটি পান।

আপনি যখন অনুপ্রেরণার কথা বলেন, দয়া করে এটিকে চেতনা বা কোয়ালিয়ার সাথে মিশ্রিত করবেন না । এগুলি মোটেই প্রেরণার জন্য প্রয়োজন হয় না। আপনি যদি এআই তে চেতনা এবং কোয়ালিয়া নিয়ে আলোচনা করতে চান তবে এটি সম্পূর্ণ ভিন্ন বলের খেলা।

একটি শিশু কৌতূহলের খাতিরে কৌতূহলী নয়। এটি অন্বেষণ করার সময় এটি ইতিবাচক শক্তিবৃদ্ধি পায় কারণ সন্তানের মস্তিষ্কের ইউটিলিটি ফাংশন সার্থক স্নায়বিক ট্রান্সমিটারগুলি প্রকাশের মাধ্যমে অন্বেষণকে পুরষ্কার দেয়। সুতরাং প্রক্রিয়া একই। এআইতে এটি প্রয়োগ করার অর্থ একটি ইউটিলিটি ফাংশন সংজ্ঞায়িত করা যা নতুন অভিজ্ঞতার পুরষ্কার দেয়। একরকম শক্তিশালী পুরষ্কার ছাড়া কোনও অভ্যন্তরীণ ড্রাইভ নেই।


সম্পাদনার ক্ষেত্রে আমি মনে করি "একটি ইউটিলিটি ফাংশন যা নতুন অভিজ্ঞতার পুরষ্কার দেয়" এর একটি ভাল উদাহরণ হ'ল কেইন স্ট্যানলে তার ঝরঝরে অ্যালগরিদমে ব্যবহার করার প্রস্তাবিত অভিনবত্ব সন্ধানের ফিটনেস ফাংশন।
নিক

5

এটি আসলে একটি আকর্ষণীয় প্রশ্ন।

জেফ হকিনস এবং সান্দ্রা ব্লেকসির লেখা "অন বুদ্ধিমত্তা" বইয়ে "কৌতূহলটি কোথা থেকে উদ্ভূত হতে পারে" সম্পর্কে একটি যথেষ্ট বাস্তব ধারণা রয়েছে।

এটি এ জাতীয় বক্তব্যের ভিত্তিতে:

  • মন পৃথিবীর নিজস্ব মডেল তৈরি করে যেখানে এটি বিদ্যমান।

  • এটি সমস্ত সময় সম্পর্কে ভবিষ্যদ্বাণী করে (আসলে জেফ হকিন্স বলে যে এটি বুদ্ধির মূল বৈশিষ্ট্য)।

  • যখন কোনও বিষয় সম্পর্কে ভবিষ্যদ্বাণীটি বিশ্বের যথাযথ আচরণ দ্বারা অনুসরণ করা হয়নি, তখন এই জিনিসটি মনের কাছে খুব আকর্ষণীয় হয়ে ওঠে (মডেলটি ভুল এবং সংশোধন করা উচিত) এবং আরও মনোযোগ প্রয়োজন।

উদাহরণস্বরূপ, আপনি বাম মানুষের চোখের দিকে তাকালে আপনার মস্তিষ্ক ভবিষ্যদ্বাণী করে যে এটি একটি মানুষের মুখ এবং ডানদিকে দ্বিতীয় চোখের হওয়া উচিত। আপনি ডানদিকে তাকান এবং একটি .. নাক! কী আশ্চর্য! এটি এখন আপনার সমস্ত মনোযোগ নেয় এবং আপনার মডেলটির সাথে খাপ খায় না এমন একটি অদ্ভুত জিনিস সম্পর্কে আরও পর্যবেক্ষণ করার জন্য আপনার এই অনুপ্রেরণা রয়েছে।

সুতরাং আমি বলব যে এআই তার মডেল অনুসারে কিছু নির্দিষ্ট করতে পারে বা এলোমেলো আচরণ করতে পারে যখন বিশ্ব সম্পর্কে এটি করা ভবিষ্যদ্বাণীগুলি সত্য are তবে একবার কিছু ভবিষ্যদ্বাণী ভঙ্গ হয়ে গেলে এআই এর মডেলটিতে ত্রুটি-সংশোধন করার প্রেরণা পায়।

একটি সাধারণ ক্ষেত্রে একটি মেশিন তার আউটপুট দিয়ে যা কিছু করতে পারে কেবল সমস্ত কিছু এলোমেলোভাবে শুরু করে। যখন এটির কোনও মডেল বা র্যান্ডম মডেল নেই যখন এটি কোনও ধরণের ক্রম বা পুনরাবৃত্তি নিদর্শনগুলি সনাক্ত করে এটি "আগ্রহী" হয়ে উঠছে এবং এটি মডেলটিতে যুক্ত করে। কিছুক্ষণ পরে, মডেল আরও পরিশীলিত হয়ে ওঠে আরও জটিল ভবিষ্যদ্বাণী করে এবং একটি মডেলের উচ্চ স্তরের ভুলগুলি সনাক্ত করে। আস্তে আস্তে এটি সব কিছু মনে রাখার পরিবর্তে আকর্ষণীয় কিছু পর্যবেক্ষণ করতে কী করতে হবে তা জানতে পারে।


অবদানের জন্য আপনাকে ধন্যবাদ! আমি মূলত একই সিদ্ধান্তে এসেছি ... এখন এটি বাস্তবায়নের একটি উপায় নিয়ে ভাবছি :)
আলেক্সেই মেইদ

এই উত্তরটি একটি গুরুত্বপূর্ণ বিষয় তৈরি করে। পূর্বাভাস মডেলগুলিতে ত্রুটি সংশোধন একটি বুদ্ধিমান এআইকে কৌতূহলীভাবে শিখতে ও অভিনয় করার জন্য একটি দুর্দান্ত উত্সাহ প্রদান করবে।
শেঠ সিম্বা

3

আমি রিইনফোর্সমেন্ট লার্নিং কোর্সের প্রথম বক্তৃতায় প্রফেসর রিচার্ড সুতনকে অনুরূপ প্রশ্ন জিজ্ঞাসা করেছি । দেখে মনে হচ্ছে মেশিনটিকে প্রেরণা দেওয়ার বিভিন্ন উপায় রয়েছে। আসলে, যন্ত্রের অনুপ্রেরণা আমার কাছে গবেষণার নিবেদিত ক্ষেত্রের মতো বলে মনে হয়।

সাধারণত, মেশিনগুলি আমরা যা উদ্দেশ্য উদ্দেশ্য বা ব্যয় ফাংশন বা ক্ষতি ফাংশন বলি তার দ্বারা অনুপ্রাণিত হয় । এগুলি একই ধারণার বিভিন্ন নাম। কখনও কখনও, তারা দ্বারা চিহ্নিত করা হয়

L(a)

মেশিন লক্ষ্য তারপর হয় একটি কম সমস্যা সমাধানের জন্য হয়, , অথবা একটি বৃহদায়ন সমস্যা, , সংজ্ঞা উপর নির্ভর করে ।minaL(a)maxaL(a)L


1

গেমসের প্রসঙ্গে আমি এটি নিয়ে ভাবতে কিছুটা সময় ব্যয় করেছি।

পুরষ্কারের ফাংশনগুলির সমস্যাটি হ'ল তারা সাধারণত ওজনযুক্ত নোডগুলিকে জড়িত যা কার্যকর তবে শেষ পর্যন্ত বস্তুগতভাবে অর্থহীন।

এখানে দুটি বস্তুগত অর্থপূর্ণ পুরষ্কার রয়েছে:

গুণগত উত্স

এমন একটি খেলা বিবেচনা করুন যেখানে একটি এআই পয়েন্টগুলির জন্য নয়, তবে প্রসেসরের সময় এবং মেমরির জন্য প্রতিযোগিতা করছে।

গেমটিতে অ্যালগরিদম যত ভাল পারফর্ম করবে তত মেমরি এবং প্রসেসিং এর এতে অ্যাক্সেস রয়েছে। এটির একটি ব্যবহারিক প্রভাব রয়েছে - অটোম্যাটায় যত বেশি সংস্থান পাওয়া যায়, তত তার ক্ষমতা তত শক্ত। (অর্থাত্ এটির যৌক্তিকতা সিদ্ধান্ত নেওয়ার জন্য সময় এবং স্থানের দিক দিয়ে কম সীমাবদ্ধ নয় Thus) সুতরাং অ্যালগরিদম এ জাতীয় প্রতিযোগিতাটি "চালিত" হতে পারে।

শক্তি

পর্যাপ্ত পরিমাণে "আত্মসচেতনতা" সহ যে কোনও অটোমেটা, এখানে নির্দিষ্টভাবে জ্ঞানকে উল্লেখ করে যে এটি প্রক্রিয়াজাতকরণের জন্য শক্তি প্রয়োজন, বিটের অপ্রয়োজনীয় উল্টাপাল্টা অপসারণের জন্য (নিজস্ব অপ্রয়োজনীয় শক্তি খরচ।) নিজের কোডটি স্ব-অনুকূলিতকরণের জন্য প্রেরণাযুক্ত হবে

এ জাতীয় অ্যালগরিদম তার বিদ্যুৎ সরবরাহ নিশ্চিত করতে উত্সাহিত করা হবে যাতে এটি কাজ চালিয়ে যেতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.