গেমস বাদে শক্তিবৃদ্ধি শেখার কোনও অ্যাপ্লিকেশন রয়েছে?


13

গেমস বাদে অন্য অ্যাপ্লিকেশনগুলিতে শক্তিবৃদ্ধি শেখার কোনও উপায় আছে কি?

আমি ইন্টারনেটে কেবলমাত্র উদাহরণ খুঁজে পাচ্ছি সেগুলি গেম এজেন্টগুলির। আমি বুঝতে পারি যে ভিএনসি'র সংযুক্তি নেটওয়ার্কের মাধ্যমে গেমসে ইনপুট নিয়ন্ত্রণ করে। একটি সিএডি সফ্টওয়্যার বলতে কি এটি সেট আপ করা সম্ভব?


3
হ্যাঁ, এটি সম্ভব তবে আসল প্রশ্নটি হওয়া উচিত এটি অন্যান্য অ্যালগরিদমের চেয়ে বেশি দক্ষ কিনা whether আপনার যদি একটি নির্দিষ্ট লক্ষ্য থাকে তবে আপনি এটিকে ভাবতে পারেন এবং এটিকে একটি গেম হিসাবে মডেল করতে পারেন (এমনকি জীবনও একটি খেলা;))। আসলে, অনেকগুলি সফল এআই একাধিক প্রযুক্তির সুবিধা নিয়েছে। এটি একবার দেখুন: ডেটাসায়েন্স.স্ট্যাকেক্সেঞ্জার
প্রশ্নগুলি

2
আলফাগো সম্পর্কিত বিষয়টি হ'ল বিশেষত একটি নির্দিষ্ট ধরণের গেম ( অ-তুচ্ছ , অ-সুযোগ, নিখুঁত তথ্য) এআইয়ের জন্য একটি দুর্দান্ত প্রমাণকারী ক্ষেত্র সরবরাহ করে কারণ এই গেমগুলির খুব সাধারণ পরামিতি রয়েছে, তবে প্রকৃতির সাথে জটিলতা রয়েছে। গেমস, একটি নির্দিষ্ট দৃষ্টিকোণ থেকে, সবচেয়ে দরকারী ধরণের শিল্পকর্ম কারণ তারা বিমূর্ত এবং কৌশলগত চিন্তাভাবনা শেখায়। গেমগুলির গুরুত্ব বোঝার জন্য কম্পিউটার বিজ্ঞানের গেম থিওরির প্রভাবটি দেখুন ।
ডিউকঝৌ

সেটা এনডিএর কারণেও হতে পারে। সেরা লার্নিং অ্যাপস হ'ল মালিকানাধীন, যেমন সেরা সেল টাওয়ার সফ্টওয়্যার বা সেরা ভয়েস স্বীকৃতি বা সেরা অনলাইন শপিং কেন্দ্র are এটি সাধারণভাবে ইঞ্জিনিয়ারিং।
ফৌখ্রিস্টিয়ান

ঠিক। সকলেরই যদি গেম তত্ত্ব হয় তবে বিশ্ব একটি গেম হয়ে যায়।
ফেলিসিটিসি

উত্তর:


2

শক্তিবৃদ্ধি শেখার একটি দুর্দান্ত উদাহরণ হ'ল একটি স্বায়ত্তশাসিত উড়ন্ত হেলিকপ্টার। অ্যান্ড্রু এনজি এবং অন্যদের দ্বারা সম্প্রতি করা জিনিসগুলির কিছু শিখতে আমার সুযোগ হয়েছিল। এখানে গবেষণামূলক নিবন্ধের কাগজটি দেওয়া আছে । অনুরূপ অন্যান্য কাগজপত্র আছে। আপনি আরও শিখতে চাইলে এগুলি গুগল করতে পারেন।

আপনি এই ইউটিউব ভিডিওতে এটি কর্মেও দেখতে পাচ্ছেন ।

স্পষ্টতই এখানে অর্থের ক্ষেত্রে সম্পূর্ণ আলাদা আলাদা আবেদন রয়েছে।


2

আপনি শক্তিবৃদ্ধি শেখার সাহিত্যে প্রচুর গেমের উদাহরণ দেখতে পাবেন, কারণ গেমের পরিবেশগুলি প্রায়শই দক্ষতার সাথে কোড করা যায় এবং একক কম্পিউটারে দ্রুত চালানো যেতে পারে যা পরিবেশ এবং এজেন্টকে ধারণ করতে পারে। ক্লাসিক গেমগুলির জন্য, যেমন ব্যাকগ্যামন, চেকার, দাবা, যান, তারপরে এমন মানব বিশেষজ্ঞ রয়েছে যা আমরা ফলাফলগুলির সাথে তুলনা করতে পারি। কিছু গেমস বা সরলিকৃত গেমের মতো পরিবেশগুলি সাধারণত বিভিন্ন পদ্ধতির তুলনা করতে ব্যবহৃত হয়, যেমন এমএনআইএসটি হস্তাক্ষর অঙ্কগুলি তত্ত্বাবধানে শেখার পদ্ধতির তুলনা করার জন্য ব্যবহৃত হয়।

গেমস বাদে অন্য অ্যাপ্লিকেশনগুলিতে শক্তিবৃদ্ধি শেখার কোনও উপায় আছে কি?

হ্যাঁ. অনানুষ্ঠানিকভাবে আপনি যখনই কোনও পরিবেশের মধ্যে কাজ করা এজেন্ট হিসাবে কোনও সমস্যা তৈরি করতে পারেন যেখানে এটি রাষ্ট্রের সাথে এবং লক্ষ্য-প্রভাবকৃত পুরষ্কারের মূল্য সম্পর্কে অবহিত করা যেতে পারে তখনই আপনি শক্তিবৃদ্ধি শেখার পদ্ধতির প্রয়োগ করতে পারেন। আরও আনুষ্ঠানিকভাবে, শক্তিবৃদ্ধি শেখার তত্ত্বটি মার্কভ সিদ্ধান্ত প্রক্রিয়াগুলির সমাধানগুলির উপর ভিত্তি করে তৈরি করা হয় , সুতরাং আপনি যদি নিজের সমস্যার বিবরণটি এমডিপিতে ফিট করতে পারেন তবে আরএল-তে ব্যবহৃত বিভিন্ন কৌশল যেমন- কি-লার্নিং, সারসা, রেইনফোর্স - প্রয়োগ করা যেতে পারে। ফলস্বরূপ সিস্টেমটি কাজ করার জন্য এই তত্ত্বের সাথে উপযুক্ত হওয়ার প্রয়োজন নেই, উদাহরণস্বরূপ আপনি প্রায়শই অজানা বা অপূর্ণভাবে পর্যবেক্ষিত রাষ্ট্রকে এজেন্টের সাথে কার্যকরভাবে এলোমেলো হিসাবে বিবেচনা করতে পারেন এবং স্টোকাস্টিক পরিবেশের এই অংশটি বিবেচনা করতে পারেন।

বিনোদনমূলক গেমগুলির বাইরে শক্তিবৃদ্ধি শেখার জন্য সম্ভাব্য ব্যবহারের কয়েকটি উদাহরণ এখানে রয়েছে:

  • মোটরযুক্ত রোবটের জন্য যুক্তি নিয়ন্ত্রণ করুন, যেমন প্যানকেকগুলি ফ্লিপ করা শিখতে এবং অন্যান্য উদাহরণ । এখানে পরিবেশ পরিমাপ রোবোটের শারীরিক সেন্সর দ্বারা তৈরি করা হয়। পুরষ্কার একটি লক্ষ্য সম্পন্ন করার জন্য দেওয়া হয়, তবে মসৃণতা, শক্তির অর্থনৈতিক ব্যবহার ইত্যাদির জন্যও সামঞ্জস্য করা যেতে পারে এজেন্টটি মোটর টর্ক বা রিলে অবস্থানের মতো নিম্ন স্তরের ক্রিয়াগুলি চয়ন করে। তত্ত্বের ক্ষেত্রে নেস্টেড এজেন্ট থাকতে পারে যেখানে উচ্চ স্তরের ব্যক্তিরা নিম্ন-স্তরেরের জন্য লক্ষ্যগুলি বেছে নেয় - যেমন রোবট তিনটি কাজের মধ্যে একটি করে বিভিন্ন স্থানে যাওয়ার প্রয়োজনের মধ্যে একটি উচ্চ স্তরে সিদ্ধান্ত নিতে পারে এবং নিম্ন স্তরে হতে পারে রোবটকে তার বেছে নেওয়া লক্ষ্যে নিয়ে যাওয়ার জন্য কীভাবে মোটরগুলি নিয়ন্ত্রণ করতে হয় তার সিদ্ধান্ত

  • স্ব-চালনা গাড়ি। যদিও সেন্সর ব্যাখ্যার উপর অনেক বেশি ফোকাস করা হয়েছে - রাস্তা চিহ্নিতকরণ, পথচারী ইত্যাদি দেখে, ত্বরণকারী, ব্রেক এবং স্টিয়ারিং নির্বাচন করার জন্য একটি নিয়ন্ত্রণ ব্যবস্থা প্রয়োজন।

  • স্বয়ংক্রিয় আর্থিক বাণিজ্য। কারও কারও কাছে সম্ভবত একটি খেলা, এর বাস্তব-বিশ্ব পরিণতি স্পষ্ট। পুরষ্কার সংকেত যদিও যথেষ্ট সহজ, এবং আরএল দীর্ঘ বা স্বল্পমেয়াদী লাভগুলি অগ্রাধিকারের জন্য সামঞ্জস্য করা যেতে পারে।

এটি একটি সিএডি সফ্টওয়্যার বলে সেট আপ করা সম্ভব?

তাত্ত্বিকভাবে হ্যাঁ, তবে বাস্তবে এটি করার জন্য কী কী উপলব্ধ হতে পারে তা আমি জানি না। এছাড়াও ভার্চুয়াল মাউস দেওয়ার আগে এবং কোনও কিছু আঁকতে কোনও টাস্ক স্থাপনের আগে এজেন্টের কোড করা (পুরষ্কারের মান হিসাবে এটি পর্যবেক্ষণ করতে পারে) আপনার মনে এক বা একাধিক লক্ষ্য প্রয়োজন। কম্পিউটার গেমগুলি তাদের স্কোরিং সিস্টেম হিসাবে নির্মিত একটি পুরষ্কার স্কিম নিয়ে আসে এবং ঘন ঘন প্রতিক্রিয়া সরবরাহ করে, যাতে কোনও এজেন্ট দ্রুত ভাল বনাম খারাপ সিদ্ধান্তের জ্ঞান অর্জন করতে পারে। আপনার এই স্কোরিং উপাদানটি এমন কিছু দিয়ে প্রতিস্থাপন করতে হবে যা সিএডি-ভিত্তিক সিস্টেমের জন্য আপনার লক্ষ্যগুলি উপস্থাপন করে।

সিএডি-তে অন্তর্নির্মিত উপযুক্ত কিছু নেই, যদিও বিভিন্ন পদার্থবিজ্ঞান ইঞ্জিন বা সসীম উপাদান বিশ্লেষণের মতো সিমুলেশন সহ সিএডি সরঞ্জামগুলি আপনাকে সিমুলেটেড শারীরিক পরিমাপের উপর ভিত্তি করে ডিজাইন স্কোর করতে দেয়। অন্যান্য সম্ভাবনার মধ্যে স্ট্রেন বিশ্লেষণ, উপাদানের অপব্যয়যুক্ত ব্যবহারের অন্তর্ভুক্ত, সিএডি / সিএএম সিস্টেম আংশিক বা সমাপ্ত নকশার জন্য যে পরিমাণ মেট্রিক সরবরাহ করতে পারে তা অন্তর্ভুক্ত। জটিল অংশটি তার লক্ষ্য বা উদ্দেশ্যে একটি নকশাকে সীমাবদ্ধ করছে এবং হয় পুরস্কৃত করার জন্য ব্যবস্থা করছে বা পরিবেশে সীমাবদ্ধতা তৈরি করছে; কোনও আরএল এজেন্টকে সিএডি প্রক্রিয়াটির সম্পূর্ণ নিয়ন্ত্রণহীন নিয়ন্ত্রণ প্রদান এবং সর্বনিম্ন স্ট্রেনে পুরষ্কার প্রদানের ফলে খুব ছোট্ট একটি ঘনক্ষেত্রের মতো খুব উদ্বেগজনক কিছু ঘটতে পারে।


প্রচুর উপযোগী জিনিস: সর্বাধিক ভিজ্যুয়াল স্বচ্ছতার জন্য অটো-ডাইমেনশনিং, স্ট্রেনের অধীনে অংশগুলি চলার জন্য হস্তক্ষেপ অনুসন্ধান (এফএএ ছাড়াই), সিএএম আউটপুটকে অনুকূল করে তোলা, আনুমানিক জেড-গভীরতার তথ্য ইত্যাদি ব্যবহার করে ত্বরণ
প্রেরণা

@ ফৌক্রিশিয়ান: আমি নিশ্চিত না যে এই সমস্তগুলিকে কেবল গেম স্কোর হিসাবে পুরষ্কারের সংকেত হিসাবে খাওয়ানো যেতে পারে। উদাহরণস্বরূপ হ্রাস স্ট্রেনের জন্য কোনও নকশাকে অনুকূলকরণ করা বোঝায় যে আপনার নকশার একটি উদ্দেশ্য রয়েছে - সেই উদ্দেশ্যটি ট্র্যাক করার জন্য আপনাকে কিছু বাধা / বিধিও যুক্ত করতে হবে এবং আপনি যদি কিছু অ্যারগোনমিক বিশ্লেষণ না করেন তবে তা আরও শক্ত হতে পারে। যাইহোক, মন্তব্যটি আমি উল্লেখ করতে পারি এমন কিছু জিনিস যুক্ত করে এবং উত্তরে যুক্ত করব will
নিল স্লেটার

হ্যাঁ. সত্য। আমি চেষ্টা করবো. দয়া করে মন্তব্যগুলির স্ট্রিংটি ক্ষমা করুন I'll উপরের প্রতিটি ক্ষেত্রে আমার লক্ষ্য হ'ল যান্ত্রিক ডিজাইনারের উদ্বেগকে একক সুস্থতার সংকেততে সংহত করা যা পুনরাবৃত্তির পথনির্দেশ করতে পারে, এই সত্যতা মনে রেখে যে এনএন-এর একাধিক অঙ্গ থাকতে পারে যার প্রত্যেককেই আলাদা একীকরণ খাওয়ানো যেতে পারে। তবে সরলতার জন্য, আমি প্রতিটি কেসকে স্কেলারে একত্রিত করব। এগুলির বেশিরভাগের জন্য স্টোকাস্টিক উপাদান থাকা প্রয়োজন কারণ সিএডির বেশিরভাগ ক্ষেত্রে একত্রিত মানের পৃষ্ঠায় একাধিক সমালোচনামূলক পয়েন্ট রয়েছে।
ফৌখ্রিস্টিয়ান

স্বতঃ মাত্রা নির্ধারণ - w = sqrt (Σ মিনিট (s_clear, s_nice)) + কে এন_জম্পস, ... যেখানে ... ডাবলির অঙ্কের মাত্রার মানের মানের সমষ্টি, যা থেকে একটি সাধারণ প্রতিক্রিয়া সংকেত পাওয়া যায়, s_clear একটি মাত্রিক রেখা এবং লাফ লাইন বাদে নিকটতম অন্যান্য লাইনের মধ্যবর্তী দূরত্ব, s_nice একটি রূপক যা কোনও অঙ্কনের ধরণের আকারের জন্য লাইনগুলির মধ্যে ছাড়পত্রের একটি সুন্দর দূরত্বকে উপস্থাপন করে, কে একটি ধ্রুবক, এবং n_ জম্পস হ'ল জাম্প লাইনের সংখ্যা ( যেখানে লাইনগুলি অতিক্রম করবে কিন্তু দু'জনের মধ্যে একটির ফাঁক রয়েছে এটি নির্দেশ করার জন্য এটি অন্য লাইনের পিছনে ঝাঁপিয়ে পড়েছে)।
ফৌসিস্টিয়ান

হস্তক্ষেপ অনুসন্ধান - ডাব্লু = এন, ... যেখানে ... ডাবল হস্তক্ষেপ অনুসন্ধানের গুণগত সমষ্টি এবং এন অনুমানের গতিশীল সিমুলেশনে পুনরাবৃত্তি অনুমানগুলি খাওয়ানোর পরে প্রাপ্ত হস্তক্ষেপের সংখ্যা। এইটি ঠিক এমন একটি খেলার মতো যা আরও সঠিক হস্তক্ষেপ উচ্চতর স্কোর অনুমান করে।
ফৌসিস্টিয়ান

1

আসল ওয়েব, মোবাইল এবং ওয়ার্কস্টেশন অ্যাপ্লিকেশনগুলিতে অনেকে রিফ্রান্সড লার্নিংকে কল করছেন তা প্রবর্তনের অবশ্যই একটি উপায় রয়েছে definitely

সামরিক সংস্থাগুলি এটি করে, সিনেমা শিল্প এটি করে, সফটওয়্যার কেন্দ্রিক সংস্থাগুলি এটি করছে এবং আমি ফরচুন ৫০০ ব্যবসা এবং ছোট ব্যবসায়ের জন্য এটি করেছি। ফেসবুকের মুখের স্বীকৃতি রোবট থেকে গুগল ট্রান্সলেট থেকে ইউএসপিএস জিপ কোড স্বীকৃতি সিস্টেম থেকে স্বায়ত্তশাসিত ফ্লাইট এবং ট্র্যাফিক নিয়ন্ত্রণ ব্যবস্থা পর্যন্ত সমস্ত ধরণের সিস্টেম উপাদানগুলিতে অ্যাডেটিভ শেখার উপাদান রয়েছে। কম্পিউটার এডেড ডিজাইন সফটওয়্যার (সিএডি) অবশ্যই একটি কার্যকর লক্ষ্য target

শক্তিবৃদ্ধির জন্য ভিত্তি

ইভেন্টগুলি বর্ণনা করে এমন ভেক্টরগুলির একটি সিরিজ বিবেচনা করুন। কল্পনা করুন যে তারা দুটি উপ-সিরিজ এ এবং বিতে বিভক্ত হয়েছে একটি নিউরাল নেট (কৃত্রিম বা জৈবিক) এ ব্যবহার করে প্রশিক্ষণ দেওয়া যেতে পারে

প্রশিক্ষণটি তদারকি করা যেতে পারে, যার অর্থ ভেক্টরের অন্যতম মাত্রা হ'ল লেবেল হিসাবে বিবেচিত হয় এবং তাই নির্ভরযোগ্য পরিবর্তনশীল সর্বোত্তমভাবে পূর্বাভাস দেয়। অন্যান্য মাত্রা তখন তথ্য বা ইনপুট সংকেত হয়ে যায় এবং অতএব ভবিষ্যদ্বাণী করার জন্য স্বতন্ত্র পরিবর্তনশীল। বৈশিষ্ট্য নিষ্কাশন ব্যবহার করে প্রশিক্ষণটি নিরীক্ষণ করা যেতে পারে।

যে কোনও উপায়ে, বি এর পূর্বে যখন এ সরবরাহ করা হয় এবং বি আসার আগে উত্পাদনে (আসল ব্যবহার) সম্পাদনের প্রত্যাশিত হয়, বি এর পরবর্তী আগমনটি একটি পছন্দ উপস্থাপন করে।

  1. এ এর সাথে প্রশিক্ষণের সময় করা ওজন এবং যে কোনও মেটা-প্যারামিটার সমন্বয়গুলি মুছুন এবং এ এবং বি এর সংক্ষিপ্ত সিরিজ দিয়ে প্রশিক্ষণটি পুনরায় চালু করুন
  2. বি এর সাথে প্রশিক্ষণ চালিয়ে যান, সেই ক্ষেত্রে নেটওয়ার্কটি এ এর ​​সাথে পক্ষপাতদুষ্ট হবে এবং বি এর পরে প্রশিক্ষণের মাধ্যমে প্রাপ্ত ফলাফলের থেকে ফলাফল পৃথক হবে case
  3. উপরের # 1 পছন্দের জন্য প্রয়োজনীয় সংস্থান ব্যবহার এড়িয়ে গিয়ে এ এর ​​সাথে প্রথম প্রশিক্ষণ নেওয়ার পক্ষপাত সীমাবদ্ধ করার একটি উপায় সন্ধান করুন।

পছন্দ # 3 টি বেশিরভাগ ক্ষেত্রে সেরা পছন্দ কারণ এতে # 1 এবং # 2 টির সুবিধাগুলি রয়েছে। গাণিতিকভাবে, # 3 কোনওভাবে সিরিজ এ থেকে কী শিখেছে তার প্রিম্পিংকে সহজ করেই করা হয়। নিউরাল নেট ওজন এবং মেটা-প্যারামিটার সমন্বয়গুলি সংশোধন করার জন্য সংবেদনশীল করতে হবে কারণ নতুন অভিজ্ঞতা এটি করার প্রয়োজনীয়তা নির্দেশ করে। একটি নিষ্পাপ পদ্ধতির গাণিতিকভাবে বিপরীত সূচকীয় ফাংশন তৈরি করা যেতে পারে, যা পদার্থবিজ্ঞান, রসায়ন এবং সামাজিক বিজ্ঞানের অনেকগুলি ক্ষেত্রে প্রাকৃতিক ক্ষয়কে মডেল করে।

P = e -nt , যেখানে P সম্ভাব্যতাটি এখনও কার্যকরী, n হ'ল অতীত শেখা তথ্যের ক্ষয়ের হার, এবং টি হ'ল টাইম স্ট্যাম্প, সাব-সিকোয়েন্স (ব্যাচ) সংখ্যা হিসাবে সামনের অগ্রগতির কিছু পরিমাপ, ফ্যাক্ট সিকোয়েন্স নম্বর, বা ইভেন্ট নম্বর।

এ এবং বি উপ-সিরিজের ক্ষেত্রে, যখন উপরের সূত্রটি শেখার পদ্ধতিতে কোনও উপায়ে প্রয়োগ করা হবে, তখন এ এর ​​প্রশিক্ষণ বি ব্যবহার করে অব্যাহত প্রশিক্ষণের পরে চূড়ান্ত ফলাফলের দিকে কম পক্ষপাত করবে কারণ এ এর ​​জন্য টি কম হয় বি এর চেয়ে টি , মেকানিজমটি বলছেন যে বি সম্ভবত আরও প্রাসঙ্গিক।

যদি আমরা আরও এবং আরও দানাদার উপ-সিরিজ তৈরি করে অর্ধবৃত্তান্তে A এবং B কে পুনরায় বিভক্ত করি তবে পূর্বের তথ্যগুলি ধীরে ধীরে ক্ষয় হতে দেওয়ার উপরোক্ত ধারণাটি বৈধ এবং মূল্যবান উভয়ই থেকে যায়। প্রশিক্ষণের জন্য ব্যবহৃত প্রথম তথ্যের সাথে নেটওয়ার্কের পক্ষপাতিত্ব হ'ল সংকীর্ণতার মানসিক ধারণাগুলির সমতুল্য। স্তন্যপায়ী প্রাণীদের মস্তিস্কে বিবর্তিত এমন শিক্ষাব্যবস্থাগুলি মুক্ত মনোভাবকে উত্সাহিত করার জন্য অতীতের বিষয়গুলিতে ভুলে যাওয়া বা হারাতে মনে হয়, যা নতুন তথ্যটি শিখার জন্য আরও শক্তিশালী নিদর্শন থাকলে নতুন শিক্ষাকে মাঝে মাঝে পূর্ববর্তী শিখাকে ছাড় দেওয়া ছাড়া আর কিছুই নয়।

নতুন উদাহরণের ডেটাগুলিকে ধীরে ধীরে পুরানো উদাহরণের ডেটা ছাড়িয়ে যাওয়ার অনুমতি দেওয়ার জন্য দুটি কারণ রয়েছে।

  • পূর্ববর্তী শিক্ষার পক্ষপাতিত্বের উপরের অপসারণটি আরও সাম্প্রতিক ঘটনাগুলিকে পর্যাপ্ত পরিমাণে ওজনে আরও বেশি করে ওজন করতে পারে যদি অভিজ্ঞ সমস্ত ইভেন্ট (প্রশিক্ষণ প্রাপ্ত) ব্যবস্থাটি বাহ্যিক বিশ্বের সম্পর্কে সিস্টেমটি শিখার চেষ্টা করছে তবে তার যথাযথ তথ্য উপস্থাপন করে।
  • বাহ্যিক বিশ্বের পরিবর্তন হতে পারে এবং পুরানো পড়াশোনা আসলে অপ্রাসঙ্গিক বা এমনকি বিভ্রান্তিকর হয়ে উঠতে পারে।

শিক্ষার ধারা অব্যাহত রাখার দুটি প্রধান দিক হ'ল ধীরে ধীরে পূর্বের তথ্য ক্ষয়ের গুরুত্ব ধীরে ধীরে বাড়তে দেওয়া দরকার। দ্বিতীয় দিকটি প্রতিক্রিয়া সংকেত সম্পর্কিত ধারণার উপর নির্মিত সংশোধনমূলক ধারণার একটি সেট।

মতামত এবং শক্তিবৃদ্ধি

শক্তিশালী শেখার ক্ষেত্রে একটি প্রতিক্রিয়া সংকেত হ'ল যন্ত্র যন্ত্রণা, আনন্দ, সন্তুষ্টি এবং সুস্থতার মতো পরিচিত মনস্তাত্ত্বিক ধারণার সমতুল্য মেশিন লার্নিং। বৈশিষ্ট্য নিষ্কাশন, গ্রুপিংয়ের স্বাধীনতা, বা ইনপুট ইভেন্ট বৈশিষ্ট্যগুলি এবং তাদের লেবেলের মধ্যে সম্পর্কের সান্নিধ্যযুক্ত নিউরাল নেট ওজন ম্যাট্রিক্স সন্ধানের লক্ষ্য ছাড়িয়ে প্রশিক্ষণের গাইড করার জন্য লার্নিং সিস্টেমটিকে তথ্য দেওয়া হয়।

সরবরাহিত তথ্য অভ্যন্তরীণভাবে প্রাক-প্রোগ্রামযুক্ত প্যাটার্ন স্বীকৃতি থেকে বা বাহ্যিকভাবে পুরষ্কার এবং শাস্তি থেকে উত্পন্ন হতে পারে, যেমন স্তন্যপায়ী প্রাণীর ক্ষেত্রে। শক্তিশালী মেশিন লার্নিংয়ে যে কৌশলগুলি এবং অ্যালগরিদমগুলি বিকাশ করা হচ্ছে সেগুলি এই অতিরিক্ত সংকেতগুলি প্রায়শই ব্যবহার করা হয় (প্রক্রিয়াকরণে সময় কাটা ব্যবহার করে) বা ক্রমাগত সমান্তরাল প্রক্রিয়াকরণ আর্কিটেকচারগুলির প্রক্রিয়াকরণ ইউনিটের স্বাধীনতা ব্যবহার করে।

এই কাজটি এমআইটি-তে নরবার্ট ভিনিয়ারের দ্বারা সূচিত হয়েছিল এবং তার সাইবারনেটিক্স (এমআইটি প্রেস 1948) বইয়ের সূচনা হয়েছিল। সাইবারনেটিকস শব্দটি একটি পুরানো শব্দ থেকে এসেছে যার অর্থ জাহাজের স্টিয়ারিং । কোর্সে থাকার জন্য একটি রডারের স্বয়ংক্রিয় চলন প্রথম মেকানিকাল প্রতিক্রিয়া সিস্টেম হতে পারে। আপনার লন মাওয়ার ইঞ্জিনটির সম্ভবত একটি রয়েছে।

অভিযোজিত অ্যাপ্লিকেশন এবং শেখা

অভদ্র অবস্থান বা লনমওয়ার থ্রোটলের জন্য রিয়েল টাইমে সাধারণ অভিযোজন শিখছে না। এই ধরনের অভিযোজন সাধারণত রৈখিক পিআইডি নিয়ন্ত্রণের কিছু রূপ। মেশিন লার্নিং প্রযুক্তি আজ প্রসারিত হচ্ছে জটিল, ননলাইনার সিস্টেমগুলির মূল্যায়ন এবং নিয়ন্ত্রণকে আলিঙ্গন করে যা গণিতবিদরা বিশৃঙ্খল বলে অভিহিত করে।

বিশৃঙ্খলাবদ্ধ হয়ে এগুলির অর্থ এই নয় যে বর্ণিত প্রক্রিয়াগুলি প্রচণ্ড উন্মত্ত বা অগোছানো। দাওতিশিয়ানরা দশক আগে আবিষ্কার করেছিলেন যে সহজ অ-লিনিয়ার সমীকরণগুলি অত্যন্ত সংগঠিত আচরণের দিকে পরিচালিত করতে পারে। তারা যা বোঝায় তা হ'ল ঘটনাটি সামান্য পরিবর্তনের ক্ষেত্রে খুব স্পর্শকাতর কিছু নির্দিষ্ট অ্যালগরিদম বা সূত্র খুঁজে পাওয়ার জন্য ict

ভাষা যেমন হয়। একই বিবৃতিতে এক ডজন বিভিন্ন কণ্ঠস্বর প্রতিবিম্বের সাথে বোঝানো হয়েছে কয়েক ডজন ভিন্ন জিনিস। "সত্যই," ইংরেজি বাক্যটি একটি উদাহরণ। সম্ভবতঃ শক্তিবৃদ্ধি কৌশলগুলি ভবিষ্যতের মেশিনগুলিকে সেই বিবৃতিটির বিভিন্ন অর্থের মধ্যে সাফল্যের উচ্চ সম্ভাবনার সাথে পার্থক্য করতে দেয়।

গেমস কেন প্রথম?

গেমগুলির সম্ভাব্য দৃশ্যের একটি খুব সাধারণ এবং সহজেই সংজ্ঞায়িত সেট রয়েছে। কম্পিউটারের আবির্ভাবের অন্যতম প্রধান অবদানকারী, জন ভন নিউমান, থিওরি অফ গেমস এবং ইকোনমিক বিহেভিয়ার-এ যুক্তি দিয়েছিলেন যে তিনি ওসকার মরজেন্সটারের সহ-রচিত একটি বই লিখেছিলেন যে সমস্ত পরিকল্পনা ও সিদ্ধান্ত গ্রহণ আসলে বিভিন্ন জটিলতার খেলা হয়।

মস্তিষ্কের সংগ্রহের প্রশিক্ষণের উদাহরণের গেমগুলি বিবেচনা করুন যা সময়ে সময়ে এমন একটি সিস্টেম তৈরি করবে যা শিক্ষিত লোকের মতো একটি বিবৃতিটির অর্থ নির্ধারণ করতে পারে তিনটি ইঙ্গিতের উত্স থেকে।

  1. কথোপকথন বা সামাজিক দৃশ্যের মধ্যে প্রসঙ্গ
  2. স্পিকারের কণ্ঠস্বর প্রতিবিম্ব
  3. স্পিকারের মুখের ভাব এবং শরীরের ভাষা

দাবা এবং দ্য গেম অফ গো yond

সঠিক বোধগম্যতা এবং গভীর শ্রবণ ক্ষমতা সহ গেমগুলি থেকে ভাষা সিস্টেমে যাওয়ার পথে বদ্ধমূল শিক্ষার বিভিন্ন অ্যাপ্লিকেশন রয়েছে যা পৃথিবী এবং মানুষের অভিজ্ঞতার পক্ষে অনেক বেশি গুরুত্বপূর্ণ।

  • যে সমস্ত সিস্টেমগুলি কীভাবে লাইট, সরঞ্জামাদি, ডিজিটাল সিস্টেমগুলি, এইচভিএসি এবং অন্যান্য শক্তি গ্রহণকারী ডিভাইসগুলি বন্ধ করতে বা আঁকতে হয় তা শিখতে পারে - সময়ের সাথে জীবাশ্ম জ্বালানী সংস্থান হ্রাসের কারণে শক্তি সম্ভবত ইতিহাসের সবচেয়ে ভূ-রাজনৈতিকভাবে প্রভাবশালী পণ্য)
  • স্বায়ত্তশাসিত যানবাহনের বিকাশ - উন্মুক্ত রাস্তায় অজানা মনের মানুষেরা বিমান, আরভি, ট্রাক, বাস এবং ট্র্যাক্টর ট্রেলারগুলির মতো ভারী সরঞ্জাম চালনার বিপজ্জনক প্রবণতা সম্ভবত ভবিষ্যতের লোকেরা পাগলামি হিসাবে তাকাবে।
  • তথ্যের নির্ভরযোগ্যতার রেটিং - তথ্য সর্বত্র রয়েছে এবং এর 99% এরও বেশি ত্রুটি রয়েছে, হয় আংশিক বা সম্পূর্ণভাবে। ডাবল-ব্লাইন্ড র্যান্ডমাইজড স্টাডিজ বা নিশ্চিতকরণযোগ্য পরীক্ষাগার পরীক্ষা ও বিশ্লেষণকে সঠিকভাবে ডিজাইন করা এবং ব্যাখ্যা করা হয়, সত্যই গবেষণা দ্বারা খুব অল্পই প্রমাণীকরণ করা হয়।
  • স্বাস্থ্যসেবা অ্যাপ্লিকেশনগুলি যা পৃথকভাবে ভালভাবে রোগ নির্ণয় করে, উপাচারের প্রতিকার করে এবং পুনরাবৃত্তি এড়াতে ধারাবাহিক যত্নে সহায়তা করে।

এই চার এবং আরও অনেকগুলি স্বয়ংক্রিয় উচ্চ গতির বাণিজ্য বা বিজয়ী গেম প্রতিযোগিতাগুলির মাধ্যমে সম্পদ আহরণের চেয়ে অনেক বেশি গুরুত্বপূর্ণ, দুটি স্ব-কেন্দ্রিক মেশিন লার্নিং আগ্রহ যা কেবলমাত্র একক ব্যক্তির পরিবারের এক বা দুটি প্রজন্মকে প্রভাবিত করে।

গেম তত্ত্বের মধ্যে ধন এবং খ্যাতিকে শূন্য সমষ্টি গেম বলা হয় । তারা যতটা ক্ষয়ক্ষতি অর্জন করে তত বেশি ক্ষতি করে যদি আপনি উচ্চতর সোনার নিয়ম দর্শনের বিষয়টি বিবেচনা করেন যে অন্যরা এবং তাদের পরিবারগুলি আমাদের পক্ষে সমান গুরুত্ব দেয়।

সিএডি (কম্পিউটার এডেড ডিজাইন) সফ্টওয়্যার জন্য রিইনফোর্সড লার্নিং

কম্পিউটার এডেড ডিজাইন হ'ল কম্পিউটার ডিজাইনের প্রাকৃতিকভাবে অগ্রণী ব্যক্তি (মানুষের সাহায্য ছাড়াই), যেমন অ্যান্টি-লক ব্রেক স্বাভাবিকভাবেই সম্পূর্ণ স্বায়ত্তশাসিত যানবাহনের দিকে পরিচালিত করে।

কমান্ডটি বিবেচনা করুন, "আমার শাওয়ারের জন্য আমাকে একটি সাবান ডিশ তৈরি করুন যা আমার পরিবার তাদের চোখ না খোলা প্রথম চেষ্টা করে সাবানটি ধরার সম্ভাবনা সর্বাধিক করে তোলে এবং সাবান এবং ঝরনা পৃষ্ঠকে পরিষ্কার রাখতে অসুবিধা হ্রাস করে Here এখানে উচ্চতাগুলি রয়েছে আমার পরিবারের সদস্যরা এবং ঝরনার জায়গার কয়েকটি ছবি। তারপরে একটি 3 ডি প্রিন্টার ইনস্টলেশন নির্দেশাবলী সহ সংযুক্তি প্রস্তুত ডিভাইসটি পপআপ করবে।

অবশ্যই, এই জাতীয় একটি সিডি সিস্টেম (এ ছাড়া সিএডি) গৃহকর্মী, দৃষ্টিবিহীন মানুষের আচরণ, টালিগুলিতে আইটেম সংযুক্ত করার উপায়, গড় গ্রাহকের সরঞ্জাম এবং বাড়ির রক্ষণাবেক্ষণের ক্ষমতা, 3 ডি প্রিন্টারের ক্ষমতা সম্পর্কে প্রশিক্ষণ দেওয়া দরকার , এবং অন্যান্য বেশ কয়েকটি জিনিস।

উত্পাদন অটোমেশনের এ জাতীয় বিকাশ সম্ভবত সহজ কমান্ডগুলির শক্তিশালী শেখার সাথে শুরু হবে যেমন "ভর উত্পাদিত ফাস্টেনার এবং সেরা অনুশীলন ব্যবহার করে এই দুটি অংশ সংযুক্ত করুন।" সিএডি প্রোগ্রামটি তখন স্ক্রু, রিভেটস, আঠালো এবং অন্যান্য বিকল্পগুলির মধ্যে থেকে হার্ডওয়্যার বাছাই করবে, সম্ভবত অপারেটিং তাপমাত্রা এবং কম্পনের ব্যাপ্তি সম্পর্কে ডিজাইনারের প্রশ্ন জিজ্ঞাসা করবে। তারপরে পছন্দ, অবস্থান এবং কোণ সিএডি অংশ এবং সমাবেশের অঙ্কন এবং উপকরণগুলির বিলগুলির উপযুক্ত সেটটিতে যুক্ত করা হবে।


আমি এই ভাল লিখিত উত্তরের পক্ষে সাধারণত একটি সমালোচনা মন্তব্য করব না, তবে যেহেতু আপনি সমালোচনা চেয়েছিলেন: আমি মনে করি যে দৃin়ীকরণের জন্য বেসড , ফিডব্যাক এবং পুনর্বহালকরণ এবং অভিযোজক অ্যাপ্লিকেশন এবং শেখার অংশগুলি আকর্ষণীয়, উল্লেখযোগ্যভাবে হ্রাস করা যেতে পারে ওপির প্রশ্নটি ইতিমধ্যে আরএল সম্পর্কে কিছু জ্ঞান বোঝায়, এবং আপনি মূল প্রশ্নটি সম্বোধন করার আগে এই সম্পর্কিত পটভূমি আলোচনা সেট আপ করতে অনেক সময় ব্যয় করেন।
নিল স্লেটার

ও.পি. প্রশ্নটি জিজ্ঞাসা করেছিল যে ক্ষেত্রের মধ্যে নতুন কারও জন্য গবেষণার ইঙ্গিতকারী বর্তমান অবস্থার গর্তগুলিকে ইঙ্গিত দেয় এবং পূর্ববর্তী বিভাগগুলিতে প্রাইমারের প্রয়োজন হতে পারে। শেষ বিভাগটি আরও সরাসরি প্রশ্নের উত্তর দেয়।
ফৌখ্রিস্টিয়ান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.