জ্ঞানের ভিত্তিগুলি এখন কী ভূমিকা পালন করে এবং ভবিষ্যতে খেলবে?


13

আজকাল, কৃত্রিম বুদ্ধি মেশিন লার্নিং, বিশেষত গভীর শিক্ষার প্রায় সমান মনে হয়। কেউ কেউ বলেছেন যে গভীর শিক্ষণ মানব বিশেষজ্ঞদের প্রতিস্থাপন করবে, fieldতিহ্যগতভাবে এই ক্ষেত্রটিতে বৈশিষ্ট্য ইঞ্জিনিয়ারিংয়ের জন্য অত্যন্ত গুরুত্বপূর্ণ। বলা হয়ে থাকে যে দুটি অগ্রগতি গভীর শিক্ষার উত্থানকে নিম্নরূপ করেছিল: একদিকে, স্নায়ুবিজ্ঞান এবং স্নায়ুবিজ্ঞানবিশেষত, আমাদের বলে যে মানব মস্তিষ্কের মতো, যা অত্যন্ত প্লাস্টিকের, কৃত্রিম নেটওয়ার্কগুলি প্রায় সমস্ত ফাংশনের মডেল হিসাবে ব্যবহার করা যেতে পারে; অন্যদিকে, কম্পিউটেশনাল পাওয়ার বৃদ্ধি, বিশেষত জিপিইউ এবং এফপিজিএর প্রবর্তন, অ্যালগরিদমিক বুদ্ধিমত্তাকে এক চমত্কার উপায়ে বাড়িয়ে তুলেছে, এবং কয়েক দশক আগে নির্মিত মডেলগুলিকে অত্যন্ত শক্তিশালী এবং বহুমুখী করে তুলেছে। আমি যুক্ত করব যে বিগত বছরগুলিতে জমে থাকা বড় ডেটা (বেশিরভাগ লেবেলযুক্ত ডেটা) প্রাসঙ্গিক।

এই ধরনের বিকাশ কম্পিউটারের দৃষ্টি (এবং ভয়েস স্বীকৃতি )কে একটি নতুন যুগে নিয়ে আসে তবে প্রাকৃতিক ভাষা প্রক্রিয়াকরণ এবং বিশেষজ্ঞ সিস্টেমে পরিস্থিতি খুব বেশি পরিবর্তিত হয়েছে বলে মনে হয় না।

নিউরাল নেটওয়ার্কগুলির জন্য সাধারণ জ্ঞান অর্জন একটি লম্বা ক্রম বলে মনে হয়, তবে বেশিরভাগ বাক্য, কথোপকথন এবং সংক্ষিপ্ত পাঠগুলিতে অন্তর্ভুক্ত থাকে যা পশ্চাদগ্রহ বিশ্বের জ্ঞান থেকে আঁকা উচিত। এইভাবে কৃত্রিম বুদ্ধিমত্তার জন্য জ্ঞানের গ্রাফিং খুব গুরুত্বপূর্ণ। নিউরাল নেটওয়ার্কগুলি জ্ঞানের ঘাঁটিগুলি তৈরির ক্ষেত্রে ব্যবহার করা যেতে পারে তবে মনে হয় যে নিউরাল নেটওয়ার্ক মডেলগুলি এই নির্মিত জ্ঞান ভিত্তিগুলি ব্যবহার করতে অসুবিধা রয়েছে।

আমার প্রশ্নগুলি হ'ল:

  1. একটি জ্ঞানের ভিত্তি (উদাহরণস্বরূপ, একটি "জ্ঞান গ্রাফ", যেমন গুগল দ্বারা অঙ্কিত) এআইয়ের প্রতিশ্রুতিবদ্ধ শাখা? যদি তা হয় তবে কীভাবে কেবি মেশিন লার্নিংকে শক্তিশালী করতে পারে? কীভাবে আমরা এনএলইউ এবং এনএলজিতে বিচ্ছিন্ন সুপ্ত ভেরিয়েবলগুলি যুক্ত করতে পারি?

  2. ডিএল দ্বারা প্রভাবিত যুগে বেঁচে থাকার জন্য, জ্ঞান বেসের (বা ছাতা শব্দটির প্রতীকী পদ্ধতির) দিকনির্দেশ কোথায়? ওল্ফ্রামের মতো জেড গতিশীল জ্ঞান কি নতুন দিকের ভিত্তি করেছে? না কোনও নতুন দিকনির্দেশ?

আমি কি মৌলিক কিছু, বা এই বিষয়গুলিকে সম্বোধনকারী কিছু ধারণা অনুপস্থিত করছি?


আমি একটি বড় আইটি সংস্থার জন্য কাজ করেছি যা এক সময় এআই পণ্য বাজারজাত করে। নিউরাল নেটওয়ার্ক পদ্ধতির সমস্যাটি হচ্ছে যে প্রতি সেয়ে জ্ঞানের ভিত্তি নেই। সুতরাং কোনও ধরণের নিয়ম ছাড়াই, নিউরাল নেটওয়ার্কের পক্ষে "কেন" তা ব্যাখ্যা করা অসম্ভব। নিউরাল নেটওয়ার্ক প্রশিক্ষণ, তারপরে এমন নীতিমালা তৈরি করে যাতে নেটওয়ার্কটিকে নকল করে দেয় যা আপনাকে এ জাতীয় উত্তর দেয়। তবে মেশিন লার্নিংয়ের এমন কোনও রূপ নেই যা এখন এই জাতীয় আচরণে সক্ষম।
ম্যাক্সডাব্লু

হ্যাঁ। আমাদের সংস্থায় কেবল এনএন দ্বারা সমর্থিত চিচ্যাট বটটি খুব বোকা।
লারনার ঝাং

আমি এই কাগজটি পেয়েছি: arxiv.org/abs/1702.01932
লার্নার ঝাং

উত্তর:


4

প্রথমত, আমি জ্ঞান ভিত্তি এবং (ডিপ) মেশিন লার্নিংয়ের মধ্যে প্রধান পার্থক্যগুলি উল্লেখ করতে চাই, বিশেষত যখন প্রধান ফোকাসটি "এআই" নয় "ডেটা সায়েন্স" তে থাকে:

  • এনএনগুলি একটি কালো বাক্সের মতো; এমনকি যদি তারা একটি ডেটাসেট শিখে এবং সমস্যা ডোমেনের উপর সাধারণীকরণের শক্তি অর্জন করে তবে আপনি কখনই জানতে পারবেন না যে তারা কীভাবে কাজ করছে। আপনি যদি উন্নত মডেলটির বিশদটি যাচাই করে দেখেন, আপনি যা দেখেন তা হ'ল অঙ্ক, ওজন, দুর্বল এবং শক্তিশালী সংযোগ এবং রূপান্তর ফাংশন। প্রশিক্ষণ পর্বের "বৈশিষ্ট্য নিষ্কাশন" পদক্ষেপটি আপনাকে আক্ষরিকভাবে বলে: "ওহে মানব, আপনার জটিল বিশ্বের সাথে যথেষ্ট, আসুন শুরু করা যাক শূন্য এবং একটি"। ডিএল-এর ক্ষেত্রে আরও খারাপ! আমরা নির্বাচিত এবং কার্যকর বৈশিষ্ট্যগুলি কী তা দেখতে পাই না। আমি কোনও ডিএল বিশেষজ্ঞ নই তবে যতটুকু জানি, ডিএলের ব্ল্যাক বক্সটি আরও গাer়! জ্ঞানের ভিত্তিগুলি মানব-বান্ধব ভাষায় রচিত। জ্ঞান সংগ্রহের পর্যায়ে যাওয়ার পরে আপনি সত্তার মধ্যে সমস্ত সংযোগ দেখতে পেয়েছিলেন এবং আরও গুরুত্বপূর্ণ, আপনি এই সংযোগগুলি ব্যাখ্যা করতে পারেন। আপনি যদি জ্ঞানের ভিত্তিতে তারটি কাটেন, তবে আপনার মডেল তার শক্তিটির কিছুটা অংশ হারাবে এবং আপনি জানেন যে এটি কী হারাবে; উদাহরণস্বরূপ "সৌর সিস্টেম" নোড থেকে "প্লুটো" নোড সংযোগ বিচ্ছিন্ন করা, আপনার মডেলকে জানিয়ে দেবে যে ডিগ্র্যাস টাইসন আমাদের কী বলেছিল। তবে একটি এমএল মডেলে এটি একটি নিখুঁত অকেজো হয়ে যেতে পারে: আপনি যদি কোনও এনএন মডেলটিতে নিউরনের সংখ্যা 14 এবং 47 এর মধ্যে সংযোগ চালনা করেন তবে কোন গ্রহ সৌরজগতের অন্তর্গত বলে পূর্বাভাস দিতেন ?!

  • এমএল মডেলগুলি কেবলমাত্র ডেটাগুলির একটি শিলালিপি। তাদের অনুমানের শক্তি নেই এবং তারা আপনাকে একটিও দেয় না। অন্যদিকে জ্ঞানের ভিত্তি পূর্ববর্তী জ্ঞান থেকে অনুমান করতে সক্ষম যেমন আপনি আপনার প্রশ্নে নির্দেশ করেছেন। এটি প্রদর্শিত হয় যে চিত্রের শ্রেণিবিন্যাসের ডেটা বলার প্রশিক্ষণ প্রাপ্ত ডিএল মডেলগুলি ভয়েস সনাক্তকরণ সমস্যার ক্ষেত্রেও প্রয়োগ করা যেতে পারে। তবে এর অর্থ এই নয় যে ডিএল মডেলগুলি তার পূর্বের জ্ঞানের চিত্রগুলির ডোমেনে ভয়েসগুলির ডোমেনে প্রয়োগ করতে পারে।

  • Traditionalতিহ্যবাহী এমএল অ্যালগরিদমের জন্য আপনার কিলো ডেটা এবং ডিএলগুলির জন্য টন ডেটা প্রয়োজন। তবে ডেটাসেটের একক উদাহরণটি আপনার জন্য অর্থবহ জ্ঞান ভিত্তি তৈরি করবে।

এনএলপিতে দুটি মূল গবেষণার বিষয় রয়েছে: মেশিন অনুবাদ এবং প্রশ্নোত্তর। ব্যবহারিকভাবে এটি প্রমাণিত হয়েছে যে ডিএল মেশিন অনুবাদ সমস্যার সাথে উল্লেখযোগ্যভাবে কাজ করে তবে প্রশ্নটির উত্তর দেওয়ার চ্যালেঞ্জে একধরণের বোকা কাজ করে, বিশেষত যখন মানব-মেশিন কথোপকথনের বিষয়গুলির ডোমেনটি বিস্তৃত হয়। জ্ঞানের ঘাঁটিগুলি মেশিন অনুবাদের জন্য কোনও ভাল পছন্দ নয় তবে সম্ভবত একটি মহৎ প্রশ্নের উত্তর দেওয়ার মেশিনের মূল চাবিকাঠি। যেহেতু মেশিন অনুবাদে গুরুত্বপূর্ণ তা কেবল একটি পাঠ্যের অনূদিত সংস্করণ (এবং পৃথিবীতে কীভাবে যন্ত্রটি এটি সত্য তা আমি চিন্তা করি না) তবে প্রশ্নের উত্তর দেওয়ার ক্ষেত্রে আমার কোন তোতা নেই আমি তাকে যে তথ্য দিয়েছিলাম সেই একই তথ্য পুনরাবৃত্তি করে, তবে আমি তাকে "আপেল একটি ফল" এবং "বলার পরে একটি বুদ্ধিমান প্রাণী আমাকে" আপেল খাওয়ার উপযোগী "দেয়।


সমস্ত ফল ভোজ্য, যতক্ষণ না তারা রূপক হয় না, যেমন ফলগুলি "নিজের শ্রমের"। ; (তারপর আবার, আমরা "দেশ ধ্বংস" একটি রূপক অর্থে যেমন যখন এক একটি "সুস্বাদু" স্ট্যাকের উত্তর গ্রাস এবং এটির সামগ্রীগুলি digests যেমন ব্যবহার করতে পারে,)
DukeZhou
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.