নিউরাল নেটওয়ার্কগুলি সম্পাদন করার জন্য কেন এত প্রশিক্ষণের উদাহরণ প্রয়োজন?


64

রঙিন, মেকিং ইত্যাদি বিবেচনা না করে 2 বছর বয়সে একটি মানব সন্তানের গাড়িটির যুক্তিসঙ্গত নির্ভুলতার সাথে এটি সনাক্ত করতে সক্ষম হওয়ার জন্য প্রায় 5 টি দৃষ্টান্ত প্রয়োজন 2 আমার ছেলে যখন 2 বছর বয়সী তখন তিনি ট্রাম এবং ট্রেন সনাক্ত করতে সক্ষম হন, যদিও তিনি দেখেছিলেন কিছু সংখ্যক. যেহেতু তিনি সাধারণত একে অপরের সাথে বিভ্রান্ত হচ্ছিলেন, স্পষ্টতই তার নিউরাল নেটওয়ার্ক যথেষ্ট প্রশিক্ষিত হয়নি, তবে এখনও still

এটি কী যে কৃত্রিম নিউরাল নেটওয়ার্কগুলি নিখোঁজ রয়েছে যা তাদের দ্রুত শিখতে বাধা দেয়? স্থানান্তর একটি উত্তর শিখছে?


23
গাড়িগুলির চেয়ে হাতিগুলি আরও ভাল উদাহরণ হতে পারে। অন্যরা যেমন উল্লেখ করেছে, কোনও শিশু সম্ভবত লেবেল শোনার আগে অনেকগুলি গাড়ি দেখে থাকতে পারে , সুতরাং যদি তাদের মন ইতিমধ্যে "প্রাকৃতিক ধরণের" সংজ্ঞা দেয় তবে এটির এখন একটি লেবেল রয়েছে। তবে, পশ্চিমা একটি শিশু নির্বিচারে মাত্র কয়েকটি তথ্যের ভিত্তিতে একটি ভাল হাতি-শ্রেণিবদ্ধকরণ ব্যবস্থার বিকাশ করে।
জেজি

70
আপনার কি মনে হয় যে একটি শিশুর মস্তিষ্ক নিউরাল নেটওয়ার্কের মতো কাজ করে?
পল ওয়াসেলিউস্কি

16
একটি এনএন একটি গাড়ির একটি চিত্র প্রদর্শিত হতে পারে। আপনার শিশু বিভিন্ন ধরণের গাড়ির জন্য বিভিন্ন দৃষ্টিকোণ থেকে একটি পূর্ণ 3D চলচ্চিত্র পেয়েছে। আপনার সন্তানেরও গাড়ি থেকে আলাদা করার জন্য একই ধরণের উদাহরণ থাকতে পারে। উদাহরণস্বরূপ তাদের বাচ্চা স্ট্রলার, খেলনা, ইত্যাদি ছাড়া আমার মনে হয় আপনার সন্তানের আরও উদাহরণের প্রয়োজন হত needed
স্টিয়ান ইত্তেরভিক

20
@ সলটার্স একটি কৃত্রিম নিউরাল নেটওয়ার্ক অর্থে? সম্ভবত না.
ফায়ারব্যাগ

28
"2 বছর বয়সী একটি মানব সন্তানের যুক্তিসঙ্গত নির্ভুলতার সাথে এটি সনাক্ত করতে সক্ষম হওয়ার জন্য প্রায় 5 টির গাড়ি প্রয়োজন" "এই জাতীয় শিশুটি গাড়ি নয় এমন জিনিসগুলির সাথে দুটি পুরো বছরের অভিজ্ঞতা অর্জন করেছে । আমি নিশ্চিত যে একটি গুরুত্বপূর্ণ ভূমিকা পালন করে।
দারথফেনেক

উত্তর:


101

জৈবিক এবং কৃত্রিম নিউরাল নেটওয়ার্কগুলির মধ্যে দৃ strong় সাদৃশ্য আশা করার বিরুদ্ধে আমি সতর্কতা অবলম্বন করছি। আমি মনে করি "নিউরাল নেটওয়ার্ক" নামটি কিছুটা বিপজ্জনক, কারণ এটি মানুষকে এমন প্রত্যাশা করতে চালিত করে যে স্নায়বিক প্রক্রিয়া এবং মেশিন লার্নিং একই হওয়া উচিত। জৈবিক এবং কৃত্রিম নিউরাল নেটওয়ার্কগুলির মধ্যে পার্থক্যগুলি মিলগুলি ছাড়িয়ে যায়।

এটি কীভাবে খারাপ হতে পারে তার উদাহরণ হিসাবে আপনি যুক্তিটি মূল পোস্টে এটির মাথাতেও ঘুরিয়ে দিতে পারেন। আপনি যদি একটি যথাযথ দ্রুত কম্পিউটার এবং কিছু পরিমাণ প্রশিক্ষণ ডেটা পেয়ে থাকেন তবে আপনি একটি বিকেলে গাড়ি সনাক্ত করতে শিখতে নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দিতে পারেন। আপনি এটিকে বাইনারি টাস্ক (গাড়ি / গাড়ি নয়) বা একটি বহু-শ্রেণীর টাস্ক (গাড়ি / ট্রাম / বাইক / বিমান / নৌকা) তৈরি করতে পারেন এবং এখনও উচ্চ স্তরের সাফল্যে আত্মবিশ্বাসী হতে পারেন।

বিপরীতে, আমি আশা করব না যে কোনও শিশু তার জন্মের পরে - বা এমনকি সপ্তাহে - এমনকি "এত প্রশিক্ষণের উদাহরণ দেখানোর পরেও" সেদিন কোনও গাড়ি তুলতে সক্ষম হবে। কিছু স্পষ্টত দুই বছর বয়সী এবং একটি শিশু যে ক্ষমতা শেখার পার্থক্য অ্যাকাউন্টের মধ্যে ভিন্ন, যেহেতু একটি ভ্যানিলা ইমেজ শ্রেণীবিন্যাস স্নায়ুর নেটওয়ার্ক অবজেক্ট শ্রেণীবিন্যাস গোছগাছ এর পুরোপুরি সক্ষম অবিলম্বে পরে "জন্ম"। আমি মনে করি যে দুটি গুরুত্বপূর্ণ পার্থক্য রয়েছে: (1) প্রশিক্ষণের তথ্য সম্পর্কিত আপেক্ষিক পরিমাণ এবং (2) একটি স্ব-শিক্ষাদানের ব্যবস্থা যা প্রচুর প্রশিক্ষণের ডেটার কারণে সময়ের সাথে সাথে বিকশিত হয়।


মূল পোস্টটি দুটি প্রশ্ন প্রকাশ করে। প্রশ্নের শিরোনাম এবং মূল অংশটি জিজ্ঞাসা করে যে নিউরাল নেটওয়ার্কগুলির "এত উদাহরণ" দরকার। সন্তানের অভিজ্ঞতার সাথে সম্পর্কিত, সাধারণ চিত্রের মানদণ্ড ব্যবহার করে প্রশিক্ষিত নিউরাল নেটওয়ার্কগুলির তুলনামূলকভাবে খুব কম ডেটা থাকে।

আমি শিরোনামে প্রশ্নটি আবার বাক্যগুলিতে করব

"একটি সাধারণ চিত্রের মানদণ্ডের জন্য নিউরাল নেটওয়ার্কের প্রশিক্ষণ কীভাবে কোনও শিশুর শেখার অভিজ্ঞতার সাথে তুলনা করে এবং তার বিপরীতে হয়?"

তুলনার খাতিরে আমি সিআইএফএআর -10 ডেটা বিবেচনা করব কারণ এটি একটি সাধারণ চিত্রের মানদণ্ড। লেবেলযুক্ত অংশটি প্রতি ক্লাসে 6000 চিত্র সহ 10 টি চিত্রের সমন্বয়ে গঠিত। প্রতিটি চিত্র 32x32 পিক্সেল। আপনি যদি কোনওভাবে সিআইএফএআর -10 থেকে লেবেলযুক্ত চিত্রগুলি স্ট্যাক করে স্ট্যান্ডার্ড 48 এফপিএস ভিডিও তৈরি করেন তবে আপনার প্রায় 20 মিনিটের ফুটেজ থাকবে।

2 বছরের বাচ্চা যিনি প্রতিদিন 12 ঘন্টা বিশ্ব পর্যবেক্ষণ করে তার বয়স্কদের (লেবেল) প্রতিক্রিয়া সহ বিশ্বের প্রায় 263000 মিনিট (4000 ঘন্টার বেশি) সরাসরি প্রত্যক্ষ পর্যবেক্ষণ থাকে। (এগুলি কেবল বলপার্কের পরিসংখ্যান - আমি জানি না যে একটি সাধারণ দুই বছর বয়সের শিশু বিশ্ব পর্যবেক্ষণ করতে কত মিনিট ব্যয় করেছে)) তদুপরি, শিশুটি সিআইএফএআর-এর অন্তর্ভুক্ত 10 শ্রেণীর বাইরে অনেকগুলি, অনেকগুলি বস্তুর সংস্পর্শে আসবে- 10।

তাই খেলতে কিছু জিনিস আছে। একটি হ'ল সিআইএফএআর -10 মডেলের তুলনায় সন্তানের সামগ্রিকভাবে আরও বেশি ডেটা এবং ডেটার আরও বিস্তৃত উত্স রয়েছে। ডেটা বৈচিত্র এবং ডেটা ভলিউম সাধারণভাবে দৃust় মডেলগুলির প্রাক-প্রয়োজনীয় হিসাবে স্বীকৃত। এই আলোকে, আশ্চর্যজনক বলে মনে হয় না যে শিশুটির চেয়ে স্নায়বিক নেটওয়ার্ক এই কাজটিতে আরও খারাপ, কারণ সিআইএফএআর -10 এ প্রশিক্ষিত একটি নিউরাল নেটওয়ার্ক দু'বছরের তুলনায় প্রশিক্ষণের ডেটার জন্য ইতিবাচকভাবে অনাহারে রয়েছে। কোনও শিশুকে উপলভ্য চিত্রের রেজোলিউশন 32x32 সিআইএফএআর -10 চিত্রের চেয়ে ভাল, তাই শিশুটি বস্তুর সূক্ষ্ম বিবরণ সম্পর্কে তথ্য জানতে সক্ষম হয়।

সিআইএফএআর -10 থেকে দুই বছরের পুরানো তুলনাটি সঠিক নয় কারণ সিআইএফএআর -10 মডেলটি সম্ভবত একই স্থিতিশীল চিত্রগুলির একাধিক পাস দিয়ে প্রশিক্ষিত হবে, যখন শিশুটি বাইনোকুলার ভিশন ব্যবহার করে দেখবে যে কীভাবে তিনটিতে বস্তুগুলি সাজানো হয়েছে -ডিমেনশনাল ওয়ার্ল্ড একই জিনিসগুলিতে বিভিন্ন আলোক শর্ত এবং দৃষ্টিভঙ্গি নিয়ে চলার সময়।

ওপি-র শিশু সম্পর্কে উপাখ্যানটি দ্বিতীয় প্রশ্নটি বোঝায়,

"কীভাবে নিউরাল নেটওয়ার্কগুলি স্ব-শিক্ষায় পরিণত হতে পারে?"

একটি শিশুকে স্ব-শিক্ষার জন্য কিছু প্রতিভা দেওয়া হয়, যাতে নতুন ধরণের জিনিসগুলি স্ক্র্যাচ থেকে শুরু না করে সময়ের সাথে যুক্ত করা যায়।

  • মেশিন লার্নিং প্রসঙ্গে নাম এক ধরণের মডেল অভিযোজন সম্পর্কে ওপির মন্তব্য ।

  • মন্তব্যে, অন্যান্য ব্যবহারকারীরা উল্লেখ করেছেন যে এক- এবং কয়েকটি শট লার্নিং * অন্য একটি মেশিন লার্নিং গবেষণা ক্ষেত্র।

  • অধিকন্তু, স্ব-শিক্ষার মডেলগুলিকে আলাদা দৃষ্টিকোণ থেকে সম্বোধন করে, মূলত রোবটগুলিকে নির্দিষ্ট সমস্যাগুলি সমাধানের জন্য অনুকূল কৌশলগুলি (যেমন দাবা বাজানো) সমাধানের জন্য ট্রায়াল-ত্রুটি পরীক্ষা-নিরীক্ষা করার অনুমতি দেয়।

এটি সম্ভবত সত্য যে এই তিনটি মেশিন লার্নিং প্যারাডাইমগুলি মেশিনগুলি কীভাবে নতুন কম্পিউটার ভিশন কাজের সাথে খাপ খায় তা উন্নত করার জন্য জার্মানি। মেশিন লার্নিং মডেলগুলিকে দ্রুত নতুন কাজের সাথে অভিযোজিত করা একটি গবেষণার সক্রিয় ক্ষেত্র। তবে, কারণ এই প্রকল্পগুলির ব্যবহারিক লক্ষ্যগুলি (ম্যালওয়ারের নতুন উদাহরণগুলি চিহ্নিত করা, পাসপোর্টের ছবিতে ইমপোস্টারদের সনাক্তকরণ, ইন্টারনেটকে সূচীকরণ করা) এবং সাফল্যের মানদণ্ড বিশ্ব সম্পর্কে একটি শিশু শেখার লক্ষ্যগুলি থেকে আলাদা এবং এটি যে বাস্তবায়িত হয়েছিল তা থেকে গণিত ব্যবহার করে একটি কম্পিউটার এবং অন্যটি রসায়ন ব্যবহার করে জৈব পদার্থে করা হয়, দুজনের মধ্যে সরাসরি তুলনা ভরাট থাকবে।


একদিকে যেমন, সিআইএফএআর -10 সমস্যাটি কীভাবে চারপাশে ফ্লিপ করা যায় এবং প্রতিটিটির 10 টি উদাহরণ থেকে 6000 অবজেক্ট সনাক্ত করতে একটি নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দেওয়া কী তা অধ্যয়ন করা আকর্ষণীয় হবে। তবে এটি 2 বছর বয়সের পুরানো তুলনায় সুষ্ঠু তুলনাও হবে না, কারণ প্রশিক্ষণের তথ্যের সামগ্রিক পরিমাণ, বৈচিত্র্য এবং রেজোলিউশনে এখনও একটি বিশাল তাত্পর্য থাকবে।

* বর্তমানে আমাদের কাছে একটি-শট শেখার বা কয়েকটি শট শেখার জন্য ট্যাগ নেই।


34
এটিকে কিছুটা আরও নির্দিষ্ট করে তোলার জন্য, একটি মানব শিশু ইতিমধ্যে কয়েক হাজার উদাহরণ সহ প্রশিক্ষণ নিয়েছে যা বিভিন্ন কোণ থেকে দেখলে বস্তুগুলি কীভাবে প্রদর্শিত হয় তা নির্ধারণ করতে, তাদের সীমানা চিহ্নিত করতে, আপাত আকার এবং প্রকৃত আকারের মধ্যে সম্পর্ক , ইত্যাদি।
ডেভিড শোয়ার্জ

25
গর্ভের অভ্যন্তরে একটি শিশুর মস্তিষ্ক সক্রিয় থাকে । শব্দটি পানির মাধ্যমে ফিল্টার হওয়ার পরে, শিশু শব্দ দ্বারা তাদের পিতামাতাকে সনাক্ত করতে পারে । একটি নতুন জন্মগ্রহণকারী শিশুর জন্মের আগে তাদের সাথে কাজ করার জন্য কয়েক মাসের ডেটা ছিল, তবে তারা একটি শব্দ গঠনের আগে তাদের আরও কয়েক বছরের বেশি সময় প্রয়োজন, তারপরে তারা বাক্য গঠনের আরও কয়েক বছর আগে, এবং ব্যাকরণগতভাবে সঠিক বাক্যটির জন্য আরও দম্পতি , ইত্যাদি ... শেখা খুব জটিল
নেলসন

5
@ ইলকো হিজেনডোইন এটি প্রশ্নের বিপরীতে 'শিশু' বনাম 'নিউরাল নেটওয়ার্ক' ব্যাখ্যা করে যা ব্যবহার করা হয়েছে। উত্তরটি হ'ল এটি কেবল একটি স্পষ্ট বিপরীতে। নিউরাল নেটওয়ার্কগুলির মোটেও অনেকগুলি উদাহরণের প্রয়োজন হয় না, বাচ্চারা গাড়ি সনাক্ত করতে সক্ষম হওয়ার আগে তাদের অনেকগুলি উদাহরণ (তবে কেবল অন্যরকমভাবে) পায়।
সেক্সটাস এম্পেরিকাস

4
@ নেলসন, আপনার মন্তব্যের কারণ কী তা আমি নিশ্চিত নই, তবে আপনি 'বছরগুলিকে' বছরে 'পরিবর্তন করতে পারবেন। 1 বছরের বাচ্চারা 2 বছর ধরে প্রথম বাক্যটি কথা বলে এবং 3 বছরের ব্যাকরণ যেমন অতীত কাল এবং সর্বনামগুলি সঠিকভাবে ব্যবহৃত হয় With
সেক্সটাস এম্পেরিকাস

1
@ ইলকো হিজেনডোর্ন আমি মনে করি যে প্রশ্নের ভিত্তিটি একটি ত্রুটিযুক্ত উপমা থেকে যুক্তিযুক্ত একটি ঘটনা, তাই সরাসরি উপমাটি প্রতিক্রিয়াশীল বলে সম্বোধন করুন। জৈবিক এবং কৃত্রিম নিউরাল নেটওয়ার্কগুলির মধ্যে পার্থক্য করাও প্রতিক্রিয়াশীল, কারণ উত্তরটি রূপরেখা দেবে যে জৈবিক এবং কৃত্রিম নিউরাল নেটওয়ার্কগুলি তাদের নামে সর্বাধিক সাদৃশ্যযুক্ত (উভয় "স্নায়ু নেটওয়ার্ক" শব্দটি ধারণ করে) তবে তাদের প্রয়োজনীয় বৈশিষ্ট্যগুলিতে সমান নয় বা কমপক্ষে বৈশিষ্ট্যগুলি রয়েছে প্রশ্ন দ্বারা ধরে নেওয়া।
মনিকা পুনরায় ইনস্টল করুন

49

প্রথমত, দুই বছর বয়সে, একটি শিশু বিশ্ব সম্পর্কে অনেক কিছু জানে এবং সক্রিয়ভাবে এই জ্ঞানটি প্রয়োগ করে। একটি শিশু নতুন ধারণাটিতে এই জ্ঞান প্রয়োগ করে প্রচুর "ট্রান্সফার লার্নিং" করে।

দ্বিতীয়ত, গাড়ীর এই পাঁচটি "লেবেলযুক্ত" উদাহরণ দেখার আগে, কোনও শিশু রাস্তায়, টিভিতে, খেলনা গাড়ি ইত্যাদিতে প্রচুর গাড়ি দেখতে পায়, তাই এর আগেও অনেকগুলি "নিরক্ষিত শিক্ষা" ঘটেছিল।

অবশেষে, নিউরাল নেটওয়ার্কগুলির মানুষের মস্তিষ্কের সাথে প্রায় কোনও মিল নেই, তাই তাদের সাথে তুলনা করার খুব একটা পয়েন্ট নেই। এছাড়াও লক্ষ্য করুন যে ওয়ান-শট শেখার জন্য অ্যালগরিদম রয়েছে এবং বর্তমানে এটি সম্পর্কে বেশ গবেষণা হয়।


9
চতুর্থ বিষয়, দক্ষতার সাথে / নির্ভুলভাবে শেখার দিকে কোনও শিশুরও 100 মিলিয়ন বছরেরও বেশি বিবর্তনীয় নির্বাচন রয়েছে।
সিএসিজ

39

বর্তমান উত্তরগুলিতে আমি দেখতে পাচ্ছি না এমন একটি প্রধান দিক হল বিবর্তন

একটি শিশুর মস্তিষ্ক স্ক্র্যাচ থেকে শিখেন না। হরিণ এবং জিরাফ শিশুরা জন্মের কয়েক মিনিট পরে কীভাবে হাঁটতে পারে তা জিজ্ঞাসা করার মতো। কারণ তারা এই কাজটির জন্য ইতিমধ্যে তারযুক্ত তাদের মস্তিস্ক নিয়ে জন্মেছে। অবশ্যই কিছু সূক্ষ্ম সুরকরণ দরকার, তবে শিশু হরিণ "র্যান্ডম ইনিশিয়েশন" থেকে হাঁটা শিখছে না।

একইভাবে, বড় চলন্ত বস্তুর অস্তিত্ব রয়েছে এবং এটি লক্ষ্য রাখা গুরুত্বপূর্ণ যে আমরা জন্ম নিয়েছি is

সুতরাং আমি মনে করি এই প্রশ্নের অনুমানটি কেবল মিথ্যা। মানব নিউরাল নেটওয়ার্কগুলি প্রচুর পরিমাণে - গাড়ি নয় - চলন্ত, শক্ত টেক্সচার এবং আকারগুলি সহ 3 ডি বস্তু ঘোরানোর সুযোগ পেয়েছিল, তবে এটি প্রচুর প্রজন্মের মধ্য দিয়েই ঘটেছিল এবং শিখাটি বিবর্তনীয় অ্যালগরিদম দ্বারা ঘটেছিল, যার মস্তিস্কগুলি তাদের মস্তিষ্কে হয়েছিল এই কাজের জন্য আরও সুগঠিত ছিল, উচ্চতর সুযোগের সাথে পুনরুত্পাদন করতে বাঁচতে পারে, পরবর্তী প্রজন্মকে শুরু থেকেই আরও ভাল এবং আরও ভাল মস্তিষ্কের তারের রেখে দেয় leaving


8
একপাশে মজা করুন: প্রমাণ রয়েছে যে এটি যখন বিভিন্ন মডেলের গাড়িগুলির মধ্যে বৈষম্যের কথা আসে তখন আমরা আসলে আমাদের মস্তিষ্কের বিশেষ মুখের স্বীকৃতি কেন্দ্রটি লাভ করি । এটি প্রশংসনীয় যে কোনও শিশু যখন বিভিন্ন মডেলের মধ্যে পার্থক্য নাও করতে পারে, তবুও কোনও মোবাইল সামগ্রীতে 'মুখের' অন্তর্নিহিত উপস্থিতি কারকে এক ধরণের প্রাণী হিসাবে শ্রেণীবদ্ধ করতে পারে এবং তাই মোবাইলকে স্বীকৃতি দেওয়ার পরে বিবর্তন দ্বারা চিহ্নিত করার পক্ষে হতে পারে মুখযুক্ত জিনিসগুলি বেঁচে থাকার পক্ষে সহায়ক।
ড্যান ব্রায়ান্ট

7
এই উত্তরটি ঠিক কী আমি ভাবছিলাম ঠিক তা সম্বোধন করে। শিশুরা ফাঁকা স্লেট হিসাবে জন্মগ্রহণ করে না । তারা বৈশিষ্ট্য যে কিছু নিদর্শন চিনতে সহজ করতে সঙ্গে আসা, কিছু জিনিস সহজ শিখতে, ইত্যাদি
EFF

1
গর্ভের বাইরে বেরিয়ে আসা প্রাণীগুলি প্রকৃতপক্ষে আকর্ষণীয় হলেও এই জাতীয় বিবর্তনীয় হার্ডওয়ারিং মানব শিক্ষার একেবারে বিপরীত চূড়ান্ত বলে মনে করা হয়, যা প্রাকৃতিক বিশ্বে অভিজ্ঞতা-ভিত্তিক শিক্ষার চরম বলে মনে করা হয়। অবশ্যই গাড়িগুলি আমাদের মস্তিস্কের বিবর্তনে ন্যূনতম বিবর্তনমূলক প্রভাব ফেলেছে।
ইলকো হুগেনডোর

5
@ ইলকো হিজেন্ডোআরন পরিবেশ শিখতে এবং বুঝতে সক্ষমতার জন্য বিবর্তনীয়ভাবে নির্বাচন করা হয়েছে। শেখার ক্ষেত্রে অত্যন্ত দক্ষ হওয়ার জন্য মস্তিষ্ক বিবর্তন দ্বারা সেট করা হয়েছে। বিন্দুগুলির সাথে সংযোগ স্থাপনের ক্ষমতা, নিদর্শনগুলি দেখতে, আকারগুলি এবং চলাচল বুঝতে,
সূচনাগুলি তৈরি করা

3
এটি একটি ভাল বিষয়, তবে এটি সত্য যে গবেষকরা এটি বুঝতে পেরে তারা এনএন'র কাঠামোযুক্ত কাঠামোযুক্ত কাঠামো তৈরি করে যা নির্দিষ্ট ধরণের শেখার সুবিধার্থে করে। বিবেচনা করুন যে একটি কনভোলশনাল এনএন- তে কঠোর কোডিং গ্রহনযোগ্য ক্ষেত্র রয়েছে যা ভিজ্যুয়াল কার্যগুলিতে দক্ষতা শিখতে / উন্নত করে। এই ক্ষেত্রগুলি সম্পূর্ণ সংযুক্ত নেটওয়ার্কে স্ক্র্যাচ থেকে শিখতে পারে তবে এটি আরও শক্ত। ইয়েলকো হিজেন্ডোর্ন, মানব মস্তিষ্ক এমন কাঠামো পূর্ণ যা শিক্ষার সুযোগ দেয়।
গুং - মনিকা পুনরায়

21

আমি নিউরাল নেটওয়ার্ক সম্পর্কে খুব বেশি জানি না তবে আমি বাচ্চাদের সম্পর্কে মোটামুটি জানি।

অনেক 2 বছর বয়সের সাধারণ শব্দগুলি কেমন হওয়া উচিত তা নিয়ে প্রচুর সমস্যা রয়েছে। উদাহরণস্বরূপ, বাচ্চাদের পক্ষে কোনও চার পায়ের প্রাণীর জন্য "কুকুর" ব্যবহার করা খুব সাধারণ quite এটি "গাড়ি" এর চেয়ে আরও জটিল একটি পার্থক্য - কেবল একটি মহান ডেনের থেকে একটি পোডল দেখতে অন্যরকম মনে করুন এবং উদাহরণস্বরূপ তারা একটি বিড়াল না থাকলেও তারা উভয়ই "কুকুর"।

এবং 2 বছরের একটি শিশু "গাড়ি" এর 5 টিরও বেশি উদাহরণ দেখতে পেয়েছে। একটি পরিবার পরিবার চালানোর জন্য যে কোনও সময় কয়েক ডজন বা এমনকি কয়েকশো গাড়ি উদাহরণ দেখে। এবং অনেক অভিভাবক 5 বারের চেয়ে অনেক বেশি "গাড়ীর দিকে তাকান" মন্তব্য করবেন। তবে বাচ্চারা এমনভাবেও ভাবতে পারে যেগুলি তাদের সম্পর্কে বলা হয়নি। উদাহরণস্বরূপ, রাস্তায় ছাগলছানা লন্ডনে প্রচুর জিনিস দেখায়। তার বাবা বলেছেন (একজনের) "চকচকে গাড়িটি দেখুন!" এবং বাচ্চাটি মনে করে "সম্ভবত এই সমস্ত অন্যান্য জিনিসগুলিও গাড়ি রয়েছে?"


2
অন্যান্য উদাহরণ: ট্যাক্সিের গাড়ি চালানো, পাঠ্য গাড়ি চালানো এবং পুলিশের গাড়িগুলি একই। যখনই কোনও গাড়ি লাল হয় তখন এটি ফায়ারট্রাক। ক্যাম্পারভ্যানস অ্যাম্বুলেন্স। একটি লোডার ক্রেন সহ একটি লরি একটি খননকারীর হিসাবে শ্রেণীবদ্ধ হয়। যে বাসটি সবে দিয়ে গেছে সেগুলি ট্রেন স্টেশনে যায়, সুতরাং পরের বাসটিও একইরকম দেখা যায়, অবশ্যই ট্রেন স্টেশন যেতে হবে। এবং ব্রড দিবালোকের সময় চাঁদ দেখা একটি খুব বিশেষ ঘটনা।
সেক্সটাস এম্পেরিকাস

10

এটি একটি আকর্ষণীয় প্রশ্ন যা আমি অনেকগুলি নিয়েও চিন্তা করেছি এবং কেন এর কয়েকটি ব্যাখ্যা নিয়ে আসতে পারি n

  • নিউরাল নেটওয়ার্কগুলি মস্তিষ্কের মতো কিছুই কাজ করে না। ব্যাকপ্রোপেজেশন নিউরাল নেটওয়ার্কগুলির জন্য স্বতন্ত্র এবং মস্তিষ্কে এটি হয় না। এই অর্থে, আমরা কেবল আমাদের মস্তিষ্কে সাধারণ শিক্ষার অ্যালগরিদম জানি না। এটি বৈদ্যুতিক হতে পারে, এটি রাসায়নিক হতে পারে, এটি এমনকি উভয়ের সংমিশ্রণ হতে পারে। নিউরাল নেটওয়ার্কগুলি আমাদের মস্তিস্কের তুলনায় তারা কতটা সরলীকৃত হয়েছে তার তুলনায় শিক্ষার নিকৃষ্টতম রূপ হিসাবে বিবেচিত হতে পারে।
  • যদি নিউরাল নেটওয়ার্কগুলি সত্যই আমাদের মস্তিষ্কের মতো হয়, তবে মানব বাচ্চাগুলি তাদের প্রাথমিক দিনগুলিতে বৈশিষ্ট্য নিষ্কাশনের মতো প্রাথমিক স্তরগুলির ব্যাপক "প্রশিক্ষণ" গ্রহণ করে। সুতরাং তাদের নিউরাল নেটওয়ার্কগুলি সত্যিই স্ক্র্যাচ থেকে প্রশিক্ষিত হয় না, বরং শেষ স্তরটি আরও এবং আরও বেশি ক্লাস এবং লেবেল যুক্ত করতে পুনরায় প্রশিক্ষিত হয়।

9

রঙিন, মেকিং ইত্যাদি নির্বিশেষে একটি গাড়ী 2 বছর বয়সী একটি শিশু শিশুর প্রায় 5 টি দৃষ্টান্ত যুক্তিযুক্ত যথাযথতার সাথে সনাক্ত করতে সক্ষম হতে পারে needs

"দৃষ্টান্তগুলি" ধারণাটি সহজেই গ্লানি হয়ে যায়। কোনও শিশু গাড়ীর 5 টি অনন্য দৃষ্টান্ত দেখে থাকতে পারে, তবে তারা প্রকৃতপক্ষে হাজারে হাজার হাজার ফ্রেম দেখতে পেয়েছে, ভিন্ন ভিন্ন পরিবেশে। তারা সম্ভবত অন্যান্য প্রসঙ্গে গাড়ি দেখে থাকতে পারে। তাদের জীবদ্দশায় বিকশিত শারীরিক বিশ্বের জন্য তাদের একটি স্বজ্ঞাতও রয়েছে - কিছু স্থানান্তর শিখন সম্ভবত এখানে ঘটে happens তবুও আমরা এই সমস্তগুলিকে "5 টি দৃষ্টান্ত" এ গুটিয়ে ফেলি।

এদিকে, আপনি সিএনএন-এ যে প্রতিটি একক ফ্রেম / চিত্রটি পাস করেন সেটিকে একটি "উদাহরণ" হিসাবে বিবেচনা করা হয়। আপনি যদি একটি সুসংগত সংজ্ঞা প্রয়োগ করেন তবে উভয় সিস্টেমই সত্যই অনেক বেশি পরিমাণে প্রশিক্ষণের ডেটা ব্যবহার করছে।

এছাড়াও, আমি লক্ষ করতে চাই যে কনভোলশনাল নিউরাল নেটওয়ার্কগুলি - সিএনএন - এএনএনগুলির তুলনায় কম্পিউটার দৃষ্টিভঙ্গিতে বেশি কার্যকর এবং চিত্রের শ্রেণিবদ্ধকরণের মতো কার্যক্রমে মানবিক কর্মক্ষমতা নিয়ে আসে। গভীর শেখা (সম্ভবত) কোনও চঞ্চল নয়, তবে এটি এই ডোমেনে প্রশংসিত হয়।


5

অন্যদের দ্বারা নির্দেশিত হিসাবে, কৃত্রিম নিউরাল নেটওয়ার্কগুলির ডেটা-দক্ষতা তথ্যের উপর নির্ভর করে যথেষ্ট পরিমাণে পরিবর্তিত হয়। প্রকৃতপক্ষে, অনেকগুলি তথাকথিত ওয়ান-শট শেখার পদ্ধতি রয়েছে, যা কেবলমাত্র একটি একক লেবেলযুক্ত নমুনা ব্যবহার করে যথেষ্ট ভাল নির্ভুলতার সাথে ট্রামগুলি লেবেল করার কাজটি সমাধান করতে পারে।

এটি করার একটি উপায় তথাকথিত ট্রান্সফার শেখা; অন্যান্য লেবেলে প্রশিক্ষিত একটি নেটওয়ার্ক সাধারণত খুব কার্যকরভাবে নতুন লেবেলের সাথে মানিয়ে যায়, কারণ কঠোর পরিশ্রমটি ইমেজের নিম্ন স্তরের উপাদানগুলি বোধগম্যভাবে ভেঙে ফেলছে।

তবে এ জাতীয় কাজ সম্পাদন করার জন্য আমাদের এ জাতীয় লেবেলযুক্ত ডেটা দরকার নেই; বাচ্চাদের মতো অনেকগুলি লেবারযুক্ত ডেটার দরকার নেই যতটা আপনি ভাবছেন নিউরাল নেটওয়ার্স।

উদাহরণস্বরূপ, এই জাতীয় একটি অব্যর্থহিত পদ্ধতি যা আমি অন্যান্য প্রসঙ্গে সফলভাবে প্রয়োগ করেছি, তা হল একটি লেবেলযুক্ত চিত্রের সেট নেওয়া, এলোমেলোভাবে এগুলি ঘোরানো, এবং কোনও নেটওয়ার্ককে প্রশিক্ষণের জন্য চিত্রটির কোন দিকটি 'আপ' রয়েছে তা অনুমান করতে train দৃশ্যমান বস্তুগুলি কী বা কী বলা হয় তা না জেনে এটি নেটওয়ার্ককে চিত্রগুলি সম্পর্কে প্রচুর কাঠামো শিখতে বাধ্য করে; এবং এটি আরও অনেক ডেটা-দক্ষ পরবর্তী লেবেল শেখার জন্য একটি দুর্দান্ত ভিত্তি তৈরি করতে পারে।

যদিও এটি সত্য যে কৃত্রিম নেটওয়ার্কগুলি সম্ভবত অর্থবহ উপায়ে বাস্তবের থেকে একেবারে পৃথক, যেমন ব্যাকপ্রোপ্যাগেশনের সুস্পষ্ট এনালগের অনুপস্থিতি, এটি খুব সম্ভবত সত্য যে সত্যিকারের নিউরাল নেটওয়ার্কগুলি একই কৌশলগুলি ব্যবহার করে, শিখার চেষ্টা করে কিছু সাধারণ প্রিয়ার দ্বারা সূচিত ডেটা কাঠামো।

অন্য একটি উদাহরণ যা প্রায় অবশ্যই প্রাণীদের মধ্যে একটি ভূমিকা পালন করে এবং ভিডিও বোঝার ক্ষেত্রে দুর্দান্ত প্রতিশ্রুতিও দেখিয়েছে, এটি ভবিষ্যতের ভবিষ্যদ্বাণী থেকে ভবিষ্যদ্বাণী করা উচিত বলে ধারণা করা হচ্ছে। কেবলমাত্র এই অনুমানটি থেকে শুরু করে আপনি একটি নিউরাল নেটওয়ার্ককে পুরোটা শিখতে পারেন। বা দার্শনিক স্তরে, আমি বিশ্বাস করতে আগ্রহী যে এই ধারণাটি আমরা 'জ্ঞান' হিসাবে বিবেচনা করি প্রায় সবকিছুর অধীনে।

আমি এখানে নতুন কিছু বলছি না; তবে এটি এই তুলনায় অপেক্ষাকৃত নতুন যে এই সম্ভাবনাগুলি এখনও খুব কম বয়সী অনেক অ্যাপ্লিকেশন খুঁজে পেয়েছে এবং 'এএনএন কী করতে পারে' এর পাঠ্যপুস্তকের বোঝার জন্য এখনও জড়িত হয়নি। সুতরাং ওপিএস প্রশ্নের উত্তর দিতে; আপনার বর্ণনার ফাঁকির অনেক অংশ ইতিমধ্যে এএনএন বন্ধ করে দিয়েছে।


4

গভীর নিউরাল নেটওয়ার্ককে প্রশিক্ষণের একটি উপায় হ'ল এটিকে অটো-এনকোডারগুলির স্ট্যাক ( সীমাবদ্ধ বল্টজম্যান মেশিনস ) হিসাবে গণ্য করা ।

তত্ত্ব অনুসারে, একটি অটো-এনকোডার নিরক্ষিত পদ্ধতিতে শেখে: এটি স্বেচ্ছাচারিত, লেবেলবিহীন ইনপুট ডেটা নেয় এবং আউটপুট ডেটা তৈরি করতে এটি প্রক্রিয়া করে। তারপরে এটি আউটপুট ডেটা নেয় এবং এর ইনপুট ডেটাটি পুনরায় তৈরি করার চেষ্টা করে। এটি তার নোডগুলির প্যারামিটারগুলি টুইট করে যতক্ষণ না এটি তার ডেটাটিকে গোল-ট্রিপিংয়ের কাছাকাছি আসতে পারে। আপনি যদি এটির বিষয়ে চিন্তা করেন তবে অটো-এনকোডারটি তার নিজস্ব স্বয়ংক্রিয় ইউনিট পরীক্ষা লিখছে is কার্যত, এটি তার " লেবেলযুক্ত ইনপুট ডেটা "টিকে লেবেলযুক্ত ডেটাতে পরিণত করছে: আসল তথ্যটি বৃত্তাকার-ট্রিপড ডেটার জন্য একটি লেবেল হিসাবে কাজ করে।

অটো-এনকোডারগুলির স্তরগুলি প্রশিক্ষিত হওয়ার পরে, নিউরাল নেটওয়ার্কটি তার উদ্দেশ্যযুক্ত ফাংশনটি সম্পাদন করতে লেবেলযুক্ত ডেটা ব্যবহার করে সূক্ষ্ম সুরযুক্ত হয়। বাস্তবে, এগুলি কার্যকরী পরীক্ষা।

আসল পোস্টারটি জিজ্ঞাসা করে যে কৃত্রিম নিউরাল নেটওয়ার্ককে প্রশিক্ষণের জন্য কেন প্রচুর ডেটা প্রয়োজন হয় এবং দু'বছরের একজন মানুষের প্রয়োজনীয় তথ্যের তুলনায় এটি কম পরিমাণে প্রশিক্ষণের ডেটার সাথে তুলনা করে। আসল পোস্টারটি আপেল-থেকে কমলাগুলির তুলনা করছে: কৃত্রিম নিউরাল নেট সম্পর্কিত সামগ্রিক প্রশিক্ষণ প্রক্রিয়া, দু'বছরের পুরানো লেবেলগুলির সাথে সূক্ষ্ম সুরকরণ বনাম।

তবে বাস্তবে, দু'বছরের বয়সী দুই বছরেরও বেশি সময় ধরে এলোমেলো, স্ব-লেবেলযুক্ত ডেটাতে তার অটো-এনকোডারদের প্রশিক্ষণ দিয়ে আসছে। বাচ্চারা যখন জরায়ুতে থাকে তখন তারা স্বপ্ন দেখে । (তাই বিড়ালছানা করুন।) গবেষকরা এই স্বপ্নগুলিকে ভিজ্যুয়াল প্রসেসিং সেন্টারগুলিতে এলোমেলো নিউরন ফারিং জড়িত হিসাবে বর্ণনা করেছেন।


1
একমত; অনুশীলনে স্বতঃ-এনকোডারগুলি ব্যতীত কিছুটা নিষ্ক্রিয় শেখার পক্ষে খুব শক্তিশালী সরঞ্জাম নয়; আমরা যে বিষয়গুলি জানি সেখানে আরও চলছে, তাই 'দু'বছরের পুরানো তার অটো-এনকোডারদের প্রশিক্ষণ দিচ্ছে' বাক্যটি খুব আক্ষরিকভাবে গ্রহণ করা উচিত নয় বলে আমি মনে করি।
ইলকো হুগেনডোর

4

যতক্ষণ না আমরা দেখতে শিখি আমরা "গাড়ি দেখতে" শিখি না

কোনও শিশুকে কীভাবে বস্তুগুলি দেখতে হয় তা শিখতে বেশ দীর্ঘ সময় এবং প্রচুর উদাহরণ লাগে। এর পরে, একটি শিশু কেবল কয়েকটি উদাহরণ থেকে নির্দিষ্ট ধরণের অবজেক্টটি সনাক্ত করতে শিখতে পারে । আপনি যদি দুই বছরের বাচ্চাটিকে এমন একটি শিখন পদ্ধতির সাথে তুলনা করেন যা আক্ষরিকভাবে একটি ফাঁকা স্লেট থেকে শুরু হয় তবে এটি একটি আপেল এবং কমলা তুলনা; এই বয়সে শিশু হাজার হাজার ঘন্টা "ভিডিও ফুটেজ" দেখেছিল।

একইভাবে, কৃত্রিম নিউরাল নেটওয়ার্কগুলি "কীভাবে দেখবেন" শেখার জন্য প্রচুর উদাহরণ নেয় তবে তার পরে সেই জ্ঞানটিকে নতুন উদাহরণগুলিতে স্থানান্তর করা সম্ভব। ট্রান্সফার লার্নিং হ'ল মেশিন লার্নিংয়ের একটি সম্পূর্ণ ডোমেন এবং "ওয়ান শট লার্নিং" এর মতো জিনিসগুলি সম্ভব - আপনি এমন একটি এএনএন তৈরি করতে পারেন যা নতুন ধরণের অবজেক্টগুলি সনাক্ত করতে শিখবে যা এটি একটি উদাহরণ থেকে আগে দেখা যায় নি, বা একটি চিহ্নিত করতে পারে তাদের মুখের একক ফটো থেকে নির্দিষ্ট ব্যক্তি তবে এই প্রাথমিক "অংশটি দেখতে শেখা" ভাল করার জন্য যথেষ্ট প্রচুর ডেটা প্রয়োজন।

তদুপরি, এর কিছু প্রমাণ রয়েছে যে সমস্ত প্রশিক্ষণের ডেটা সমান নয়, যথা, শেখার সময় আপনি যে ডেটাটি "চয়ন" করেন তা কেবল আপনাকে সরবরাহ করা ডেটার চেয়ে কার্যকর। যেমন হোল্ড ও হেইন টুইন বিড়ালছানা পরীক্ষা। https://www.lri.fr/~mbl/ENS/FONDIHM/2013/papers/about-HeldHein63.pdf


4

একটি জিনিস যা আমি এখনও উত্তরগুলিতে দেখতে পাইনি তা হ'ল একটি সত্য সত্য যে বিশ্ব শিশু অবজেক্টের একটি 'উদাহরণ' মানব সন্তানের দ্বারা দেখা হয় তা এনএন প্রশিক্ষণের প্রসঙ্গে একটি উদাহরণের সাথে মিলে যায় না।

মনে করুন আপনি একটি রেলওয়ে চৌরাস্তাতে 5 বছরের বাচ্চা সন্তানের সাথে দাঁড়িয়ে আছেন এবং 5 মিনিটের মধ্যে 5 টি ট্রেন পাস দেখছেন। এখন, আপনি বলতে পারেন "আমার শিশু কেবল 5 টি ট্রেন দেখেছিল এবং অন্য ট্রেনগুলি নির্ভরযোগ্যভাবে সনাক্ত করতে পারে যখন কোনও এনএনকে হাজার হাজার চিত্রের প্রয়োজন হয়!"! যদিও এটি সম্ভবত সত্য, আপনি সম্পূর্ণরূপে এড়িয়ে যাচ্ছেন যে আপনার শিশু দেখেছে এমন প্রতিটি ট্রেনে ট্রেনের একক চিত্রের চেয়ে অনেক বেশি তথ্য রয়েছে। প্রকৃতপক্ষে, আপনার সন্তানের মস্তিষ্ক ট্রেনের কয়েক সেকেন্ডে কয়েকটি চিত্র প্রতি প্রসেস করছে যখন এটি চলছিল, প্রতিটি কিছুটা আলাদা কোণ, বিভিন্ন ছায়া ইত্যাদি, যখন একটি একক চিত্র এনএন সরবরাহ করবে খুব সীমিত তথ্য। এই প্রসঙ্গে আপনার বাচ্চার কাছে এমন তথ্যও রয়েছে যা এনএন-তে উপলব্ধ নয়, উদাহরণস্বরূপ ট্রেনের গতি বা ট্রেনটি যে শব্দ করে।

আরও, আপনার শিশু কথা বলতে এবং জিজ্ঞাসা জিজ্ঞাসা করতে পারেন! "ট্রেনগুলি খুব দীর্ঘ, তাই না?" "হ্যাঁ।", "এবং এগুলি খুব বড়, তাই না?" "হ্যাঁ.". দুটি সহজ প্রশ্ন সহ আপনার শিশু এক মিনিটেরও কম সময়ে দুটি খুব প্রয়োজনীয় বৈশিষ্ট্য শিখবে!

আর একটি গুরুত্বপূর্ণ বিষয় হ'ল অবজেক্ট সনাক্তকরণ। আপনার শিশুটি অবিলম্বে কোন বস্তুর উপরে সনাক্ত করতে সক্ষম হয়েছে, অর্থাত্ চিত্রটির কোন অংশটি, এটিতে ফোকাস করা দরকার, যখন কোনও এনএন অবশ্যই শ্রেণিবদ্ধ করার চেষ্টা করার আগে প্রাসঙ্গিক বিষয়টিকে সনাক্ত করতে শিখতে হবে।


3
আমি এটিও যুক্ত করব যে সন্তানের প্রসঙ্গে রয়েছে : এটি রেলপথে ট্রেন দেখায়, এটি কোনও স্টেশনে, লেভেল ক্রসিং ইত্যাদি হতে পারে যদি এটি একটি বিশাল (জ্যাপেলিন আকার) বেলুন আকৃতির এবং আকাশে ট্রেনের মতো দেখতে আঁকা হয়, এটি এটি ট্রেন বলে না এটি বলবে এটি দেখতে কোনও ট্রেনের মতো দেখাচ্ছে তবে এটি এর সাথে "ট্রেন" লেবেল সংযুক্ত করবে না। আমি সংশয়বাদী একজন এনএন এই ক্ষেত্রে "ট্রেন দেখায় বেলুন" একটি লেবেল ফিরিয়ে দেবে। একইভাবে, কোনও শিশু ট্রেনের সাথে একটি আসল ট্রেন সহ একটি বিলবোর্ড ভুল করবে না। কোনও ট্রেনের একটি ছবি কোনও এনএন-তে ট্রেনের চিত্র - এটি "ট্রেন" লেবেলটি ফিরিয়ে দেবে।
কোরি 979

3

আমি তর্ক করব পারফরম্যান্সটি যেমনটি আপনি আশা করতে পারেন তেমন আলাদা নয় তবে আপনি একটি দুর্দান্ত প্রশ্ন জিজ্ঞাসা করেছেন (শেষ অনুচ্ছেদটি দেখুন)।

যেমন আপনি স্থানান্তর শেখার কথা উল্লেখ করেছেন: আপেলগুলির সাথে আপেলের তুলনা করতে আমাদের দেখতে হবে মোট কতগুলি ছবি এবং কতগুলি আগ্রহী শ্রেণীর ছবি / মানসিক / নিউরাল নেট "দেখায়"।

১. একজন মানুষ কয়টি ছবি দেখে?

মানুষের চোখের চলাচল প্রায় 200 মিমি লাগে যা "জৈবিক ছবি" ধরণের হিসাবে দেখা যেতে পারে। কম্পিউটার ভিশন বিশেষজ্ঞ ফি-ফি লি দ্বারা আলাপটি দেখুন: https://www.ted.com/talks/fei_fei_li_how_we_re_teching_computers_to_:30:30_ চিত্রগুলি#t-362785 ।

তিনি যোগ করেছেন:

সুতরাং 3 বছর বয়সে একটি শিশু কয়েক লক্ষ লক্ষ ছবি দেখতে পেত।

ইমেজনেট, অবজেক্ট সনাক্তকরণের জন্য শীর্ষস্থানীয় ডাটাবেসগুলিতে there 14 মিলিয়ন ডলার লেবেলযুক্ত চিত্র রয়েছে। সুতরাং ইমেজনেটে ​​প্রশিক্ষিত একটি নিউরাল নেটওয়ার্ক 14000000/5/60/60/24 * 2 ~ 64 দিনের বাচ্চার হিসাবে অনেকগুলি ছবি দেখে থাকতে পারে, তাই দুই মাস বয়সী (ধরে নেওয়া বাচ্চা তার জীবনের অর্ধেক জেগে আছে)। এই ছবিটির কতটি লেবেলযুক্ত তা বলাই মোটামুটি। তদুপরি, শিশুরা যে ছবিগুলি দেখায়, সেগুলি ইমেজনেটের মতো বিচিত্র নয়। (সম্ভবত বাচ্চা তার মাকে সময় কাটবে দেখে, ...;)। যাইহোক, আমি মনে করি এটি ন্যায্য বলে মনে হচ্ছে যে আপনার ছেলে কয়েকশো মিলিয়ন ছবি দেখেছিল (এবং তারপরে ট্রান্সফার শেখার প্রয়োগ করে)।

সুতরাং যে সম্পর্কিত ছবিগুলির (ট্রান্সফার) থেকে শিখতে পারে তার একটি শক্ত ভিত্তি দিয়ে আমাদের আরও কতগুলি ছবি শিখতে হবে?

আমি যে ব্লগ পোস্টটি পেয়েছিলাম তা হ'ল: https://blog.keras.io/building-powerful-image-classization-models-used-very-little-data.html । তারা প্রতি ক্লাসে 1000 টি উদাহরণ ব্যবহার করে। আমি কল্পনা করতে পারি 2.5 বছর পরে এমনকি আরও কম প্রয়োজন। যাইহোক, 1000 ছবি 3.3 মিনিটের মধ্যে 1000/5/60 এ একটি মানুষ দ্বারা দেখা যেতে পারে।

তুমি লিখেছিলে:

রঙিন, মেকিং ইত্যাদি নির্বিশেষে একটি গাড়ী 2 বছর বয়সী একটি শিশু শিশুর প্রায় 5 টি দৃষ্টান্ত যুক্তিযুক্ত যথাযথতার সাথে সনাক্ত করতে সক্ষম হতে পারে needs

এটি উদাহরণস্বরূপ চল্লিশ সেকেন্ডের সমতুল্য (তুলনীয় করার জন্য সেই বস্তুর বিভিন্ন কোণ সহ)।

সংক্ষেপে: যেমনটি আমি উল্লেখ করেছি, আমাকে কয়েকটা অনুমান করতে হয়েছিল। তবে আমি মনে করি, কেউ দেখতে পাবে যে পারফরম্যান্সটি যেমন প্রত্যাশা করা যায় তেমন আলাদা নয়।

তবে, আমি বিশ্বাস করি আপনি একটি দুর্দান্ত প্রশ্ন জিজ্ঞাসা করেছেন এবং এখানে কেন:

২. যদি তারা মস্তিষ্কের মতো আরও কাজ করে তবে কি নিউরাল নেটওয়ার্ক আরও ভাল / আলাদা পারফর্ম করবে? (জিওফ্রে হিন্টন হ্যাঁ বলেছেন)

একটি সাক্ষাত্কারে https://www.wired.com/story/googles-ai-guru-computers-think-more- Like-brains/, 2018 এর শেষদিকে, তিনি মস্তিষ্কের সাথে নিউরাল নেটওয়ার্কের বর্তমান বাস্তবায়নগুলির তুলনা করেন। তিনি উল্লেখ করেছেন, ওজনের ক্ষেত্রে, কৃত্রিম নিউরাল নেটওয়ার্কগুলি 10.000 এর একটি ফ্যাক্টর দ্বারা মস্তিষ্কের চেয়ে ছোট হয়। সুতরাং, প্রশিক্ষণের জন্য মস্তিষ্কের কম প্রশিক্ষণের পুনরাবৃত্তি প্রয়োজন। কৃত্রিম নিউরাল নেটওয়ার্কগুলি সক্ষম করার জন্য, আমাদের মস্তিষ্কের মতো আরও কাজ করার জন্য, তিনি হার্ডওয়ারে আরও একটি প্রবণতা অনুসরণ করেন, ইউকে ভিত্তিক গ্রাফকোর নামে একটি স্টার্টআপ। এটি নিউরাল নেটওয়ার্কের ওজন সংরক্ষণের স্মার্ট পদ্ধতিতে গণনার সময় হ্রাস করে। সুতরাং, আরও ওজন ব্যবহার করা যেতে পারে এবং কৃত্রিম নিউরাল নেটওয়ার্কগুলির প্রশিক্ষণের সময় হ্রাস পেতে পারে।


2

আমি এতে বিশেষজ্ঞ। আমি মানুষ, আমি শিশু ছিলাম, আমার গাড়ি আছে এবং আমি এআই করি।

বাচ্চারা কেন আরও সীমিত উদাহরণ সহ গাড়ি তুলছে তা হ'ল অন্তর্দৃষ্টি। মানব মস্তিষ্কের থ্রিডি রোটেশন মোকাবেলায় ইতিমধ্যে কাঠামো রয়েছে। এছাড়াও, দুটি চোখ রয়েছে যা গভীরতার ম্যাপিংয়ের জন্য প্যারাল্যাক্স সরবরাহ করে যা সত্যই সহায়তা করে। আপনি একটি গাড়ী এবং একটি গাড়ির ছবির মধ্যে অন্তর্নিহিত করতে পারেন, কারণ চিত্রটির প্রকৃত কোনও গভীরতা নেই। হিন্টন (এআই গবেষক) ক্যাপসুল নেটওয়ার্কগুলির ধারণা প্রস্তাব করেছেন, যা জিনিসগুলিকে আরও স্বজ্ঞাগতভাবে পরিচালনা করতে সক্ষম হবে। দুর্ভাগ্যক্রমে কম্পিউটারগুলির জন্য, প্রশিক্ষণের ডেটা হ'ল (সাধারণত) 2 ডি চিত্র, ফ্ল্যাট পিক্সেলের অ্যারে। অতিরিক্ত ফিট না করার জন্য, প্রচুর ডেটা প্রয়োজন হয় তাই চিত্রগুলিতে গাড়ির অভিমুখীকরণকে সাধারণীকরণ করা হয়। শিশুর মস্তিষ্ক এটি ইতিমধ্যে এটি করতে পারে এবং কোনও দিকনির্দেশনায় একটি গাড়ি সনাক্ত করতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.