জৈবিক এবং কৃত্রিম নিউরাল নেটওয়ার্কগুলির মধ্যে দৃ strong় সাদৃশ্য আশা করার বিরুদ্ধে আমি সতর্কতা অবলম্বন করছি। আমি মনে করি "নিউরাল নেটওয়ার্ক" নামটি কিছুটা বিপজ্জনক, কারণ এটি মানুষকে এমন প্রত্যাশা করতে চালিত করে যে স্নায়বিক প্রক্রিয়া এবং মেশিন লার্নিং একই হওয়া উচিত। জৈবিক এবং কৃত্রিম নিউরাল নেটওয়ার্কগুলির মধ্যে পার্থক্যগুলি মিলগুলি ছাড়িয়ে যায়।
এটি কীভাবে খারাপ হতে পারে তার উদাহরণ হিসাবে আপনি যুক্তিটি মূল পোস্টে এটির মাথাতেও ঘুরিয়ে দিতে পারেন। আপনি যদি একটি যথাযথ দ্রুত কম্পিউটার এবং কিছু পরিমাণ প্রশিক্ষণ ডেটা পেয়ে থাকেন তবে আপনি একটি বিকেলে গাড়ি সনাক্ত করতে শিখতে নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দিতে পারেন। আপনি এটিকে বাইনারি টাস্ক (গাড়ি / গাড়ি নয়) বা একটি বহু-শ্রেণীর টাস্ক (গাড়ি / ট্রাম / বাইক / বিমান / নৌকা) তৈরি করতে পারেন এবং এখনও উচ্চ স্তরের সাফল্যে আত্মবিশ্বাসী হতে পারেন।
বিপরীতে, আমি আশা করব না যে কোনও শিশু তার জন্মের পরে - বা এমনকি সপ্তাহে - এমনকি "এত প্রশিক্ষণের উদাহরণ দেখানোর পরেও" সেদিন কোনও গাড়ি তুলতে সক্ষম হবে। কিছু স্পষ্টত দুই বছর বয়সী এবং একটি শিশু যে ক্ষমতা শেখার পার্থক্য অ্যাকাউন্টের মধ্যে ভিন্ন, যেহেতু একটি ভ্যানিলা ইমেজ শ্রেণীবিন্যাস স্নায়ুর নেটওয়ার্ক অবজেক্ট শ্রেণীবিন্যাস গোছগাছ এর পুরোপুরি সক্ষম অবিলম্বে পরে "জন্ম"। আমি মনে করি যে দুটি গুরুত্বপূর্ণ পার্থক্য রয়েছে: (1) প্রশিক্ষণের তথ্য সম্পর্কিত আপেক্ষিক পরিমাণ এবং (2) একটি স্ব-শিক্ষাদানের ব্যবস্থা যা প্রচুর প্রশিক্ষণের ডেটার কারণে সময়ের সাথে সাথে বিকশিত হয়।
মূল পোস্টটি দুটি প্রশ্ন প্রকাশ করে। প্রশ্নের শিরোনাম এবং মূল অংশটি জিজ্ঞাসা করে যে নিউরাল নেটওয়ার্কগুলির "এত উদাহরণ" দরকার। সন্তানের অভিজ্ঞতার সাথে সম্পর্কিত, সাধারণ চিত্রের মানদণ্ড ব্যবহার করে প্রশিক্ষিত নিউরাল নেটওয়ার্কগুলির তুলনামূলকভাবে খুব কম ডেটা থাকে।
আমি শিরোনামে প্রশ্নটি আবার বাক্যগুলিতে করব
"একটি সাধারণ চিত্রের মানদণ্ডের জন্য নিউরাল নেটওয়ার্কের প্রশিক্ষণ কীভাবে কোনও শিশুর শেখার অভিজ্ঞতার সাথে তুলনা করে এবং তার বিপরীতে হয়?"
তুলনার খাতিরে আমি সিআইএফএআর -10 ডেটা বিবেচনা করব কারণ এটি একটি সাধারণ চিত্রের মানদণ্ড। লেবেলযুক্ত অংশটি প্রতি ক্লাসে 6000 চিত্র সহ 10 টি চিত্রের সমন্বয়ে গঠিত। প্রতিটি চিত্র 32x32 পিক্সেল। আপনি যদি কোনওভাবে সিআইএফএআর -10 থেকে লেবেলযুক্ত চিত্রগুলি স্ট্যাক করে স্ট্যান্ডার্ড 48 এফপিএস ভিডিও তৈরি করেন তবে আপনার প্রায় 20 মিনিটের ফুটেজ থাকবে।
2 বছরের বাচ্চা যিনি প্রতিদিন 12 ঘন্টা বিশ্ব পর্যবেক্ষণ করে তার বয়স্কদের (লেবেল) প্রতিক্রিয়া সহ বিশ্বের প্রায় 263000 মিনিট (4000 ঘন্টার বেশি) সরাসরি প্রত্যক্ষ পর্যবেক্ষণ থাকে। (এগুলি কেবল বলপার্কের পরিসংখ্যান - আমি জানি না যে একটি সাধারণ দুই বছর বয়সের শিশু বিশ্ব পর্যবেক্ষণ করতে কত মিনিট ব্যয় করেছে)) তদুপরি, শিশুটি সিআইএফএআর-এর অন্তর্ভুক্ত 10 শ্রেণীর বাইরে অনেকগুলি, অনেকগুলি বস্তুর সংস্পর্শে আসবে- 10।
তাই খেলতে কিছু জিনিস আছে। একটি হ'ল সিআইএফএআর -10 মডেলের তুলনায় সন্তানের সামগ্রিকভাবে আরও বেশি ডেটা এবং ডেটার আরও বিস্তৃত উত্স রয়েছে। ডেটা বৈচিত্র এবং ডেটা ভলিউম সাধারণভাবে দৃust় মডেলগুলির প্রাক-প্রয়োজনীয় হিসাবে স্বীকৃত। এই আলোকে, আশ্চর্যজনক বলে মনে হয় না যে শিশুটির চেয়ে স্নায়বিক নেটওয়ার্ক এই কাজটিতে আরও খারাপ, কারণ সিআইএফএআর -10 এ প্রশিক্ষিত একটি নিউরাল নেটওয়ার্ক দু'বছরের তুলনায় প্রশিক্ষণের ডেটার জন্য ইতিবাচকভাবে অনাহারে রয়েছে। কোনও শিশুকে উপলভ্য চিত্রের রেজোলিউশন 32x32 সিআইএফএআর -10 চিত্রের চেয়ে ভাল, তাই শিশুটি বস্তুর সূক্ষ্ম বিবরণ সম্পর্কে তথ্য জানতে সক্ষম হয়।
সিআইএফএআর -10 থেকে দুই বছরের পুরানো তুলনাটি সঠিক নয় কারণ সিআইএফএআর -10 মডেলটি সম্ভবত একই স্থিতিশীল চিত্রগুলির একাধিক পাস দিয়ে প্রশিক্ষিত হবে, যখন শিশুটি বাইনোকুলার ভিশন ব্যবহার করে দেখবে যে কীভাবে তিনটিতে বস্তুগুলি সাজানো হয়েছে -ডিমেনশনাল ওয়ার্ল্ড একই জিনিসগুলিতে বিভিন্ন আলোক শর্ত এবং দৃষ্টিভঙ্গি নিয়ে চলার সময়।
ওপি-র শিশু সম্পর্কে উপাখ্যানটি দ্বিতীয় প্রশ্নটি বোঝায়,
"কীভাবে নিউরাল নেটওয়ার্কগুলি স্ব-শিক্ষায় পরিণত হতে পারে?"
একটি শিশুকে স্ব-শিক্ষার জন্য কিছু প্রতিভা দেওয়া হয়, যাতে নতুন ধরণের জিনিসগুলি স্ক্র্যাচ থেকে শুরু না করে সময়ের সাথে যুক্ত করা যায়।
মেশিন লার্নিং প্রসঙ্গে ট্রান্সফার-লার্নিংয়ের নাম এক ধরণের মডেল অভিযোজন সম্পর্কে ওপির মন্তব্য ।
মন্তব্যে, অন্যান্য ব্যবহারকারীরা উল্লেখ করেছেন যে এক- এবং কয়েকটি শট লার্নিং * অন্য একটি মেশিন লার্নিং গবেষণা ক্ষেত্র।
অধিকন্তু, পুনর্বহালন-শিক্ষণ স্ব-শিক্ষার মডেলগুলিকে আলাদা দৃষ্টিকোণ থেকে সম্বোধন করে, মূলত রোবটগুলিকে নির্দিষ্ট সমস্যাগুলি সমাধানের জন্য অনুকূল কৌশলগুলি (যেমন দাবা বাজানো) সমাধানের জন্য ট্রায়াল-ত্রুটি পরীক্ষা-নিরীক্ষা করার অনুমতি দেয়।
এটি সম্ভবত সত্য যে এই তিনটি মেশিন লার্নিং প্যারাডাইমগুলি মেশিনগুলি কীভাবে নতুন কম্পিউটার ভিশন কাজের সাথে খাপ খায় তা উন্নত করার জন্য জার্মানি। মেশিন লার্নিং মডেলগুলিকে দ্রুত নতুন কাজের সাথে অভিযোজিত করা একটি গবেষণার সক্রিয় ক্ষেত্র। তবে, কারণ এই প্রকল্পগুলির ব্যবহারিক লক্ষ্যগুলি (ম্যালওয়ারের নতুন উদাহরণগুলি চিহ্নিত করা, পাসপোর্টের ছবিতে ইমপোস্টারদের সনাক্তকরণ, ইন্টারনেটকে সূচীকরণ করা) এবং সাফল্যের মানদণ্ড বিশ্ব সম্পর্কে একটি শিশু শেখার লক্ষ্যগুলি থেকে আলাদা এবং এটি যে বাস্তবায়িত হয়েছিল তা থেকে গণিত ব্যবহার করে একটি কম্পিউটার এবং অন্যটি রসায়ন ব্যবহার করে জৈব পদার্থে করা হয়, দুজনের মধ্যে সরাসরি তুলনা ভরাট থাকবে।
একদিকে যেমন, সিআইএফএআর -10 সমস্যাটি কীভাবে চারপাশে ফ্লিপ করা যায় এবং প্রতিটিটির 10 টি উদাহরণ থেকে 6000 অবজেক্ট সনাক্ত করতে একটি নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দেওয়া কী তা অধ্যয়ন করা আকর্ষণীয় হবে। তবে এটি 2 বছর বয়সের পুরানো তুলনায় সুষ্ঠু তুলনাও হবে না, কারণ প্রশিক্ষণের তথ্যের সামগ্রিক পরিমাণ, বৈচিত্র্য এবং রেজোলিউশনে এখনও একটি বিশাল তাত্পর্য থাকবে।
* বর্তমানে আমাদের কাছে একটি-শট শেখার বা কয়েকটি শট শেখার জন্য ট্যাগ নেই।