গভীর অবশিষ্টাংশগুলিকে নেটওয়ার্কগুলির একটি সংযুক্তি হিসাবে দেখা উচিত?


12

প্রশ্নটি ডিপ রেসিডুয়াল নেটওয়ার্কস ( রিসনেটস ) এর আর্কিটেকচার সম্পর্কে । পাঁচটি প্রধান ট্র্যাকের "বৃহত্তর স্কেল ভিজ্যুয়াল রিকগনিশন চ্যালেঞ্জ 2015" (ILSVRC2015) এ যে মডেলটি 1-স্থান স্থান অর্জন করেছে :

এই কাজটি নিম্নলিখিত নিবন্ধে বর্ণিত হয়েছে:

চিত্র স্বীকৃতির জন্য গভীর রেসিডুয়াল লার্নিং (2015, পিডিএফ)


মাইক্রোসফ্ট রিসার্চ টিম (রেসনেটগুলির বিকাশকারী: কাইমিং হি, জিয়াংইউ জাং, শওকিং রেন, জিয়ান সান) তাদের নিবন্ধে:

" গভীর অবশিষ্টাংশে নেটওয়ার্কগুলিতে পরিচয় ম্যাপিংস (২০১)) "

বলে যে গভীরতা একটি কী ভূমিকা পালন করে:

" আমরা এই ফলাফলগুলি একটি সাধারণ তবে প্রয়োজনীয় ধারণার মাধ্যমে পেয়েছি - আরও গভীরতর হচ্ছে These এই ফলাফলগুলি গভীরতার সীমাটি ঠেলে দেওয়ার সম্ভাবনাকে প্রদর্শন করে। "

এটি তাদের উপস্থাপনায়ও জোর দেওয়া হয়েছে (গভীরতর - আরও ভাল):

- "একটি গভীর মডেলের উচ্চতর প্রশিক্ষণের ত্রুটি হওয়া উচিত নয়" "
- "গভীর রেসনেটগুলির প্রশিক্ষণের ত্রুটি কম, এবং টেস্টের ত্রুটিও কম।"
- "গভীর রেসনেটগুলির ত্রুটি কম রয়েছে" "
- "গভীর বৈশিষ্ট্যগুলি থেকে সমস্ত বেশি লাভবান হয় - ক্রমবর্ধমান লাভ!"
- "আরও গভীর এখনও।"

এখানে 34-স্তর অবশিষ্টের (রেফারেন্সের) কাঠামোটি দেওয়া হল: এখানে চিত্র বর্ণনা লিখুন


তবে সম্প্রতি আমি একটি তত্ত্ব খুঁজে পেয়েছি যা অবশিষ্টাংশের ন্যাশনাল ব্যাখ্যার সাথে পরিচয় করিয়ে দেয় যেগুলি তারা ক্ষতিকারক পোশাক হিসাবে উপস্থিত রয়েছে:

অবশিষ্ট নেটওয়ার্কগুলি হ'ল তুলনামূলকভাবে অগভীর নেটওয়ার্কগুলির সংযোজনীয় অন্তর্ভুক্তি (২০১))

ডিপ রেজেটসকে অনেকগুলি অগভীর নেটওয়ার্ক হিসাবে বর্ণনা করা হয় যার আউটপুটগুলি বিভিন্ন গভীরতায় চালিত হয়। নিবন্ধে একটি ছবি আছে। আমি ব্যাখ্যা সহ এটি সংযুক্ত:

এখানে চিত্র বর্ণনা লিখুনঅবশিষ্ট নেটওয়ার্কগুলি প্রচলিতভাবে (ক) হিসাবে প্রদর্শিত হয়, যা সমীকরণের প্রাকৃতিক উপস্থাপনা (1)। যখন আমরা এই সূত্রটি সমীকরণ (6) এ প্রসারিত করি তখন আমরা একটি 3-ব্লক অবলম্বন নেটওয়ার্ক (খ) এর একটি অবিরত দৃশ্য পেয়েছি। এই দৃষ্টিকোণ থেকে এটি স্পষ্ট যে অবশিষ্টাংশের নেটওয়ার্কগুলিতে ইনপুট এবং আউটপুটকে সংযুক্ত করার জন্য অন্তর্নিহিত পাথগুলি O (2 ^ n) এবং একটি ব্লক যুক্ত করা পথের সংখ্যা দ্বিগুণ করে।

নিবন্ধের উপসংহারে বলা হয়েছে:

এটি গভীরতা নয়, তবে এমন ensemble যা অবশিষ্টাংশগুলিকে শক্তিশালী করে তোলে । অবশিষ্ট নেটওয়ার্কগুলি নেটওয়ার্কের গভীরতার চেয়ে নয়, নেটওয়ার্কের বহুগুণতার সীমাবদ্ধ করে দেয়। আমাদের প্রস্তাবিত নিরবচ্ছিন্ন দৃষ্টিভঙ্গি এবং ক্ষত অধ্যয়ন দেখায় যে অবশিষ্টাংশগুলি নেটওয়ার্কগুলি বহু তাত্পর্যপূর্ণ নেটওয়ার্কগুলির অন্তর্ভুক্ত se গ্রেডিয়েন্ট অবদানকারী বেশিরভাগ পাথগুলি যদি নেটওয়ার্কের সামগ্রিক গভীরতার সাথে তুলনা করে খুব সংক্ষিপ্ত হয় তবে বর্ধিত গভীরতা কেবলমাত্র অবশিষ্টাংশের মূল বৈশিষ্ট্য হতে পারে না । আমরা এখন বিশ্বাস করি যে বহু সংখ্যক, পথের সংখ্যার শর্তে নেটওয়ার্কের এক্সপ্রেসিবিলিটি, একটি গুরুত্বপূর্ণ ভূমিকা পালন করে

তবে এটি কেবল সাম্প্রতিক তত্ত্ব যা নিশ্চিত বা খণ্ডন করা যায়। এটি কখনও কখনও ঘটে যায় যে কিছু তত্ত্ব খণ্ডন করা হয় এবং নিবন্ধগুলি প্রত্যাহার করা হয়।


আমাদের কি গভীর রজনেটসকে সর্বোপরি একটি জুটি হিসাবে ভাবতে হবে? নকশাগুলি বা গভীরতা কি অবশিষ্টাংশগুলিকে এত শক্তিশালী করে? এটি কি সম্ভব যে এমনকি বিকাশকারীরা নিজেরাই যথেষ্ট বুঝতে পারেন না যে তাদের নিজস্ব মডেলটি কী উপস্থাপন করে এবং এর মূল ধারণাটি কী?

উত্তর:


4

কল্পনা করুন যে কোনও জিনিয় আপনাকে তিনটি শুভেচ্ছা মঞ্জুর করে। কারণ আপনি উচ্চাভিলাষী গভীর শেখার গবেষক, আপনার প্রথম ইচ্ছাটি ইমেজ নেট এর জন্য 1000-স্তর এনএন এর একটি নিখুঁত সমাধান, যা আপনার ল্যাপটপে তাত্ক্ষণিকভাবে উপস্থিত হয়।

এখন একটি জিন প্রেরণিত সমাধান আপনাকে কোনও অন্তর্দৃষ্টি দেয় না যে এটি কীভাবে একটি সংকলন হিসাবে ব্যাখ্যা করা যেতে পারে, তবে আপনি কি সত্যই বিশ্বাস করেন যে একটি কুকুর থেকে বিড়ালকে আলাদা করতে আপনার 1000 স্তর বিমূর্ত প্রয়োজন? "জমায়েত কাগজ" র লেখকরা যেমন উল্লেখ করেছেন, এটি অবশ্যই জৈবিক সিস্টেমের ক্ষেত্রে সত্য নয়।

অবশ্যই সমাধানের পচনের জন্য আপনার দ্বিতীয় ইচ্ছাটি নেটওয়ার্কের একটি টুকরোয় নষ্ট করে দিতে পারতেন এবং আমি দৃ gen়ভাবে নিশ্চিত যে জিনীরা বাধ্য হয়ে উঠতে সক্ষম হবে। গভীর নেটওয়ার্কের শক্তির অংশ হওয়ার কারণটি সর্বদা উপস্থিতি প্রভাব থেকে আসে।

সুতরাং এটি অবাক হওয়ার মতো বিষয় নয় যে গভীর নেটওয়ার্কগুলি, ড্রপআউট এবং অবশিষ্ট নেটওয়ার্কগুলি প্রশিক্ষণের জন্য দুটি খুব সফল কৌশলটির অন্তর্ভুক্ত অন্তর্ভুক্ত হিসাবে তাত্ক্ষণিক ব্যাখ্যা রয়েছে। অতএব "এটি গভীরতা নয়, তবে ছিটকিনি" আমাকে একটি মিথ্যা দ্বৈতত্ত্ব হিসাবে আঘাত করে। আপনি সত্যই কেবল বলবেন যে আপনি যদি সত্যই বিশ্বাস করেন যে মানুষের নির্ভুলতার সাথে চিত্রগুলিকে শ্রেণিবদ্ধ করার জন্য আপনার কয়েকশ বা কয়েক হাজার স্তরের বিমূর্ততা প্রয়োজন।

আমি আপনাকে অন্য কোনও কিছুর জন্য শেষ ইচ্ছাটি ব্যবহার করার পরামর্শ দিচ্ছি, সম্ভবত একটি পিনাকোলদা।


0

তানহ-এর মতো অনেক অ-লিনিয়ারিটির জন্য র্যান্ডম রেসিডুয়াল নেটওয়ার্কগুলি বিশৃঙ্খলার প্রান্তে বেঁচে থাকে, যাতে দুটি ইনপুট ভেক্টরের কোসাইন দূরত্বটি ভ্যানিলা তান নেটওয়ার্কের মতো একটি ঘনিষ্ঠ হারের পরিবর্তে একটি বহুমাত্রিক হারে একটি নির্দিষ্ট বিন্দুতে রূপান্তরিত করে। সুতরাং একটি সাধারণ অবশিষ্টাংশ ধীরে ধীরে গভীরতার সাথে স্থিতিশীল-বিশৃঙ্খল সীমানাটি অতিক্রম করবে এবং অনেক স্তরের জন্য এই সীমানার চারদিকে ঘোরে। মূলত এটি ইনপুট স্পেসের জ্যামিতিটি "খুব তাড়াতাড়ি" ভুলে যায় না। সুতরাং আমরা যদি তাদের যথেষ্ট গভীর করে তুলি তবে তারা ভ্যানিলা নেটওয়ার্কগুলিতে আরও ভাল কাজ করে।

রেসিডুয়াল নেটওয়ার্কগুলিতে তথ্যের প্রচার সম্পর্কে আরও তথ্যের জন্য - মিডল ফিল্ড রেসিডুয়াল নেটওয়ার্কস: কেওস অফ এজ

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.