রেলুর সংজ্ঞা অনুসারে 0 গ্রেডিয়েন্ট রয়েছে, তবে গ্রেডিয়েন্ট অদৃশ্য কেন x <0 এর জন্য সমস্যা নয়?


10

সংজ্ঞা অনুসারে, রেলু হ'ল max(0,f(x))। তারপর তার গ্রেডিয়েন্ট হিসেবে সংজ্ঞায়িত করা হয়: 1 if x > 0 and 0 if x < 0

X <0 হলে এই গ্রেডিয়েন্টটি সর্বদা 0 (নিখোঁজ) হয় না? তাহলে আমরা কেন বলি যে রেলু গ্রেডিয়েন্ট বিলুপ্ত হওয়ার সমস্যায় ভুগছে না?

উত্তর:


5

আপনি বেশিরভাগই সঠিক! গ্রেডিয়েন্ট নিখোঁজ হওয়ার সাথে রিলুতে সমস্যা আছে তবে কেবল একদিকে, তাই আমরা একে অন্য কিছু বলি: 'ডাইং রিলু সমস্যা'। আরও তথ্যের জন্য এই স্ট্যাক ওভারফ্লো প্রতিক্রিয়াটি দেখুন: নিউরাল নেটওয়ার্কগুলিতে "ডাইং রিলু" সমস্যাটি কী?

এটি একটি ছোট শব্দার্থক পার্থক্য। প্রচুর ফাংশন (তান এবং লজিস্টিক / সিগময়েড) যখন আপনি স্ট্যান্ডার্ড অপারেটিং সীমার বাইরে থাকেন তখন ডেরিভেটিভগুলি শূন্যের খুব কাছাকাছি থাকে। এটি 'বিলুপ্ত গ্রেডিয়েন্ট' ইস্যু। আপনি যত খারাপ হন, ভাল জোনে ফিরে আসা ততই শক্ত। আপনি যে দিক থেকে ইতিবাচক দিকে এগিয়ে যাচ্ছেন তেমনই রিলু খারাপ হয় না , সুতরাং কোনও বিলুপ্ত গ্রেডিয়েন্ট সমস্যা নেই (সেই দিকে)। এই অসম্পূর্ণতা এটিকে ভিন্ন কিছু বলার ন্যায়সঙ্গত করার পক্ষে যথেষ্ট হতে পারে তবে ধারণাগুলি বেশ একই রকম।


2
মূল্যবান যুক্তকরণ: অদৃশ্য গ্রেডিয়েন্ট সমস্যাটি কোনও নেটওয়ার্কের গভীরতার তুলনায় প্রগতিশীল পরিবর্তনগুলি সম্পর্কে , এবং সরাসরি নিউরন ট্রান্সফার ফাংশনগুলির বৈশিষ্ট্য সম্পর্কে নয়।
নীল স্লেটার

1

অদৃশ্য হওয়ার অর্থ এটি 0 এর দিকে যায় তবে আসলে কখনই 0 হয় না 0 0 গ্রেডিয়েন্ট থাকা খুব সহজ গণনার জন্য তৈরি করে 0 গ্রেডিয়েন্ট থাকা মানে কিছু পরিবর্তন রয়েছে যার অর্থ ধীরে ধীরে শেখা এবং সংখ্যাগত সমস্যা issues 1 এবং 0 হ'ল এই ধরণের অপটিমাইজেশনের সমস্যায় গণনা করা সবচেয়ে সহজ দুটি নম্বর।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.