আমি বর্তমানে নিউরাল নেটওয়ার্কগুলিতে একটি পরীক্ষার জন্য প্রস্তুতি নিচ্ছি। প্রাক্তন পরীক্ষাগুলির বেশ কয়েকটি প্রোটোকলে আমি পড়েছি যে নিউরনের অ্যাক্টিভেশন ফাংশনগুলি (মাল্টিলেয়ার পারসেপ্ট্রনে) একঘেয়ে হতে হবে be
আমি বুঝতে পারি যে অ্যাক্টিভেশন ফাংশনগুলি পৃথকযোগ্য হওয়া উচিত, একটি ডেরাইভেটিভ থাকতে হবে যা বেশিরভাগ পয়েন্টে 0 নয়, এবং অ-রৈখিক হওয়া উচিত। একঘেয়ে হয়ে যাওয়া কেন গুরুত্বপূর্ণ / সহায়ক তা আমি বুঝতে পারি না।
আমি নীচের অ্যাক্টিভেশন ফাংশন জানি এবং তারা একঘেয়েমি:
- ReLU
- সিগমা
- TANH
- সফটম্যাক্স: একঘেয়েমিটির সংজ্ঞাটি ফাংশনগুলির জন্য প্রযোজ্য কিনা তা আমি নিশ্চিত নছি ,
- Softplus
- (পরিচয়পত্র)
যাইহোক, উদাহরণস্বরূপ কোনও কারণ আমি এখনও দেখতে পাচ্ছি না ।
অ্যাক্টিভেশন ফাংশনগুলিকে একঘেয়ে হতে হবে কেন?
(সম্পর্কিত দিকের প্রশ্ন: লগারিদম / এক্সপেনশিয়াল ফাংশনটি অ্যাক্টিভেশন ফাংশন হিসাবে ব্যবহার না করার কোনও কারণ আছে কি?)