আমি সংমিশ্রণীয় নিউরাল নেটওয়ার্কগুলি সম্পর্কে অনেকগুলি পড়ছি এবং ভাবছিলাম যে তারা কীভাবে নষ্ট হওয়া গ্রেডিয়েন্ট সমস্যাটিকে এড়িয়ে চলে। আমি জানি গভীর বিশ্বাস নেটওয়ার্কগুলি একক স্তরের অটো-এনকোডার বা অন্যান্য প্রাক-প্রশিক্ষিত অগভীর নেটওয়ার্কগুলি স্ট্যাক করে এবং এই সমস্যাটি এড়াতে পারে তবে সিএনএন-তে কীভাবে এড়ানো যায় তা আমি জানি না।
উইকিপিডিয়া অনুসারে :
"উল্লিখিত" বিলুপ্ত গ্রেডিয়েন্ট সমস্যা সত্ত্বেও, "জিপিইউগুলির উচ্চতর প্রক্রিয়াকরণ শক্তি অনেকগুলি স্তর সহ গভীর ফিডফোরওয়ার্ড নিউরাল নেটওয়ার্কগুলির জন্য প্লেইন ব্যাক-প্রসারণকে সম্ভব করে তোলে।"
আমি বুঝতে পারি না জিপিইউ প্রক্রিয়াকরণ কেন এই সমস্যাটি সরিয়ে দেবে?
GPU's are fast correlated with vanishing gradients
বলতে পারবেন, আমি একাধিক ম্যাট্রিক্স গুণকে প্রক্রিয়া করতে বৃহত মেমরি ব্যান্ডউইথথ সহ দ্রুত যুক্তি বুঝতে পারি! তবে আপনি অনুগ্রহ করে ব্যাখ্যা করতে পারেন যে এর ডেরিভেটিভগুলির সাথে কী সম্পর্ক আছে? অন্তর্ধান গ্রেডিয়েন্ট ইস্যু ওজন আরম্ভের সঙ্গে আরও অনেক কিছু বলে মনে হয় , তাই না!