আমি সংমিশ্রণীয় নিউরাল নেটওয়ার্কগুলি সম্পর্কে অনেকগুলি পড়ছি এবং ভাবছিলাম যে তারা কীভাবে নষ্ট হওয়া গ্রেডিয়েন্ট সমস্যাটিকে এড়িয়ে চলে। আমি জানি গভীর বিশ্বাস নেটওয়ার্কগুলি একক স্তরের অটো-এনকোডার বা অন্যান্য প্রাক-প্রশিক্ষিত অগভীর নেটওয়ার্কগুলি স্ট্যাক করে এবং এই সমস্যাটি এড়াতে পারে তবে সিএনএন-তে কীভাবে এড়ানো যায় তা আমি জানি না।
উইকিপিডিয়া অনুসারে :
"উল্লিখিত" বিলুপ্ত গ্রেডিয়েন্ট সমস্যা সত্ত্বেও, "জিপিইউগুলির উচ্চতর প্রক্রিয়াকরণ শক্তি অনেকগুলি স্তর সহ গভীর ফিডফোরওয়ার্ড নিউরাল নেটওয়ার্কগুলির জন্য প্লেইন ব্যাক-প্রসারণকে সম্ভব করে তোলে।"
আমি বুঝতে পারি না জিপিইউ প্রক্রিয়াকরণ কেন এই সমস্যাটি সরিয়ে দেবে?
GPU's are fast correlated with vanishing gradientsবলতে পারবেন, আমি একাধিক ম্যাট্রিক্স গুণকে প্রক্রিয়া করতে বৃহত মেমরি ব্যান্ডউইথথ সহ দ্রুত যুক্তি বুঝতে পারি! তবে আপনি অনুগ্রহ করে ব্যাখ্যা করতে পারেন যে এর ডেরিভেটিভগুলির সাথে কী সম্পর্ক আছে? অন্তর্ধান গ্রেডিয়েন্ট ইস্যু ওজন আরম্ভের সঙ্গে আরও অনেক কিছু বলে মনে হয় , তাই না!