ডিপ লার্নিংয়ের ডিপ রেসিডুয়াল নেটওয়ার্কগুলির প্রসঙ্গে একটি রেসিডুয়াল লার্নিং ব্লক আসলে কী?


12

আমি চিত্র স্বীকৃতির জন্য ডিপ রেসিডুয়াল লার্নিং পত্রিকাটি পড়ছিলাম এবং আমার 100% নিশ্চিততা সহ বুঝতে সমস্যা হয়েছিল যে একটি রেসিডুয়াল ব্লকটি গণনামূলকভাবে আবশ্যক। তাদের কাগজ পড়া তাদের চিত্র 2:

এখানে চিত্র বর্ণনা লিখুন

যা একটি রেসিডুয়াল ব্লক অনুমান করা যায় তা চিত্রিত করে। একটি অবশিষ্টাংশের ব্লকটির গণনা কি কেবল একইরকম:

y=σ(W2σ(W1x+b1)+b2+x)

নাকি এটা অন্য কিছু?

অন্য কথায় সম্ভবত কাগজের স্বরলিপিটি মিলানোর চেষ্টা করা হ'ল:

F(x)+x=[W2σ(W1x+b1)+b2]+x

এটা কি সত্যি?

লক্ষ্য করুন যে বৃত্তের সমষ্টি হওয়ার পরে, শব্দটি কাগজে প্রকাশিত হবে, সুতরাং একটি অবশিষ্টাংশের ব্লক (যা আমি th by দ্বারা চিহ্নিত করেছি ) এর আউটপুট হওয়া উচিত:y

σ(F(x)+x)=σ([W2σ(W1x+b1)+b2]+x)

একটি অতিরিক্ত রেলু নন-লিনিয়ারিটি ।σ


x হল ইতিবাচক রিলু (x) = x
রায় তায়েক

উত্তর:


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.