আমরা রেসনেট পেপারে পাওয়া টাইপ হিসাবে একটি বাধা-স্থিত স্থাপত্যটিকে সংজ্ঞায়িত করি যেখানে [দুটি 3x3 কনভ লেয়ার] প্রতিস্থাপন করা হয়েছে [এক 1x1 ক্যানুয়াম, একটি 3x3 ক্যানুয়র এবং অন্য 1x1 ক্যানুয়াল স্তর]।
আমি বুঝতে পেরেছি যে 1x1 কনভের স্তরগুলি মাত্রা হ্রাস (এবং পুনরুদ্ধার) এর ফর্ম হিসাবে ব্যবহৃত হয়, যা অন্য পোস্টে ব্যাখ্যা করা হয়েছে । তবে, কেন এই কাঠামোটি মূল বিন্যাসের মতো কার্যকর why সে সম্পর্কে আমি অস্পষ্ট।
কিছু ভাল ব্যাখ্যায় অন্তর্ভুক্ত থাকতে পারে: কোন ধাপের দৈর্ঘ্য ব্যবহৃত হয় এবং কোন স্তরে ব্যবহৃত হয়? প্রতিটি মডিউল উদাহরণ ইনপুট এবং আউটপুট মাত্রা কি? উপরের চিত্রটিতে কীভাবে 56x56 বৈশিষ্ট্য মানচিত্র উপস্থাপিত হয়? -৪-ডি কি ফিল্টারগুলির সংখ্যা বোঝায়, কেন এটি 256-ডি ফিল্টার থেকে পৃথক হয়? প্রতিটি স্তরে কত ওজন বা এফএলওপি ব্যবহার করা হয়?
যে কোনও আলোচনা প্রশংসিত হয়!