সিএনএন-তে কনভ্যুশনাল অপারেটরগুলির সংখ্যা কীভাবে নির্ধারণ করবেন?


10

কনভলিউশনাল নিউরাল নেটওয়ার্কস (সিএনএন) এর সাথে কম্পিউটার ভিশন টাস্ক যেমন অবজেক্ট শ্রেণিবদ্ধকরণ, নেটওয়ার্ক একটি আকর্ষণীয় কর্মক্ষমতা সরবরাহ করে। তবে কনভ্যুশনাল স্তরগুলিতে কীভাবে পরামিতিগুলি সেট আপ করবেন তা আমি নিশ্চিত নই। উদাহরণস্বরূপ, একটি গ্রেস্কেল ইমেজ ( 480x480), প্রথম বিবর্তনকারী স্তরটি কনভোলসনাল অপারেটর ব্যবহার করতে পারে 11x11x10, যেখানে 10 নম্বর মানে কনভ্যুশনাল অপারেটরগুলির সংখ্যা।

প্রশ্নটি কীভাবে সিএনএন-তে কনভ্যুশনাল অপারেটরগুলির সংখ্যা নির্ধারণ করবেন?

উত্তর:


11

আমি ধরে নিচ্ছি যে আপনি যখন বলছেন 11x11x10আপনার অর্থ 10, 11x11 ফিল্টার সহ আপনার একটি স্তর রয়েছে। সুতরাং আপনি যে কনভোলিউশনগুলি করে যাচ্ছেন তা হ'ল আপনার ফিল্টার ব্যাঙ্কের প্রতি ফিল্টার প্রতি 2, 2 ডি ডিসক্রিট কনভলিউশন। সুতরাং, আসুন আমরা বলি যে আপনার একটি নেটওয়ার্ক রয়েছে:

480x480x1    # your input image of 1 channel
11x11x10     # your first filter bank of 10, 11x11 filters
5x5x20       # your second filter bank of 20, 5x5 filters
4x4x100      # your final filter bank of 100, 4x4 filters    

আপনি যাচ্ছেন: মাল্টি চ্যানেল 2 ডি যথাক্রমে 1, 10 এবং 20 এর গভীরতার সাথে 2 ডি কনভোলিউশন। আপনি দেখতে পাচ্ছেন, প্রতিটি স্তরটির গভীরতা পূর্ববর্তী স্তর থেকে ইনপুট ভলিউমের গভীরতার ফাংশন হিসাবে পরিবর্তিত হতে চলেছে।10+ +20+ +100=130

10+ +200+ +2000=2,210

এখন এই শুধুমাত্র আপনি বলে কত একক চ্যানেল 2D convolutions করছেন, কিভাবে না, নিবিড় প্রতিটি সংবর্তন হয়, প্রতিটি সংবর্তন এর গণনীয় তীব্রতা সহ পরামিতি বিভিন্ন উপর নির্ভর করবে image_size, image_depth, filter_size, আপনার stride(আপনি প্রতিটি মধ্যে কতদূর পইঠা ফিল্টার গণনা), আপনার কাছে থাকা পুলিং স্তরগুলির সংখ্যা ইত্যাদি

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.