ইনসেপশন ভি 2 এবং ইনসেপশন ভি 3 এর মধ্যে পার্থক্য কী?


18

সমঝোতার সাথে আরও গভীরতর কাগজটি গুগলনেটকে বর্ণনা করে যেখানে মূল সূচনা মডিউলগুলি রয়েছে:

এখানে চিত্র বর্ণনা লিখুন

ইনসেপশন ভি 2-তে পরিবর্তনটি ছিল যে তারা 5x5 টি কনভোলিউশন দুটি ধারাবাহিক 3x3 কনভলিউশন দ্বারা প্রতিস্থাপন করেছে এবং পুলিং প্রয়োগ করেছে:

এখানে চিত্র বর্ণনা লিখুন

ইনসেপশন ভি 2 এবং ইনসেপশন ভি 3 এর মধ্যে পার্থক্য কী?


এটি কি কেবল ব্যাচের সাধারণীকরণ? বা ইনসেপশন ভি 2 এর ইতিমধ্যে ব্যাচের সাধারণকরণ আছে?
মার্টিন থোমা

github.com/SKKSaikia/CNN- গুগলনেট এই সংগ্রহস্থলটিতে গুগলনেটের সমস্ত সংস্করণ এবং তাদের পার্থক্য রয়েছে। একবার চেষ্টা করে দেখো.
অমর্ত্য রঞ্জন সাইকিয়া

উত্তর:


22

কাগজ ব্যাচ নরমালাইজেশন , সের্গেই এট আল, 2015। প্রস্তাবিত ইনসেপশন-ভি 1 আর্কিটেকচার যা কাগজে গুগলনেটের একটি বৈকল্পিক রূপগুলি সহ আরও গভীরতর হয় এবং এরই মধ্যে তারা ব্যাচ নরমালাইজেশন ইন ইনসেপশন (বিএন-ইনসেপশন) প্রবর্তন করে।

(Szegedy et al।, 2014) বর্ণিত নেটওয়ার্কের মূল পার্থক্য হ'ল 5x5 কনভুলেশনাল স্তরগুলি 128 টি পর্যন্ত ফিল্টার সহ 3x3 কনভোলিউশনের পর পর দুটি স্তর দ্বারা প্রতিস্থাপিত হয়।

এবং কম্পিউটার ভিশনের জন্য ইনসেপশন আর্কিটেকচারের রিথিংকিং পেপারে লেখকরা ইনসেপশন-ভি 2 এবং ইনসেপশন-ভি 3 প্রস্তাব করেছিলেন।

ইন ইনসেপশন-V2 , তারা গুণকনির্ণয় (ছোট convolutions মধ্যে গুণনীয়ক নির্ণয় করা convolutions) এবং ইনসেপশন-v1 এ মধ্যে কিছু ছোটখাট পরিবর্তন পরিচয় করিয়ে দেন।

নোট করুন যে আমরা 3xতিহ্যবাহী 7x7 টি রূপান্তরকে তিনটি 3x3 কনভোলিউশনে পরিণত করেছি

ইনসেপশন-ভি 3 হিসাবে , এটি ইনসেপশন-ভি 2 এর একটি বৈকল্পিক যা বিএন-অক্সিলারি যুক্ত করে।

বিএন অ্যাসিলিয়ারি বলতে এমন সংস্করণ বোঝায় যেটিতে সহায়তার শ্রেণিবদ্ধের সম্পূর্ণ সংযুক্ত স্তরটি কেবল কনভলিউশনগুলি নয়, সাধারণীকরণ করা হয়। আমরা [ইনসেপশন-ভি 2 + বিএন সহায়ক] মডেলটিকে ইনসেপশন-ভি 3 হিসাবে উল্লেখ করছি।


3

দওলিকার যা উল্লেখ করেছিলেন তার পাশে

ইনসেপশন ভি 2 গভীরতা 64 এর প্রথম স্তর হিসাবে পৃথকযোগ্য কনভোলশনটি ব্যবহার করেছে

কাগজ থেকে উদ্ধৃতি

আমাদের মডেলটি প্রথম বিবর্তনীয় স্তরে গভীরতার গুণক 8 দিয়ে পৃথকযোগ্য সমাবর্তন নিযুক্ত করে। প্রশিক্ষণের সময় মেমরির খরচ বাড়ানোর সময় এটি গণনা ব্যয় হ্রাস করে।

কেন এটি গুরুত্বপূর্ণ? কারণ এটি ভি 3 এবং ভি 4 এবং ইনসেপশন রিসনেটে ফেলে দেওয়া হয়েছিল, তবে পুনরায় চালু করা হয়েছিল এবং পরে মোবাইলনেটে ভারী ব্যবহৃত হয়েছিল ।


1

উত্তরগুলি সমঝোতার কাগজগুলির সাথে আরও গভীরতর অবস্থায় পাওয়া যাবে: https://arxiv.org/pdf/1512.00567v3.pdf

টেবিল চেক করুন 3. ইনসেপশন ভি 2 হল কনভোলিউশন পেপারের সাথে আরও গভীরতরভাবে বর্ণিত আর্কিটেকচার। ইনসেপশন ভি 3 হ'ল একই আর্কিটেকচার (ছোটখাটো পরিবর্তন) সহ বিভিন্ন প্রশিক্ষণ অ্যালগরিদম (আরএমএসপ্রপ, লেবেল স্মুথিং রেগুলারাইজার, প্রশিক্ষণের উন্নতির জন্য ব্যাচের আদর্শের সাথে একটি সহায়ক মাথা যোগ করুন)।


1

আসলে, উপরের উত্তরগুলি ভুল বলে মনে হচ্ছে। প্রকৃতপক্ষে, এটি নামকরণের সাথে একটি বড় জগাখিচুড়ি ছিল। তবে মনে হয় এটি কাগজে স্থির করা হয়েছিল যা ইনসেপশন-ভি 4 উপস্থাপন করে (দেখুন: "ইনসেপশন-ভি 4, ইনসেপশন-রেসনেট এবং শিখার উপর রেসিডুয়াল সংযোগগুলির প্রভাব"):

ইনসেপশন ডিপ কনভোলশনাল আর্কিটেকচারটি গুগলনেট হিসাবে (Szegedy et al। 2015a) হিসাবে চালু হয়েছিল, এখানে ইনসেপশন-ভি 1 নাম দেওয়া হয়েছিল। পরে ইনসেপশন আর্কিটেকচারটি বিভিন্ন উপায়ে পরিমার্জন করা হয়েছিল, প্রথমে ব্যাচের নরমালাইজেশন (Ioffe and Szegedy 2015) (ইনসেপশন-ভি 2) প্রবর্তনের মাধ্যমে। পরবর্তীতে তৃতীয় পুনরাবৃত্তির (সজেজেডি এট আল। 2015 বি) অতিরিক্ত সংযোজন আইডিয়া দ্বারা যা এই প্রতিবেদনে ইনসেপশন-ভি 3 হিসাবে উল্লেখ করা হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.