কীভাবে 'কনভলিউশনগুলির সাথে আরও গভীরতর হয়' কাজ করে ডেপথকনক্যাট অপারেশন?


12

সমঝোতার সাথে আরও গভীরতর পড়া আমি একটি ডিপথ কনক্যাট স্তর জুড়ে এসেছি , প্রস্তাবিত ইনসেপশন মডিউলগুলির একটি বিল্ডিং ব্লক , যা বিভিন্ন আকারের একাধিক টেনসারের আউটপুটকে একত্রিত করে। লেখকরা এটিকে "ফিল্টার কনক্যাটেনশন" বলে থাকেন। টর্চের জন্য একটি বাস্তবায়ন বলে মনে হচ্ছে , তবে আমি আসলে বুঝতে পারি না, এটি কী করে। কেউ কি সহজ কথায় ব্যাখ্যা করতে পারেন?

উত্তর:


9

আমি মনে করি না ইনসেপশন মডিউলটির আউটপুট বিভিন্ন আকারের।

এখানে চিত্র বর্ণনা লিখুন

কনভোলশনাল স্তরগুলির জন্য লোকেরা স্থানিক রেজোলিউশন ধরে রাখতে প্রায়শই প্যাডিং ব্যবহার করে।

অন্যান্য সমঝোতার স্তরগুলির মধ্যে নীচের ডানদিকে পুলিং স্তর (নীল ফ্রেম )টি বিশ্রী মনে হতে পারে। তবে প্রচলিত পুলিং-সাবসাম্পলিং স্তরগুলি (লাল ফ্রেম, স্ট্রাইড> 1) এর বিপরীতে, তারা এই পুলিং স্তরে 1 টি স্ট্রাইড ব্যবহার করেছে । স্ট্রাইড -১ পুলিং স্তরগুলি প্রকৃতপক্ষে কনভ্যুসিভাল স্তরগুলির মতো একইভাবে কাজ করে তবে কনভোলশন অপারেশন সর্বাধিক ক্রিয়াকলাপ দ্বারা প্রতিস্থাপিত হয়।

সুতরাং পুলিং লেয়ারের পরে রেজোলিউশনটিও অপরিবর্তিত থাকে এবং আমরা পুলিং এবং সমঝোতার স্তরগুলিকে "গভীরতা" মাত্রায় একত্রে সংযুক্ত করতে পারি।

এখানে চিত্র বর্ণনা লিখুন

কাগজ থেকে উপরের চিত্র হিসাবে দেখানো হয়েছে, ইনসেপশন মডিউলটি আসলে স্থানিক রেজোলিউশন রাখে keeps


6

আপনি যে সাদা কাগজটি পড়ছেন এবং যে সূত্রগুলি আপনি উল্লেখ করেছেন সেগুলি আমাকে বাস্তবায়নে আসতে সহায়তা করেছে বলে আমার মনে একই প্রশ্ন ছিল।

ইন টর্চ আপনি যে কোডটি রেফারেন্সড , এটা বলেন:

--[[ DepthConcat ]]--
-- Concatenates the output of Convolutions along the depth dimension
-- (nOutputFrame). This is used to implement the DepthConcat layer
-- of the Going deeper with convolutions paper :

ডিপ লার্নিংয়ের "গভীরতা" শব্দটি কিছুটা অস্পষ্ট। ভাগ্যক্রমে এই এসও উত্তরটি কিছু স্পষ্টতা সরবরাহ করে:

ডিপ নিউরাল নেটওয়ার্কগুলিতে গভীরতা বলতে বোঝায় যে নেটওয়ার্কটি কত গভীর, তবে এই প্রসঙ্গে, গভীরতাটি ভিজ্যুয়াল স্বীকৃতির জন্য ব্যবহৃত হয় এবং এটি কোনও চিত্রের তৃতীয় মাত্রায় অনুবাদ করে।

এই ক্ষেত্রে আপনার একটি চিত্র রয়েছে এবং এই ইনপুটটির আকার 32x32x3 যা (প্রস্থ, উচ্চতা, গভীরতা)। প্রশিক্ষণ চিত্রগুলির বিভিন্ন চ্যানেলে গভীরতা হিসাবে অনুবাদ করা হয় তাই নিউরাল নেটওয়ার্কগুলি এই পরামিতিগুলির উপর ভিত্তি করে শিখতে সক্ষম হওয়া উচিত।

সুতরাং DepthConcat গভীরতার মাত্রা বরাবর টেনসরকে সম্মিলন করে যা এটি সেন্সরের শেষ মাত্রা এবং এই ক্ষেত্রে 3 ডি টেন্সরের তৃতীয় মাত্রা।

টর্চ কোড বলে যেমন ডিপথ কনক্যাটকে সমস্ত মাত্রায় টেনারগুলি একইরূপে গভীরতার মাত্রা হিসাবে তৈরি করা দরকার :

-- The normal Concat Module can't be used since the spatial dimensions
-- of tensors to be concatenated may have different values. To deal with
-- this, we select the largest spatial dimensions and add zero-padding
-- around the smaller dimensions.

যেমন

A = tensor of size (14, 14, 2)
B = tensor of size (16, 16, 3)
result = DepthConcat([A, B])
where result with have a height of 16, a width of 16 and a depth of 5 (2 + 3). 

এখানে চিত্র বর্ণনা লিখুন

উপরের চিত্রটিতে আমরা ডিপথকনক্যাট রেজাল্ট টেনসরের একটি ছবি দেখতে পাই, যেখানে সাদা অঞ্চলটি শূন্য প্যাডিং, লালটি এ টেনসর এবং সবুজটি বি টেনসর।

এই উদাহরণে DepthConcat এর সিউডো কোডটি এখানে রয়েছে:

  1. টেনসর এ এবং টেনসর বি দেখুন এবং সর্বাধিক স্থানিক মাত্রা সন্ধান করুন, যা এই ক্ষেত্রে সেন্সর বি এর 16 প্রস্থ এবং 16 উচ্চতার আকার হতে পারে। যেহেতু টেনসর এ খুব ছোট এবং এটি টেনসর বি এর স্থানিক মাত্রার সাথে মেলে না, তাই এটি প্যাড করা দরকার।
  2. টেনসর এ এর ​​আকার (16, 16, 2) তৈরি করে প্রথম এবং দ্বিতীয় মাত্রায় শূন্য যুক্ত করে টেনসর এ এর ​​স্থানিক মাত্রাগুলি প্যাড করুন।
  3. গভীরতা (তৃতীয়) মাত্রা বরাবর টেনসর বি সহ কনডিকেট প্যাডড টেন্সর এ।

আমি আশা করি এটি সেই অন্য কাউকে সহায়তা করে যাঁরা একই প্রশ্নটি সেই সাদা কাগজটি পড়ে মনে করেন।


হ্যাঁ.পারফেক্ট ভূমিকা। এটি গভীরতার দিকে সংমিশ্রিত হয়। স্থানিক দিক নয়
শমনে সিরিওর্দনা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.