ডিলেটেড কনভোলিউশন এবং ডিকনভোলিউশনের মধ্যে পার্থক্য কী?


11

এই দুটি সমাবর্তন ক্রিয়াকলাপ এখনই গভীর শিক্ষার ক্ষেত্রে খুব সাধারণ।

আমি এই গবেষণাপত্রে প্রসারণযুক্ত সমঝোতা স্তর সম্পর্কে পড়লাম: ওয়েভেনেট: র অডিওর জন্য একটি জেনারেটাল মডেল

এবং ডি-কনভ্যুলশনটি এই কাগজে রয়েছে: সিমান্টিক সেগমেন্টেশনের জন্য সম্পূর্ণ কনভোলিউশনাল নেটওয়ার্ক

উভয়ই চিত্রটিকে আপ-নমুনা বলে মনে হচ্ছে তবে পার্থক্য কী?

উত্তর:


9

যান্ত্রিক / চিত্রযুক্ত / চিত্র-ভিত্তিক পদগুলিতে সাজানো:

প্রসারণ: ### মন্তব্য দেখুন, এই বিভাগটি সংশোধন করে চলছে

ডিলেশন মূলত রান-অফ-মিল কনভ্যুলেশন (স্পষ্টভাবে তাই ডিকনভোলিউশন) এর সমান, এটি বাদে এর শাঁকগুলির মধ্যে ফাঁকগুলি চিহ্নিত করে, অর্থাত্ একটি স্ট্যান্ডার্ড কার্নেল সাধারণত ইনপুটটির সংলগ্ন অংশগুলিতে স্লাইড হয়ে যায়, তবে এটি বিচ্ছিন্ন প্রতিরূপ হতে পারে, উদাহরণস্বরূপ, চিত্রটির বৃহত্তর অংশটি "ঘিরে ফেলুন" - তবুও কেবলমাত্র স্ট্যান্ডার্ড ফর্মের মতো অনেকগুলি ওজন / ইনপুট রয়েছে।

(দ্রষ্টব্য ভাল, যেহেতু প্রসারণ উদ্বুদ্ধ এটা মধ্যে শূন্য কার্নেল আরো দ্রুত করার জন্য হ্রাস , এটা এর মধ্যে TRANSPOSE সংবর্তন উদ্বুদ্ধ শূণ্যসমূহ এটা আউটপুট / রেজল্যুশন মুখের মাত্রা ইনপুট অর্ডার করার জন্য বৃদ্ধি এটা আউটপুট রেজল্যুশন।)

এটি আরও কংক্রিট করার জন্য, আসুন একটি খুব সাধারণ উদাহরণটি
ধরুন : বলুন আপনার কাছে 9x9 চিত্র রয়েছে, কোনও প্যাডিং ছাড়াই এক্স x যদি আপনি স্ট্যান্ডার্ড 2 সহ একটি স্ট্যান্ডার্ড 3x3 কার্নেল নেন তবে ইনপুট থেকে উদ্বেগের প্রথম উপসেটটি x [0: 2, 0: 2] হবে এবং এই সীমার মধ্যে থাকা সমস্ত নয়টি বিন্দু কার্নেল দ্বারা বিবেচিত হবে। এরপরে আপনি এক্স [0: 2, 2: 4] এবং আরও অনেক কিছুতে ঝাঁপিয়ে পড়বেন ।

স্পষ্টতই, আউটপুটটির মুখের আকার কম হবে, বিশেষত 4x4। সুতরাং, পরবর্তী স্তরের নিউরনে এই কার্নেলগুলি পাসের সঠিক আকারে গ্রহনযোগ্য ক্ষেত্র রয়েছে। তবে আপনার যদি আরও বৈশ্বিক স্থানিক জ্ঞান সহ নিউরনগুলির প্রয়োজন বা ইচ্ছা থাকে (যেমন, যদি কোনও গুরুত্বপূর্ণ বৈশিষ্ট্যটি এর চেয়ে বড় অঞ্চলে কেবলমাত্র সংজ্ঞাযুক্ত হয়) তবে তৃতীয় স্তরটি তৈরি করতে আপনাকে দ্বিতীয়বার এই স্তরটি সমাধান করতে হবে যাতে কার্যকর গ্রহণযোগ্য ক্ষেত্রটি রয়েছে পূর্ববর্তী স্তরগুলির কিছু ইউনিয়ন

তবে আপনি যদি আরও স্তর যোগ করতে না চান এবং / অথবা আপনি মনে করেন যে তথ্যটি অতিরিক্ত পরিমাণে রিডান্ট্যান্ট হয়ে গেছে (অর্থাত আপনার দ্বিতীয় স্তরটিতে আপনার 3x3 গ্রহণযোগ্য ক্ষেত্রগুলি কেবল "2x2" পরিমাণে স্বতন্ত্র তথ্য বহন করে) আপনি ব্যবহার করতে পারেন একটি ছড়িয়ে পড়া ফিল্টার। আসুন আমরা স্পষ্টতার জন্য এটি সম্পর্কে চরম হয়ে উঠি এবং বলি যে আমরা একটি 9x9 3-ডায়াল্যাড ফিল্টার ব্যবহার করব। এখন, আমাদের ফিল্টারটি পুরো ইনপুটটিকে "ঘিরে ফেলবে", সুতরাং আমাদের এটিকে মোটেও স্লাইড করতে হবে না। আমরা তবুও, কেবলমাত্র ইনপুট, এক্স থেকে সাধারণত 3x3 = 9 ডেটা পয়েন্ট গ্রহণ করব :

x [0,0] ইউ x [0,4] ইউ এক্স [0,8] ইউ এক্স [4,0] ইউ এক্স [4,4] ইউ এক্স [4,8] ইউ এক্স [8,0] ইউ এক্স [8,4] ইউ এক্স [8,8]

এখন, আমাদের পরবর্তী স্তরের নিউরনে (আমাদের কেবল একটি থাকবে) ডেটা থাকবে আমাদের চিত্রের বৃহত্তর অংশটিকে "প্রতিনিধিত্ব" করে এবং আবারও, যদি চিত্রটির ডেটা সংলগ্ন তথ্যের জন্য অত্যধিক অপ্রয়োজনীয় হয় তবে আমরা ভালভাবে সংরক্ষণ করতে পারি একই তথ্য এবং একটি সমমানের রূপান্তর শিখেছে, তবে কম স্তর এবং কম পরামিতি সহ। আমি মনে করি এই বিবরণটির সীমানার মধ্যে এটি স্পষ্ট যে পুনর্নির্মাণের হিসাবে নির্ধারিত হলেও আমরা এখানে প্রতিটি কার্নেলের জন্য ডাউনস্যাম্পলিং করছি।


ভগ্নাংশযুক্ত বা ট্রান্সপোজ বা "ডিকনভোলিউশন":

এই সাজ্টটি এখনও হৃদয় থেকে বোঝা। পার্থক্যটি আবার, আমরা ছোট ইনপুট ভলিউম থেকে একটি বড় আউটপুট ভলিউম দিকে সরানো হবে। ওপ আপসাম্পলিং কী তা নিয়ে কোনও প্রশ্নই করেনি, সুতরাং আমি এবার কিছুটা প্রশস্ততা সঞ্চয় করব এবং সরাসরি সম্পর্কিত উদাহরণে যাব।

আমাদের 9x9 ক্ষেত্রে আগে থেকে বলুন যে আমরা এখন 11x11 এ আপসামেল করতে চাই। এই ক্ষেত্রে, আমাদের দুটি সাধারণ বিকল্প রয়েছে: আমরা একটি 3x3 কার্নেল এবং স্ট্রাইড 1 দিয়ে নিতে পারি এবং এটি আমাদের 3x3 ইনপুটটিতে 2-প্যাডিং দিয়ে ঝাড়িয়ে দিতে পারি যাতে আমাদের প্রথম পাসটি অঞ্চলের উপর দিয়ে যায় [বাম-প্যাড -2: 1, উপরের-প্যাড -২: ১] এরপরে [বাম-প্যাড -১: ২, উপরে-প্যাড -২: ১] এবং আরও অনেক কিছু।

বিকল্পভাবে, আমরা অতিরিক্তভাবে ইনপুট ডেটাগুলির মধ্যে প্যাডিং sertোকাতে পারি এবং তার চেয়ে বেশি প্যাডিং ছাড়াই কার্নেলটিকে ঝাপিয়ে রাখতে পারি। স্পষ্টতই আমরা মাঝে মাঝে একক কার্নেলের জন্য একাধিকবার একই একই ইনপুট পয়েন্টগুলি নিয়ে নিজেদের মধ্যে থাকব ; এখানেই "ভগ্নাংশ-পদক্ষেপ" শব্দটি আরও যুক্তিযুক্ত বলে মনে হয়। আমি মনে করি নীচের অ্যানিমেশন ( এখান থেকে ধার করা এবং ভিত্তিক (আমি বিশ্বাস করি) এই কাজটি বন্ধ করে দিয়ে বিভিন্ন মাত্রা থাকা সত্ত্বেও জিনিসগুলি পরিষ্কার করতে সহায়তা করবে ইনপুটটি নীল, সাদা ইনজেকশনের জিরো এবং প্যাডিং এবং আউটপুট সবুজ:

স্থানান্তরিত রূপান্তর, ইনপুট নীল, আউটপুট সবুজ

অবশ্যই, আমরা সমস্ত ইনপুট ডেটাগুলি বিচ্ছিন্ন করার বিপরীতে যা আমাদের কিছু অঞ্চল পুরোপুরি উপেক্ষা করতে পারে বা করতে পারে না তার সাথে আমরা নিজেরাই রয়েছি। এবং যেহেতু আমরা শুরু করার চেয়ে আরও বেশি ডেটা দিয়ে স্পষ্টভাবে ঘুরে দেখছি, "আপসাম্পলিং"।

আমি আপনাকে আরও ভাল শব্দ, বিমূর্ত সংজ্ঞা এবং ট্রান্সপোজ সমঝোতার ব্যাখ্যা এবং সেই সাথে ভাগ করে নেওয়া উদাহরণগুলি চিত্রিত তবে মূলত উপস্থাপিত রূপান্তর গণনার জন্য বেশিরভাগ ক্ষেত্রে অনুপযুক্ত ফর্মগুলি কেনার জন্য যুক্ত সেই দুর্দান্ত নথিটি পড়তে উত্সাহিত করি।


1
দয়া করে মনে রাখবেন, আমি কোনও বিশেষজ্ঞ নই - সাম্প্রতিক সময়ে নিজেকে এই ধারণাগুলি আলাদা করতে হবে এমন কাউকে সামর্থ্য করুন। কোনও সরল ভুল বা অত্যধিক সরলকরণ যা উত্তরগুলি সামগ্রিক যথাযথতাটিকে ক্ষুন্ন করতে পারে তা দয়া করে আমাকে জানান। ধন্যবাদ!
ডগ ব্রুম্মেল

ডগ ব্রুমেল বাহ সুন্দরভাবে ব্যাখ্যা করুন। আমার একই আইডিয়া ছিল। আমি বিচ্ছিন্ন সমঝোতা প্রয়োগ সম্পর্কে আপনার মতামত জানতে চাই, কীভাবে আমাদের সিএনএন-তে এটি প্রয়োগ করা উচিত। আমরা কি প্রথমে কিছু সাধারণ কনভলিউশনের পরে ডিলিটেড কনসোলিউশন প্রয়োগ করি? আর একটি বিষয় বিশিষ্ট সমাবর্তন তথ্য মিস করতে পারে যদি আমরা শূন্য প্যাড না করি। সুতরাং আমি মনে করি কয়েকটি সাধারণ বন্দীদের স্তরগুলির পরে আমাদের কীভাবে ছড়িয়ে পড়া সমঝোতা প্রয়োগ করা উচিত?
শমনে সিরীবর্ধান

আমি বিশ্বাস করি যে স্ট্যান্ডার্ড ধারণাটি আপনার নেটওয়ার্কের গভীরতার মধ্য দিয়ে অগ্রসর হওয়ার সাথে সাথে l = 1 এর জন্য অনাকাঙ্ক্ষিত, নিয়মিত ফিল্টারগুলি শুরু করে, 2- এবং তারপরে 3-বিভক্ত ফিল্টার এবং এর থেকে শুরু করে অগ্রসর হওয়ার পরিমাণ বাড়িয়ে তোলা। এটি আপনাকে প্রতিটি স্তরের সাথে তাত্পর্যপূর্ণ দ্রুত ডাউনস্যাম্পলিং করার অনুমতি দেয় তবে কোনও বৃদ্ধির পরামিতি ছাড়াই এক স্তরের সমস্ত ডেটা পরবর্তী (বিশেষত নেটওয়ার্কের মধ্যেই অন্তর্ভুক্ত) পাস করার তা নিশ্চিত করতে দেয়। ডেটা অন্তর্ভুক্তি ত্যাগ ছাড়াই লক্ষ্য প্রশস্ত গ্রহণযোগ্য ক্ষেত্র being এবং হ্যাঁ, প্যাডিংয়ের দিকে মনোযোগ দেওয়া উচিত তাড়াতাড়ি।
ডগ ব্রুম্মেল

[এই কাগজ] দেখুন ( arxiv.org/pdf/1511.07122.pdf ), এটি উপরে উল্লেখ করা হয়েছে এবং আমি বিষয়টিতে কী পড়েছি সে সম্পর্কে একটি ভাল ধারণা সরবরাহ করেছে।
ডগ ব্রুম্মেল

অন্য একটি জিনিস, সেই কাগজটিতে বলা হয়েছে যে এরকম ক্রমবর্ধমান পীড়ন স্কিমে রেজুলেশন হ্রাসের কোনও ক্ষতি নেই ... আমি অনুমান করি যে আমি "রেজোলিউশন" এর আওতায় কম্বল বয়ে যেতে পারে এমন অন্যান্য ক্ষতির বিষয়ে আমি কেবল সতর্ক। অবশ্যই, আপনি যদি কম সংযোজিত স্তরগুলির সাথে একগুচ্ছ কনভ স্তরগুলি প্রতিস্থাপন করতে পারেন এবং যথার্থতা বজায় রাখতে পারেন তবে দুর্দান্ত, আপনার অবশ্যই হওয়া উচিত should তবে আমার কাছে (এবং আমাকে এই বইগুলিতে ফিরে আসতে হবে), আমি যে ক্ষেত্রে আপনি
প্রথমদিকে

5

যদিও উভয়ই একই জিনিস করছেন বলে মনে হচ্ছে, যা একটি স্তর আপ-নমুনা করছে, তাদের মধ্যে একটি স্পষ্ট মার্জিন রয়েছে।

প্রথমে আমরা ডিলেটেড কনভোলিউশন সম্পর্কে কথা বলি

আমি উপরের বিষয়টিতে এই দুর্দান্ত ব্লগটি পেয়েছি । সুতরাং আমি যেমন বুঝতে পেরেছি, এটি আরও ইনপুট ডেটার পয়েন্টগুলি বিস্তৃতভাবে অন্বেষণ করার মতো । বা কনভলশন অপারেশনের গ্রহণযোগ্য ক্ষেত্র বৃদ্ধি করা।

এখানে কাগজটি থেকে একটি বিস্মৃত কনভলিউশন ডায়াগ্রাম রয়েছে ।

চিত্র 3

এটি সাধারণ কনভলিউশনের আরও বেশি, তবে পরামিতিগুলির আকার না বাড়িয়ে ইনপুট পিক্সেল থেকে আরও এবং আরও বিশ্বব্যাপী প্রসঙ্গটি ক্যাপচারে সহায়তা করে। এটি আউটপুটটির স্পেসিয়াল আকার বাড়াতে সহায়তা করতে পারে। তবে এখানে মূল বিষয় এটি স্তরগুলির সংখ্যার সাথে দ্রুত গ্রহণযোগ্য ক্ষেত্রের আকার বাড়িয়ে তোলে। এটি সংকেত প্রক্রিয়াকরণ ক্ষেত্রে খুব সাধারণ।

এই ব্লগটি সত্যই ব্যাখ্যা করেছে যে বিচ্ছিন্ন সমাবর্তনে নতুন কী এবং এটি কীভাবে সাধারণ সমঝোতার সাথে তুলনা করা হয়।

ব্লগ: ডিলেটেড কনভলিউশন এবং ক্রোনেকার ফ্যাক্টার্ড কনভলিউশন

এখন আমি ডেকনভলিউশন কী তা ব্যাখ্যা করব

একে ট্রান্সপোজড কনভলিউশন বলা হয়। এটি পিছনের প্রচারে সমঝোতার জন্য আমরা যে ফাংশনটি ব্যবহার করেছি তার সমান।

কেবল ব্যাকপ্রপের মধ্যে আমরা আউটপুট বৈশিষ্ট্য মানচিত্রে একটি নিউরন থেকে গ্রাহকগুলি ক্ষেত্রের সমস্ত উপাদানগুলিতে বিতরণ করি, তারপরে আমরা একই ধরণের গ্রাহক উপাদানগুলির সাথে একত্রিত হয়ে গ্রেডিয়েন্টগুলিও যোগ করি they

এখানে ছবি সহ একটি ভাল সংস্থান রয়েছে

সুতরাং মূল ধারণাটি হ'ল ডিকনভোলিউশন আউটপুট স্পেসে কাজ করে। ইনপুট পিক্সেল নয়। এটি আউটপুট মানচিত্রে আরও বিস্তৃত স্পাসিয়াল মাত্রা তৈরি করার চেষ্টা করবে। এটি শব্দার্থক বিভাজনের জন্য সম্পূর্ণ কনভলিউশনাল নিউরাল নেটগুলিতে ব্যবহৃত হয় ।

তাই ডেকনভলিউশনের আরও একটি শেখার উপ-নমুনা স্তর।

এটি চূড়ান্ত ক্ষতির সাথে একত্রিত হয়ে কীভাবে আপ-নমুনা করবেন তা শিখার চেষ্টা করে

ডিকনভলিউশনের জন্য এটিই আমার সেরা ব্যাখ্যা। Cs231 13 বক্তৃতা, 21,21 অনওয়ার্ড থেকে


কীভাবে বিচ্ছিন্ন সমঝোতা আউটপুটটির স্পেসিয়াল আকার বাড়াতে সাহায্য করে সে সম্পর্কে বিশদ বিবরণ করতে আপনি কি আপত্তি করবেন? মনে হয় এটি প্রচলিত কনভোলিউশনগুলির চেয়ে আরও বেশি প্যাডিং প্রয়োজন, ফলে আউটপুট আকারের ক্ষেত্রে আরও খারাপ।
wlnirvana
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.