যদি ম্যাক্স পুলিং কেবল যেভাবেই চিত্রের নিচে নমুনা নিতে চলেছে তবে কেন দৃolute়প্রতিজ্ঞ?


14

প্রান্ত সনাক্তকরণের মতো কিছু করার জন্য ফিল্টার প্রয়োগ করার ধারণাটি একটি দুর্দান্ত ধারণা।

উদাহরণস্বরূপ, আপনি একটি image এর একটি চিত্র নিতে পারেন some কিছু ফিল্টার দিয়ে, আপনি রূপান্তরিত চিত্রগুলি দিয়ে শেষ করতে পারেন যা মূল চিত্রের বিভিন্ন বৈশিষ্ট্যকে জোর দেয়। মূল 7:

এখানে চিত্র বর্ণনা লিখুন

নেটওয়ার্ক হিসাবে অভিজ্ঞ হতে পারে:

এখানে চিত্র বর্ণনা লিখুন

প্রতিটি চিত্র কীভাবে মূল 7 এর আলাদা প্রান্তটি বের করেছে তা লক্ষ্য করুন।

এটি দুর্দান্ত, তবে তারপরে বলুন আপনার নেটওয়ার্কের পরবর্তী স্তরটি একটি সর্বাধিক পুলিং স্তর।

আমার প্রশ্নটি, সাধারণত, এটি কি ওভারকিলের মতো কিছুটা মনে হয় না? আমরা ফিল্টারগুলি ব্যবহার করে প্রান্তগুলি সনাক্তকরণের জন্য খুব যত্নবান এবং ইচ্ছাকৃত হয়েছি - এখন, আমরা আর কোনওটিরই যত্ন নিই না, যেহেতু আমরা পিক্সেল মানগুলি বাদ দিয়েছি! আমি ভুল হলে আমাকে সংশোধন করুন, তবে আমরা 25 এক্স 25 থেকে 2 এক্স 2 এ চলেছি! কেন কেবল তখন সরাসরি ম্যাক্স পুলিংয়ে যাবেন না, আমরা কি মূলত একই জিনিসটি শেষ করব না?

আমার প্রশ্নটি একটি এক্সটেনশান হিসাবে, আমি সাহায্য করতে পারি না তবে আশ্চর্য হতে পারি না যে কী ঘটবে, কাকতালীয়ভাবে, 4 স্কোয়ারগুলির প্রত্যেকেরই কেবল একই সর্বাধিক মান সহ একটি পিক্সেল হবে। নিশ্চয়ই এটি বিরল ঘটনা নয়, তাই না? হঠাৎ আপনার সমস্ত প্রশিক্ষণ চিত্রগুলি হুবহু দেখতে একই রকম।

উত্তর:


16

সর্বাধিক পুলিং চিত্রটি নিচে নমুনা দেয় না। এটি সুনির্দিষ্টভাবে বৈশিষ্ট্যগুলি (যেমন প্রান্তগুলি) সন্ধান করে যা আপনি সবে সরিয়েছেন। যার অর্থ এই প্রান্তগুলি বা অন্যান্য বৈশিষ্ট্যগুলি যেখানে আপনি আনুমানিক পাবেন more নেটওয়ার্কটির সাধারণীকরণের জন্য প্রায়শই এটি প্রয়োজন - শ্রেণিবদ্ধকরণের জন্য এটি 10,5 থেকে 10,20 থেকে একটি উল্লম্ব প্রান্ত চলছে তা জানতে হবে না, তবে এটির প্রায় 1/3 প্রায় উল্লম্ব প্রান্ত রয়েছে চিত্রের প্রায় 2/3 উচ্চতা বাম প্রান্ত।

এই রাউগার বিভাগগুলির বৈশিষ্ট্যগুলি অন্তর্নিহিতভাবে খুব সামান্য ব্যয়ের জন্য ইনপুট চিত্রের আরও বিভিন্ন প্রকারগুলি কভার করে, এবং বৈশিষ্ট্য মানচিত্রের আকার হ্রাস হ্রাস একটি খুব ভাল পার্শ্ব প্রতিক্রিয়া, যা নেটওয়ার্কটিকে দ্রুততর করে তোলে।

এটি ভালভাবে কাজ করার জন্য, আপনাকে এখনও শুরু করতে বৈশিষ্ট্যগুলি বের করতে হবে, যা সর্বাধিক পুলিং করে না, তাই কনভোলজিকাল স্তরটি প্রয়োজনীয়। আপনার খুঁজে পাওয়া উচিত যে আপনি প্রথম সর্বাধিক-পুলিং স্তরটি ব্যবহার না করে মূল চিত্রটি (14x14 এ) ডাউন-নমুনা করতে পারেন এবং আপনি এখনও বেশ যুক্তিসঙ্গত নির্ভুলতা পাবেন। গভীর স্নায়ুবিহীন নেটওয়ার্ক তৈরির সময় কতটা পুলিং করতে হবে এবং এই স্তরগুলি কোথায় যুক্ত করা যায় তা অন্য একটি হাইপার-প্যারামিটার সমস্যা।


6

এর মধ্যে থাকা কারণে আমরা সরাসরি ইনপুট স্তর থেকে সর্বোচ্চ পুলিংয়ে যেতে পারি না convolution layer। কনভোলশনের কারণ বৈশিষ্ট্যগুলি নিষ্কাশন করা। সর্বাধিক পুলিং ডাউন বৈশিষ্ট্যগুলি যেগুলি বের করা হয়েছে। আপনি যদি ভাবেন যে এমন কিছু বৈশিষ্ট্য রয়েছে যা একটি বৃহত ম্যাট্রিক্স থেকে সর্বোচ্চ পুলিং স্তরে সরাসরি লাফ দেওয়ার কারণে অনুপস্থিত রয়েছে তবে আপনি কোনও আকারে সন্তুষ্ট না হওয়া পর্যন্ত আপনি মাঝখানে আরও বেশি স্তর যুক্ত করতে পারেন এবং তারপরে সর্বাধিক পুলিং করতে পারেন যাতে এটি ওভারকিল নয়

সর্বাধিক গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি সনাক্ত করতে ডাউন স্যাম্পলিংয়ের একটি রূপ যা ম্যাক্স পুলিং ব্যবহৃত হয়। তবে গড় পুলিং এবং অন্যান্য বিভিন্ন কৌশল ব্যবহার করা যেতে পারে। আমি সাধারণত ছবি না দিয়ে টেক্সট নিয়ে কাজ করি। আমার জন্য, মানগুলি সাধারণত সব একই হয় না। তবে যদি সেগুলি খুব বেশি হয় তবে এটি খুব বেশি পার্থক্য করতে পারে না কারণ এটি সর্বাধিক মানটিকে পছন্দ করে।

উইকি থেকে একটি খুব ভাল বোঝার -The intuition is that once a feature has been found, its exact location isn't as important as its rough location relative to other features. The function of the pooling layer is to progressively reduce the spatial size of the representation to reduce the amount of parameters and computation in the network, and hence to also control overfitting. It is common to periodically insert a pooling layer in-between successive conv layers in a CNN architecture. The pooling operation provides a form of translation invariance.


আপনি শেষ বাক্যটি ব্যাখ্যা করতে পারেন The pooling operation provides a form of translation invariance?
হ্যালো ওয়ার্ল্ড

@ স্টুডেন্টটি এর অর্থ হ'ল চিত্রের যে কোনও জায়গায় বৈশিষ্ট্যটি সনাক্ত করা হলে সর্বোচ্চ-পুলের আউটপুট একই হবে। চিত্রটিতে যে জিনিসটি বৈশিষ্ট্যটি সক্রিয় করা হচ্ছে তা সরিয়ে ফেলুন এবং সর্বোচ্চ-পুলটিতে একটি আলাদা ইনপুট সর্বোচ্চ হবে তবে সর্বোচ্চ-পুলের আউটপুট একই হওয়া উচিত।
mrmcgreg

@ এমআরএমসিগ্রিগ আমি বিশ্বাস করি যে এটি গ্লোবাল পুলিংয়ের পক্ষে সত্য, সর্বোচ্চ পুলিংয়ের জন্য নয়। সর্বাধিক পুলিং পুল অঞ্চলের (যেমন 2x2) স্থানীয় অনুবাদগুলিতে এক ধরণের বিভ্রান্তি সরবরাহ করে। এটি বৈশিষ্ট্যগুলিতে কিছু বিড়ম্বনার অনুমতি দেয়।
জ্যামিতিকাল

0

কনভলিউশন মূলত পিক্সেলের (নেটওয়ার্কের প্যারামিটার) সম্পর্ক না হারিয়ে চিত্রের আকার হ্রাস করতে একটি ছোট পিক্সেল ফিল্টার দিয়ে চিত্রটি ফিল্টার করছে, পুলিংও পিক্সেলের সর্বোচ্চ, গড় বা সমষ্টি বের করে স্থানিক আকারকে হ্রাস করে ফিল্টারটি তবে এটি প্রক্রিয়াতে গুরুত্বপূর্ণ পরামিতি মিস করতে পারে যা আকারটি উল্লেখযোগ্যভাবে হ্রাস না করে পুনর্বিবেচনা অর্জন করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.