চিত্রগুলি সিএনএন-এ রাখার আগে আমাদের কেন স্বাভাবিক করার দরকার?


29

আমরা সিএনএন-এর জন্য চিত্রটি স্বাভাবিক করার কারণটি (চিত্র - গড়_মাখা) দ্বারা পরিষ্কার করছি না? ধন্যবাদ!

উত্তর:


34

প্রথম দ্রষ্টব্য: আপনার প্রতিটি বৈশিষ্ট্যের মান (পিক্সেল) মানের স্ট্যান্ডার্ড বিচ্যুতি দ্বারা সত্যই বিভাজন করা উচিত। গড়কে বিয়োগ করে ইনপুটটিকে 0-এ কেন্দ্র করে এবং স্ট্যান্ডার্ড বিচ্যুতি দ্বারা ভাগ করা কোনও আকারযুক্ত বৈশিষ্ট্যটির মানকে গড় থেকে দূরে স্ট্যান্ডার্ড বিচ্যুতির সংখ্যাটিকে করে তোলে।

আপনার প্রশ্নের উত্তর দেওয়ার জন্য: একটি নিউরাল নেটওয়ার্ক কীভাবে এর ওজন শিখবে তা বিবেচনা করুন। সি (এনএন) এর শিখুন ক্রমাগত গ্রেডিয়েন্ট ত্রুটিযুক্ত ভেক্টর যুক্ত করুন (শিখার হার দ্বারা গুণিত) ব্যাকপ্রপ্যাজেশন থেকে নেটওয়ার্কের বিভিন্ন ওজন ম্যাট্রিকগুলিতে গণনা করা হয়েছে যেহেতু প্রশিক্ষণের উদাহরণগুলি পেরিয়ে যায়।

এখানে লক্ষ্য করার বিষয়টি হল "শিক্ষার হার দ্বারা গুণিত"।

আমরা যদি আমাদের ইনপুট প্রশিক্ষণ ভেক্টরগুলিকে স্কেল না করি তবে বৈশিষ্ট্য মানগুলির আমাদের বিতরণের ক্ষেত্রগুলি প্রতিটি বৈশিষ্ট্যের জন্য পৃথক হতে পারে এবং সুতরাং শিক্ষার হার প্রতিটি মাত্রায় সংশোধন ঘটায় যা একে অপরের থেকে পৃথক (আনুপাতিকভাবে কথা বলা) হবে। অন্যজনকে কমপিউসেট করার সময় আমরা একটি ওজন মাত্রায় একটি সংশোধনকে ক্ষতিপূরণ দিতে পারি।

এটি অ-আদর্শ, কারণ আমরা আমাদেরকে একটি দোলায়মান (ব্যয় (ওজন) স্থানের চেয়ে ভালতর ম্যাক্সিমায়ার কেন্দ্রে অক্ষম) বা ধীর গতিতে (আরও ভাল ম্যাক্সিমায় যাওয়ার জন্য খুব ধীরগতিতে) রাষ্ট্রের মধ্যে দেখতে পাই।

প্রতি ওজন শেখার হার অবশ্যই পাওয়া সম্ভব তবে এটি ইতিমধ্যে একটি জটিল নেটওয়ার্কে প্রবর্তন করা আরও বেশি হাইপারপ্যারামিটার যা আমাদের সন্ধান করতে আরও অনুকূল করতে হবে। সাধারণত শেখার হারগুলি স্কেলার।

সুতরাং আমরা চিত্রগুলি এনএন (বা কোনও গ্রেডিয়েন্ট ভিত্তিক) অ্যালগরিদমে ইনপুট হিসাবে ব্যবহার করার আগে তাদের স্বাভাবিক করার চেষ্টা করি।


1
রঙের চিত্র সম্পর্কে কী? আমি কি প্রতিটি রঙের চ্যানেলের জন্য এটি করি? রঙ বিতরণ যে গোলযোগ না?
ব্যবহারকারী 10024395

2
বিশ্বাস করুন আপনার হ্যাঁ করার কথা। আপনি ঠিক এর মতো কিছু করতে পারেন:(image - image.mean()) / (image.std() + 1e-8)
অ্যালেন

এটি কি প্রশিক্ষণের জন্য সত্যই সহায়ক? আমি অবজেক্ট ডিটেক্টরকে প্রশিক্ষণ দিচ্ছি, এবং এই ফিটার্সগুলি ব্যবহার করে চিত্র (গুলি) সত্যিই বিভ্রান্ত করছে, আমি যে জিনিসগুলি সনাক্ত করছি তা দেখতে শক্ত
দার্লিন

এটি শেখার যোগ্যতা এবং নির্ভুলতার দিক থেকে প্রশিক্ষণের জন্য বেশ সহায়ক - এটি আপনার জন্য নয় এটি মডেলের জন্য :) আপনি যখন ডিবাগিং করছেন তখন আপনি নরমালাইজড চিত্রটি আউটপুট করতে চাইতে পারেন যাতে এটি আপনার মানুষের চোখে স্বাভাবিক দেখা যায়।
লোলারকোস্টার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.