চিত্রগুলি কীভাবে স্বাভাবিক করা যায় সে সম্পর্কে কিছু তফাত রয়েছে তবে বেশিরভাগ ক্ষেত্রে এই দুটি পদ্ধতি ব্যবহার করা হয় বলে মনে হচ্ছে:
- সমস্ত চিত্রের জন্য গণনা করা প্রতি চ্যানেল গড়কে বিয়োগ করুন (উদাঃ VGG_ILSVRC_16_layers )
- সমস্ত চিত্রের উপরে গণনা করা পিক্সেল / চ্যানেল দ্বারা বিয়োগ (যেমন সিএনএনএস , এছাড়াও ক্যাফের রেফারেন্স নেটওয়ার্ক দেখুন )
প্রাকৃতিক দৃষ্টিভঙ্গি আমার মনে প্রতিটি চিত্রকে স্বাভাবিক করে তুলবে। দিবালোকের আলোতে তোলা কোনও চিত্র রাতারাতি ইমেজের চেয়ে বেশি নিউরনগুলিকে আগুনের কারণ হতে পারে এবং এটি আমাদের সময় সম্পর্কে জানাতে পারে যখন আমরা সাধারণত প্রান্তগুলিতে উপস্থিত আরও আকর্ষণীয় বৈশিষ্ট্যগুলি সম্পর্কে যত্ন করি etc.
পিয়ের সারমানেট ৩.৩.৩ এ উল্লেখ করেছেন যে স্থানীয় বিপরীতে নরমালাইজেশন যা প্রতি-চিত্র ভিত্তিক হবে তবে আমি যে উদাহরণ / টিউটোরিয়াল দেখেছি সেগুলির মধ্যে আমি কোনটিই পাই নি। আমি একটি আকর্ষণীয় কোওড়া প্রশ্ন এবং শিও-শেন ওয়েইয়ের পোস্টও দেখেছি তবে তারা উপরোক্ত দুটি পদ্ধতির সমর্থন করবে বলে মনে হয় না।
আমি ঠিক কী মিস করছি? এটি কি রঙিন নরমালাইজেশন ইস্যু বা এমন কোনও কাগজ রয়েছে যা আসলে ব্যাখ্যা করে যে এত লোক কেন এই পদ্ধতির ব্যবহার করে?