গভীর শিক্ষায় স্কোয়ার চিত্রের কারণ Re


12

ভিজিজি, রেসনেট ইত্যাদির মতো বেশিরভাগ উন্নত গভীর শেখার মডেলগুলিকে সাধারণত ইনপুট হিসাবে বর্গক্ষেত্রের চিত্রের প্রয়োজন হয়, সাধারণত পিক্সেলের আকার 224এক্স224

ইনপুটটি সমান আকারের হওয়ার কোনও কারণ আছে কি, বা আমি 100এক্স200 বলার সাথে একটি কনফেট মডেলও তৈরি করতে পারি (যদি আমি উদাহরণস্বরূপ ফেসিয়াল স্বীকৃতিটি করতে চাই এবং আমার প্রতিকৃতি চিত্র আছে)?

আরও বড় পিক্সেল আকারের সাথে কি বেনিফিট বৃদ্ধি পেয়েছে, 512এক্স512 ?

উত্তর:


10

কনভোলশনাল নিউরাল নেটওয়ার্কগুলি স্বাভাবিকভাবে কাজ করতে নির্দিষ্ট পিক্সেল মাত্রার প্রয়োজন হয় না। সম্ভবত মানগুলি বাস্তববাদী কারণে চয়ন করা হয়েছে - যেমন প্যারামিটার সংখ্যা এবং প্রশিক্ষণের সেট আকার প্রয়োজনীয় বনাম চিত্রের বিবরণ ব্যবহারের মধ্যে একটি সমঝোতা।

তদতিরিক্ত, যদি উত্সের ডেটাতে বিভিন্ন দিক অনুপাত, কিছু প্রতিকৃতি, কিছু আড়াআড়ি, সাধারণত লক্ষ্য কেন্দ্রে কেন্দ্রে থাকে তবে মাঝখানে থেকে একটি বর্গক্ষেত্রের ফসল নেওয়া যুক্তিসঙ্গত আপস হতে পারে।

আপনি যখন ইনপুট চিত্রের আকার বাড়িয়ে তোলেন, সেই ইনপুটটি প্রক্রিয়াকরণের জন্য নেটওয়ার্কটিকে যে পরিমাণ শব্দ এবং বৈচিত্র্য মোকাবেলা করতে হবে তার পরিমাণও বাড়িয়ে তুলবে। এর অর্থ আরও স্তর হতে পারে - উভয় সমঝোতা এবং পুলিং। এর অর্থ এইও হতে পারে যে আপনার আরও প্রশিক্ষণের উদাহরণ প্রয়োজন, এবং অবশ্যই প্রতিটি প্রশিক্ষণের উদাহরণ আরও বড় হবে। একসাথে, এইগুলি আপনার প্রশিক্ষণ শেষ করতে হবে এমন গণনার সংস্থানগুলি বাড়িয়ে তোলে। তবে, আপনি যদি এই প্রয়োজনীয়তাটি কাটিয়ে উঠতে পারেন তবে অতিরিক্ত পিক্সেল কোনও পার্থক্য করতে পারে এমন কোনও কাজের জন্য আপনি আরও সঠিক মডেলটি তৈরি করবেন।

আপনি উচ্চতর রেজোলিউশন চান কিনা তার একটি সম্ভাব্য নিয়মটি হল, যদি আপনার নেটওয়ার্কের লক্ষ্য হিসাবে, কোনও মানব বিশেষজ্ঞ অতিরিক্ত রেজোলিউশনটি ব্যবহার করতে পারেন এবং কার্যটিতে আরও ভাল সম্পাদন করতে পারেন। এটি রিগ্রেশন সিস্টেমগুলির ক্ষেত্রে হতে পারে, যেখানে নেটওয়ার্কটি চিত্র থেকে কিছু সংখ্যক পরিমাণ গ্রহণ করে eg যেমন মুখের স্বীকৃতির জন্য বায়োমেট্রিকগুলি বের করা যেমন মুখের বৈশিষ্ট্যগুলির মধ্যে দূরত্ব। এটি স্বয়ংক্রিয় মাস্কিংয়ের মতো চিত্র-প্রক্রিয়াজাতকরণের জন্যও কাঙ্ক্ষিত হতে পারে - এই কাজের জন্য শিল্পের ফলাফলের চিত্রটি এখনও বাণিজ্যিক চিত্রগুলির চেয়ে কম রেজোলিউশন হতে পারে যেখানে আমরা সেগুলি অনুশীলনে প্রয়োগ করতে চাই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.