চিত্রের আকার পরিবর্তন এবং সিএনএন এর জন্য প্যাডিং


14

আমি চিত্র শনাক্তকরণের জন্য একটি সিএনএন প্রশিক্ষণ দিতে চাই। প্রশিক্ষণের জন্য চিত্রগুলির নির্দিষ্ট আকার নেই। উদাহরণস্বরূপ, আমি সিএনএন-এর ইনপুট আকার 50x100 (উচ্চতা x প্রস্থ) হওয়া চাই। যখন আমি কিছু ছোট আকারের চিত্রগুলি (উদাহরণস্বরূপ 32x32) ইনপুট আকারে পরিবর্তন করি, তখন চিত্রটির সামগ্রীটি অনুভূমিকভাবে খুব বেশি প্রসারিত হয়, তবে কিছু মাঝারি আকারের চিত্রগুলির জন্য এটি ঠিক আছে বলে মনে হয়।

বিষয়বস্তু নষ্ট হওয়া এড়ানোর সময় চিত্রগুলির আকার পরিবর্তন করার উপযুক্ত পদ্ধতি কী?

(আমি 0s এর চিত্রগুলি প্যাডিংয়ের বিষয়ে আকার এবং উচ্চতার কিছুটা ডিগ্রি রেশিও অনুপাতের আকারের পরে আকারের আকারের পূর্ণ করার জন্য চিন্তা করছি this এই পদ্ধতির সাথে এটি কি ঠিক হবে?)

উত্তর:


10

স্ট্যাকওভারফ্লো সম্পর্কিত এই প্রশ্নটি আপনাকে সহায়তা করতে পারে। সংক্ষেপে, কিছু গভীর শিক্ষণ গবেষক মনে করেন যে ইমেজের একটি বড় অংশকে প্যাড করা ভাল অভ্যাস নয়, যেহেতু নিউরাল নেটওয়ার্কটি শিখতে হবে যে প্যাডেড অঞ্চলটি শ্রেণিবিন্যাসের জন্য প্রাসঙ্গিক নয়, এবং এটি শিখতে হবে না যদি আপনি উদাহরণস্বরূপ, বিরতি ব্যবহার করুন।


5

আপনার স্বল্প কিছু সু্যোগ আছে:

ছোট চিত্রগুলির জন্য:

  • বিরক্তি মাধ্যমে upsample
  • জিরো ব্যবহার করে চিত্রটি প্যাড করুন

আপনি যদি আপস্যাম্পলিংয়ের মাধ্যমে দিক অনুপাত বজায় রাখতে অক্ষম হন তবে আপনি সর্বোচ্চ মাত্রায় অতিরিক্ত পিক্সেলগুলি উপস্থাপন করতে এবং ক্রপ করতে পারেন। অবশ্যই এর ফলে ডেটা হারাতে হবে তবে আপনি বারবার আপনার ফসলের কেন্দ্রবিন্দু স্থানান্তর করতে পারেন। এটি আপনার মডেলটিকে আরও দৃ be় হতে সহায়তা করবে।


বড় চিত্রগুলির জন্য:

  • ডাউনস্যাম্পেল
  • আপনার ইনপুট আকারে ক্রপ করুন

সবশেষে, আপনি যদি সম্পূর্ণ কনভলিউশনাল নেটওয়ার্ক (এফসিএন) ব্যবহার করেন তবে আপনার চিত্রগুলি পুনরায় আকার দেওয়ার দরকার নেই।

টি এল; ডিআর:

হ্যাঁ, জিরোসের সাথে প্যাডিং একটি বৈধ বিকল্প।


যদি আমি একটি সম্পূর্ণ কনভোলিউশনাল নেটওয়ার্কের জন্য ওজন প্রশিক্ষিত করেছি যা 3 টি ভিডিও ফ্রেমকে একচেটিয়াভাবে গ্রহণ করে তবে আমি কীভাবে এই ওজনগুলিকে একই আর্কিটেকচার যুক্ত কোনও নেটওয়ার্কের জন্য 11 ফ্রেমের সংমিশ্রণ ব্যতীত ব্যবহার করতে পারি? আমি কেবল ভবিষ্যদ্বাণী করছি, আরও প্রশিক্ষণ দিচ্ছি না। আমার প্রশ্নটি এখানে: ডেটাসায়েন্স.স্ট্যাকেক্সচেঞ্জ
এমএলস্টুডেন্ট 33

3

আপনি নিম্নলিখিতটি প্রথমে কিছুটা নির্দিষ্ট আকার পর্যন্ত আকার পরিবর্তন করতে পারেন এবং তারপরে চিত্রটিকে চারদিক থেকে প্যাড করুন, যা চিত্রের বৈশিষ্ট্যগুলি বজায় রাখতে সহায়তা করতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.