আমি আমার মডেলটিকে প্রশিক্ষণের চেষ্টা করছি যা চিত্রগুলিকে শ্রেণিবদ্ধ করে। আমার সমস্যাটি হ'ল তাদের আকার বিভিন্ন। আমি কীভাবে আমার চিত্রগুলি / বা মডেল আর্কিটেকচারটি ফর্ম্যাট করব?
আমি আমার মডেলটিকে প্রশিক্ষণের চেষ্টা করছি যা চিত্রগুলিকে শ্রেণিবদ্ধ করে। আমার সমস্যাটি হ'ল তাদের আকার বিভিন্ন। আমি কীভাবে আমার চিত্রগুলি / বা মডেল আর্কিটেকচারটি ফর্ম্যাট করব?
উত্তর:
আপনি কোন আর্কিটেকচারের কথা বলছেন তা আপনি বলেননি। যেহেতু আপনি বলেছেন যে আপনি চিত্রগুলিকে শ্রেণিবদ্ধ করতে চান, তাই আমি এটি আংশিক সমঝোতা, আলেকসনেট, গুগলনেট ইত্যাদির মতো আংশিকভাবে সম্পূর্ণ সংযুক্ত নেটওয়ার্ক হিসাবে ধরে নিচ্ছি যে সাধারণভাবে, আপনার প্রশ্নের উত্তর আপনি যে নেটওয়ার্কের সাথে কাজ করছেন তার উপর নির্ভর করে।
উদাহরণস্বরূপ, যদি আপনার নেটওয়ার্কটিতে কেবল কনভোলশনাল ইউনিট থাকে - তবে এটি বলতে গেলে সম্পূর্ণরূপে সংযুক্ত স্তর থাকে না - এটি ইনপুট চিত্রের আকারের জন্য অদম্য হতে পারে। এই জাতীয় নেটওয়ার্ক ইনপুট চিত্রগুলি প্রক্রিয়া করতে পারে এবং পরিবর্তে অন্য চিত্রটি ("সমস্ত উপায়ে সমঝোতা") ফিরিয়ে আনতে পারে ; আপনাকে অবশ্যই নিশ্চিত করতে হবে যে আউটপুটটি আপনার প্রত্যাশার সাথে মিলে যায়, যেহেতু অবশ্যই আপনাকে কোনওভাবে ক্ষতি নির্ধারণ করতে হবে।
আপনি যদি সম্পূর্ণ সংযুক্ত ইউনিটগুলি ব্যবহার করেন তবে, আপনি সমস্যার মুখোমুখি হয়ে উঠছেন: এখানে আপনার নেটওয়ার্কের সাথে কাজ করতে হবে এমন নির্দিষ্ট পরিমাণ ওজনের একটি নির্দিষ্ট পরিমাণ রয়েছে, তাই পরিবর্তিত ইনপুটগুলির জন্য বিভিন্ন ধরণের ওজনের প্রয়োজন হয় - এবং এটি সম্ভব নয়।
যদি এটি আপনার সমস্যা হয় তবে এখানে কিছু কাজ আপনি করতে পারেন:
N
সঠিক আকারের বিভিন্ন চিত্রগুলিতে বিভক্ত হয়ে যায় ।প্যাডিং বিকল্পটি নেটওয়ার্কের পূর্বাভাসের জন্য একটি অতিরিক্ত ত্রুটি উত্স উপস্থাপন করতে পারে, কারণ নেটওয়ার্কটি (পড়ুন: সম্ভবত হবে) এমন প্যাডযুক্ত সীমানাযুক্ত চিত্রগুলিতে পক্ষপাতদুষ্ট থাকবে। আপনার যদি কিছু ধারণা প্রয়োজন, টেনসরফ্লো ডকুমেন্টেশনের চিত্র বিভাগটি দেখুন , এর মতো টুকরোগুলি আরও resize_image_with_crop_or_pad
বড় কাজটি সরিয়ে ফেলবে ।
যেমন কেবল স্কোয়াশিংয়ের বিষয়ে যত্ন নেই, এখানে বিখ্যাত ইনসেপশন নেটওয়ার্কের প্রিপ্রোসেসিং পাইপলাইনের একটি অংশ রয়েছে:
# This resizing operation may distort the images because the aspect
# ratio is not respected. We select a resize method in a round robin
# fashion based on the thread number.
# Note that ResizeMethod contains 4 enumerated resizing methods.
# We select only 1 case for fast_mode bilinear.
num_resize_cases = 1 if fast_mode else 4
distorted_image = apply_with_random_selector(
distorted_image,
lambda x, method: tf.image.resize_images(x, [height, width], method=method),
num_cases=num_resize_cases)
তারা এটি সম্পর্কে পুরোপুরি সচেতন এবং যাইহোক এটি করুন।
কতদূর আপনি চান বা প্রয়োজন যেতে উপর ভিত্তি করে, সেখানে আসলে একটি কাগজ এখানে বলা ভিসুয়াল স্বীকৃতির জন্য ডীপ সংবর্তন নেটওয়ার্ক মধ্যে স্থানিক পিরামিড পুলিং যে হ্যান্ডলগুলি তাদের একটি খুব বিশেষ পদ্ধতিতে প্রক্রিয়াকরণ দ্বারা নির্বিচারে আকারের ইনপুট।
একটি স্থানিক পিরামিড পুলিং স্তর তৈরি করার চেষ্টা করুন। তারপরে এটি আপনার শেষ সমাবর্তন স্তরটির পরে রাখুন যাতে এফসি স্তরগুলি সর্বদা ইনপুট হিসাবে ধ্রুব মাত্রিক ভেক্টর পেতে পারে। প্রশিক্ষণ চলাকালীন, একটি পর্বের জন্য একটি নির্দিষ্ট চিত্রের আকার ব্যবহার করে পুরো ডেটাसेट থেকে চিত্রগুলি প্রশিক্ষণ দিন। তারপরে পরবর্তী যুগের জন্য, ভিন্ন চিত্রের আকারে স্যুইচ করুন এবং প্রশিক্ষণ চালিয়ে যান।