আমি চিত্র সনাক্তকরণের জন্য একটি কনভোলশন নেটওয়ার্কে কাজ করছি এবং আমি ভাবছিলাম যে আমি বিভিন্ন আকারের চিত্রগুলি ইনপুট করতে পারি কিনা (যদিও এর চেয়ে আলাদা নয়)।
এই প্রকল্পে: https://github.com/harvardnlp/im2markup
তারা বলে:
and group images of similar sizes to facilitate batching
প্রিপ্রোসেসিংয়ের পরেও, চিত্রগুলি এখনও বিভিন্ন আকারের, যা সূত্রের কিছু অংশ কাটাবে না বলে তা বোঝায়।
বিভিন্ন মাপ ব্যবহার করতে কোন সমস্যা আছে? যদি সেখানে থাকে তবে আমার কীভাবে এই সমস্যার সাথে যোগাযোগ করা উচিত (যেহেতু সূত্রগুলি সমস্ত একই চিত্রের আকারে ফিট করে না)?
যে কোনও ইনপুট অনেক প্রশংসা করা হবে