এটি বেশ কয়েকটি কারণে ব্যবহৃত হয়, মূলত এটি একসাথে একাধিক নেটওয়ার্কে যোগদান করতে ব্যবহৃত হয়। আপনার যেখানে দুটি ধরণের ইনপুট থাকে তার উদাহরণ হ'ল উদাহরণস্বরূপ ট্যাগ এবং একটি চিত্র। আপনি একটি নেটওয়ার্ক তৈরি করতে পারেন যা উদাহরণস্বরূপ রয়েছে:
চিত্র -> কনভ -> সর্বাধিক পুলিং -> কনভ -> সর্বাধিক পুলিং -> ঘন
TAG -> এম্বেডিং -> ঘন স্তর
এই নেটওয়ার্কগুলিকে একটি পূর্বাভাসের সাথে একত্রিত করতে এবং তাদের একসাথে প্রশিক্ষণের জন্য আপনি চূড়ান্ত শ্রেণিবিন্যাসের আগে এই ঘন স্তরগুলি মার্জ করতে পারেন could
আপনার একাধিক ইনপুট রয়েছে এমন নেটওয়ার্কগুলি সেগুলির সর্বাধিক 'স্পষ্ট' ব্যবহার, এখানে একটি চিত্র যা কোনও আরএনএন-এর অভ্যন্তরে চিত্রগুলির সাথে শব্দের সংমিশ্রণ করে, মাল্টিমোডাল অংশটি যেখানে দুটি ইনপুট একত্রিত হয়:
অন্য একটি উদাহরণ হ'ল গুগলের ইনসেপশন লেয়ার যেখানে আপনার বিভিন্ন কনভলিউশন রয়েছে যা পরের স্তরটিতে যাওয়ার আগে একসাথে যুক্ত হয়েছিল।
কেরাসে একাধিক ইনপুট খাওয়ানোর জন্য আপনি অ্যারেগুলির একটি তালিকা পাস করতে পারেন। শব্দ / চিত্রের উদাহরণে আপনার দুটি তালিকা থাকবে:
x_input_image = [image1, image2, image3]
x_input_word = ['Feline', 'Dog', 'TV']
y_output = [1, 0, 0]
তারপরে আপনি নিম্নলিখিত হিসাবে ফিট করতে পারেন:
model.fit(x=[x_input_image, x_input_word], y=y_output]