আমি এমন পরিবেশে কাজ করি যেখানে গণ্য সংস্থানগুলি ভাগ করা হয়, অর্থাত্ আমাদের কাছে কয়েকটি এনভিডিয়া টাইটান এক্স জিপিইউ সহ কয়েকটি সার্ভার মেশিন রয়েছে।
ছোট থেকে মাঝারি আকারের মডেলগুলির জন্য, টাইটান এক্স-এর 12 গিগাবাইট সাধারণত ২-৩ জনের একই জিপিইউতে একযোগে প্রশিক্ষণ চালানোর জন্য যথেষ্ট। যদি মডেলগুলি এত ছোট হয় যে কোনও একক মডেল জিপিইউর সমস্ত কম্পিউটেশনাল ইউনিটের পুরো সুবিধা গ্রহণ না করে, তবে এটি অন্যটির পরে এক প্রশিক্ষণ প্রক্রিয়া চালনার সাথে তুলনামূলকভাবে গতি অর্জন করতে পারে। এমনকি জিপিইউতে একযোগে অ্যাক্সেস স্বতন্ত্র প্রশিক্ষণের সময়কে ধীর করে দেয় এমন ক্ষেত্রেও একাধিক ব্যবহারকারী একযোগে জিপিইউতে প্রশিক্ষণ দেওয়ার নমনীয়তাটি পেয়ে খুব সুন্দর।
টেনসরফ্লো সমস্যাটি হ'ল, ডিফল্টরূপে, এটি চালু হওয়ার সময় উপলব্ধ জিপিইউ মেমরির পুরো পরিমাণ বরাদ্দ করে। এমনকি একটি ছোট দ্বি-স্তরের নিউরাল নেটওয়ার্কের জন্য, আমি দেখতে পাচ্ছি যে সমস্ত জিপিইউ মেমরির 12 জিবি ব্যবহার করা হয়েছে।
টেনসরফ্লোকে কেবলমাত্র জিপিইউ মেমরির 4 জিবি বরাদ্দ করার কোনও উপায় আছে, যদি কেউ জানেন যে প্রদত্ত মডেলের পক্ষে এটি যথেষ্ট?