বলুন আমার কাছে কিছু গভীর শেখার মডেল আর্কিটেকচার রয়েছে, পাশাপাশি একটি নির্বাচিত মিনি-ব্যাচের আকার রয়েছে। এই মডেলটির প্রশিক্ষণের জন্য আমি কীভাবে এই প্রত্যাশিত মেমরির প্রয়োজনীয়তাগুলি থেকে উত্সর্গ করতে পারি?
উদাহরণস্বরূপ, মাত্রা 1000 এর ইনপুট সহ একটি (অ-পুনরাবৃত্ত) মডেলটি বিবেচনা করুন, মাত্রা 100 এর 4 টি সম্পূর্ণরূপে সংযুক্ত লুকানো স্তর এবং 10 মাত্রার একটি অতিরিক্ত আউটপুট স্তর The মিনি ব্যাচের আকারটি 256 উদাহরণ। কীভাবে একজন সিপিইউ এবং জিপিইউতে প্রশিক্ষণ প্রক্রিয়ার আনুমানিক মেমরি (র্যাম) পদচিহ্ন নির্ধারণ করে? যদি এটি কোনও পার্থক্য করে, ধরে নেওয়া যাক মডেলটি টেনসরফ্লো (এইভাবে cuDNN ব্যবহার করে) এর সাথে একটি জিপিইউতে প্রশিক্ষিত।