আমি একটি জিপিইউর 'ওভারহেড' সম্পর্কে আলোচনা দেখেছি এবং এটি 'ছোট' নেটওয়ার্কগুলির জন্য, কোনও জিপিইউর তুলনায় সিপিইউতে (বা সিপিইউগুলির নেটওয়ার্ক) প্রশিক্ষণ দেওয়া আসলে দ্রুততর হতে পারে।
'ছোট' বলতে কী বোঝায়?
উদাহরণস্বরূপ, 100 লুকানো ইউনিট সহ একটি একক স্তর এমএলপি 'ছোট' হবে?
আমাদের সংক্ষিপ্ত সংজ্ঞাটি কি পুনরাবৃত্ত স্থপতিগুলির জন্য পরিবর্তিত হয়?
সিপিইউ বা জিপিইউতে প্রশিক্ষণ দেবেন কিনা তা সিদ্ধান্ত নেওয়ার সময় কি অন্য কোনও মানদণ্ড বিবেচনা করা উচিত?
সম্পাদনা 1:
আমি সবেমাত্র একটি ব্লগ পোস্ট পেয়েছি (সম্ভবত পুরানো? এটি 2014 সালের):
"... বেশিরভাগ নেটওয়ার্ক কার্ড [গুলি] কেবলমাত্র মেমরির সাথে কাজ করে যা সিপিইউতে নিবন্ধিত এবং সুতরাং দুটি নোডের মধ্যে জিপিইউ থেকে জিপিইউ স্থানান্তর এই রকম হবে: জিপিইউ 1 থেকে সিপিইউ 1 থেকে নেটওয়ার্ক কার্ড 1 থেকে নেটওয়ার্ক কার্ড 2 থেকে সিপিইউ ২ থেকে জিপিইউ ২. এর অর্থ হ'ল, যদি কেউ ধীর নেটওয়ার্ক কার্ড বেছে নেয় তবে একটি কম্পিউটারে কোনও স্পিডআপ নাও থাকতে পারে fast এমনকি দ্রুত নেটওয়ার্ক কার্ডগুলির সাথেও যদি ক্লাস্টারটি বড় হয় তবে তুলনা করার সময় কেউ জিপিইউ থেকে স্পিডআপও পান না সিপিইউগুলিতে যেমন জিপিইউগুলি কেবল কার্ড কার্ডের সাথে চালিয়ে যাওয়ার জন্য খুব দ্রুত কাজ করে।
এই কারণেই গুগল এবং মাইক্রোসফ্টের মতো অনেক বড় সংস্থাগুলি তাদের বড় নিউরাল নেটওয়ার্কগুলি প্রশিক্ষণের জন্য জিপিইউ ক্লাস্টারগুলির চেয়ে সিপিইউ ব্যবহার করছে। "
সুতরাং এক পর্যায়ে, এই পোস্ট অনুসারে, সিপিইউগুলি ব্যবহার করা আরও দ্রুততর হতে পারে। এটা কি এখনও আছে?
সম্পাদনা 2: হ্যাঁ, ব্লগ পোস্টটি খুব ভাল পুরানো হতে পারে কারণ:
এখন মনে হচ্ছে কোনও নোডের মধ্যে জিপিইউগুলি পিসিআই বাসের মাধ্যমে সংযুক্ত রয়েছে, সুতরাং প্রায় 6GiB / s এ যোগাযোগ হতে পারে। (উদাহরণস্বরূপ: https://www.youtube.com/watch?v=el1iSlP1uOs , প্রায় 35 মিনিটের মধ্যে)। স্পিকার সূচিত করে যে এটি জিপিইউ 1 থেকে সিপিইউতে জিপিইউতে যাওয়ার চেয়ে দ্রুত। এর অর্থ হ'ল নেটওয়ার্ক কার্ড আর বাধা নেই।