ব্যাচের আকারকে 2 পাওয়ার রাখার সুবিধা কী?


18

মেশিন লার্নিংয়ের মডেলগুলি প্রশিক্ষণ দেওয়ার সময়, মাঝে মাঝে ব্যাচের আকার 2 এর শক্তিতে রাখাই কেন সুবিধাজনক? আমি ভেবেছিলাম যে আপনার জিপিইউ মেমরি / র‌্যামের মধ্যে সবচেয়ে বড় ফিট এমন একটি আকার ব্যবহার করা ভাল।

এই উত্তরে দাবি করা হয়েছে যে কিছু প্যাকেজের জন্য ব্যাচের আকার হিসাবে 2 এর শক্তি আরও ভাল। কেউ কি এর বিশদ ব্যাখ্যার জন্য বিশদ বিবরণ / লিঙ্ক সরবরাহ করতে পারেন? সমস্ত অপ্টিমাইজেশন অ্যালগরিদম (গ্রেডিয়েন্ট বংশোদ্ভূত, ব্যাকপ্রোপেশন, ইত্যাদি) বা কেবল তাদের মধ্যে কিছুতে এটি সত্য?

উত্তর:


24

এটি জিপিইউর ফিজিকাল প্রসেসরের (পিপি) ভার্চুয়াল প্রসেসরের (ভিপি) প্রান্তিককরণের সমস্যা। যেহেতু পিপি সংখ্যাটি প্রায়শই 2 এর শক্তি হয় তাই 2 টির পাওয়ার থেকে আলাদা আলাদা ভিপি ব্যবহার করা দুর্বল কর্মক্ষমতা বাড়ে।
আপনি আকারের টুকরা একটি গাদা যেমন পিপি সম্মুখের VP -র ম্যাপিং দেখতে পারেন পিপি সংখ্যা
বলুন আপনি 16 পিপি পেয়েছেন।
আপনি তাদের উপর 16 ভিপি ম্যাপ করতে পারেন: 1 পিপিতে 1 ভিপি ম্যাপ করা হয়েছে।
আপনি তাদের উপর 32 ভিপি মানচিত্র করতে পারেন: 16 ভিপি, 1 পিপি 2 টি টুকরা 2 ভিপি'র জন্য দায়বদ্ধ হবে।
ইত্যাদি কার্যকর করার সময়, প্রতিটি পিপি 1 তম ভিপি এর জন্য দায়বদ্ধ, তারপরে ২ য় ভিপি এর কাজ সম্পাদন করবে,
যদি আপনি 17 ভিপি ব্যবহার করেন, তবে প্রতিটি পিপি তাদের 1 তম পিপি এর কাজ সম্পাদন করবে, তারপরে 1 পিপি করবে 17 তম এবং AND এর কাজটি কার্যকর করুনঅন্যগুলি কিছুই করবে না (নীচে সুনির্দিষ্ট)।
এটি জিপিইউ দ্বারা ব্যবহৃত সিমডি দৃষ্টান্তের ( 70 এর দশকে ভেক্টর নামে পরিচিত ) কারণে । একে প্রায়শই ডেটা প্যারালালিজম বলা হয়: সমস্ত পিপি একই সময়ে একই সাথে বিভিন্ন ডেটা করে। Https://en.wikedia.org/wiki/SIMD দেখুন ।
আরও স্পষ্টভাবে উদাহরণস্বরূপ, 17 ভিপি সহ উদাহরণস্বরূপ, একবার 1 ম স্লাইসের কাজ হয়ে গেলে (সমস্ত পিপি তাদের 1 তম ভিপির কাজ করে), সমস্ত পিপি একই কাজ করবে (২ য় ভিপি), তবে কেবলমাত্র একটিতে কিছু আছে ডেটা কাজ করতে
শেখার সাথে কিছু করার নেই। এটি কেবল প্রোগ্রামিং স্টাফ।


ব্যাচ মাপগুলি তখন পিপি সংখ্যার একাধিক হওয়া উচিত তা কি আরও সঠিক বলা যায়? এটি হল, আপনার উদাহরণে আমরা 16x3 = 48 ভিপি থেকে 16 পিপি মানচিত্র করতে পারি?
ওয়েস্ট

হ্যাঁ. ভাল ... আপনি যদি ম্যাপিং ভিপি -> পিপি করেন তবে নিজেই নিশ্চিত হন যে আপনি 100% ঠিক আছেন। আপনি যদি কোনও লাইব্রেরি ব্যবহার করেন, এবং 80 ভিপি চাইতে পারেন। আমি নিশ্চিত নই. আমি বলছি না আপনি ভুল বলেছেন। যদি অনুপাত 2 এর শক্তি হয় তবে আপনি খুব শাস্ত্রীয় এবং সহজ অপ্টিমাইজেশন ব্যবহার করতে পারেন memory যদি কোনও ভিপির উপরের ওপরের প্রতিবেশীদের # টির শক্তি না হয় তবে 5 বলুন, লিবিটি প্রতিবেশীদের স্মৃতিতে সহজেই ক্লাসিকাল ও (লগ_2 (এন)) অ্যাক্সেসগুলি ব্যবহার করতে সক্ষম হবে না।
jcm69

@ জেএমসিএম 69 আপনি লগের জন্য লিঙ্কটি ব্যাখ্যা করতে বা দিতে পারবেন (এন) ভিপি মেমরি অ্যাক্সেসের জন্য অ্যাক্সেসের সময়
অরণ্য সিং

কম্পিউটার সায়েন্সে অবজেক্টগুলি পরিচালনা করার বিষয়ে এটি সাধারণ বিবেচনা consideration আপনি যখন নিশ্চিত হন যে অবজেক্টগুলি 2 টি নিয়মের শক্তি অনুসরণ করে, তখন তারা সহজেই এবং নিরাপদে বাইনারি অনুসন্ধান গাছ, বাইনারি শিফট ইত্যাদির মাধ্যমে পরিচালিত হতে পারে যখন আপনি নিশ্চিত নন, ভাল, আপনাকে কিছু অতিরিক্ত পরীক্ষা এবং আরও জটিল এ্যালগো করতে হবে। যাইহোক, এটি প্রাথমিক প্রশ্ন থেকে কিছুটা দূরে;)
জেএমসি 69

1

সম্পূর্ণ ধারণাটি আপনার মিনি-ব্যাচটি সিপিইউ / জিপিইউতে পুরোপুরি ফিট করে। যেহেতু সমস্ত সিপিইউ / জিপিইউ দু'জনের পাওয়ারের সাথে স্টোরেজ ক্ষমতা নিয়ে আসে, তাই এটি মিনি-ব্যাচের আকারকে দু'জনের পাওয়ার রাখার পরামর্শ দেওয়া হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.