আমাদের জিপিপিইউ থাকলে সিমডি কেন ব্যবহার করবেন?


13

আমি ভেবেছিলাম স্ট্যাক এক্সচেঞ্জের সিএস অংশে এই প্রশ্নটি আরও ভালভাবে পরিবেশন করা হয়েছে। এখন যেহেতু আমাদের কাছে সিডিডিএ এবং ওপেনসিএল এর মতো জিপিপিইউ রয়েছে, মাল্টিমিডিয়া সিমডি এক্সটেনশানগুলি (এসএসই / অ্যাভিএক্স / নিওন) এখনও কি কোনও উদ্দেশ্য কার্যকর করে?

আমি কীভাবে এসএসই নির্দেশাবলী বাছাইয়ের নেটওয়ার্কগুলিকে ত্বরান্বিত করতে ব্যবহার করতে পারি সে সম্পর্কে সম্প্রতি একটি নিবন্ধ পড়েছি। আমি ভেবেছিলাম এটি বেশ ঝরঝরে ছিল কিন্তু যখন আমি আমার কমপ প্রচ্ছদ অধ্যাপককে বললাম সে হেসে বলল এবং জিপিইউতে অনুরূপ কোড চালানো সিমডি সংস্করণটিকে নষ্ট করে দেবে। আমি এটি সন্দেহ করি না কারণ এসএসই খুব সহজ এবং জিপিইউগুলি অনেক বেশি সমান্তরালতা সহ বৃহত উচ্চ-জটিল ত্বরণকারী, তবে এটি আমাকে ভাবতে পেরেছিল, জিপিইউ ব্যবহারের চেয়ে মাল্টিমিডিয়া সিমডি এক্সটেনশনগুলি আরও কার্যকর এমন অনেক পরিস্থিতিতে আছে কি?

জিপিজিপিইউগুলি যদি সিমডি রিডানডেন্ট করে তোলে, কেন ইনটেল তাদের সিমডি সমর্থন বাড়িয়ে তুলবে? এসএসই 128 বিট ছিল, এখন এটি অ্যাভিএক্স সহ 256 বিট এবং পরের বছর এটি 512 বিট হবে। জিপিজিপিউগুলি যদি ডেটা প্যারালালিজমের সাথে আরও ভাল প্রসেসিং কোড হয় তবে কেন ইন্টেল এই সিমডি এক্সটেনশানগুলিকে চাপ দিচ্ছে? তারা সমমানের সংস্থানগুলি (গবেষণা এবং অঞ্চল) একটি বৃহত্তর ক্যাশে এবং শাখার ভবিষ্যদ্বাণীতে এইভাবে সিরিয়াল কর্মক্ষমতা উন্নত করতে সক্ষম হতে পারে।

জিপিপিইউগুলির পরিবর্তে সিমডি কেন ব্যবহার করবেন?


2
ব্যস্ত রাখার জন্য পর্যাপ্ত তথ্য সহ জিপিইউ খাওয়ানো নিজের পক্ষে চ্যালেঞ্জ। হোস্ট এবং ডিভাইসের মধ্যে ডেটা স্থানান্তর কার্যত সবসময় বাধা। নির্দিষ্ট ক্রিয়াকলাপগুলি সিপিইউগুলিতে আরও ভাল সমর্থিত (যেমন বহন-মুক্ত গুণ; পিসিএলএমএলকিউকিউ দেখুন)।
জুহো

2
@ জুহো এএমডির এপিইউগুলির মতো নতুন ডিভাইসগুলিতে জিপিইউ এবং সিপিইউ একই রকম মারা যায় না? এটি কি বাধাটিকে দূর করে?
জোনফরাজেন

1
যখন সমস্ত বলা হয় এবং হয়ে যায়, তখন কোনও ভেক্টর নির্দেশাবলী এখনও একটি একক নির্দেশনা এবং এটি নির্ধারণ এবং সম্পাদনের জন্য ব্যয় অন্য যে কোনও একক নির্দেশের মতোই। সুবিধাগুলি ব্যয়কে ছাড়িয়ে গেলে কেবলমাত্র জিপিইউতে চাকরি চালানো বুদ্ধিমান। এছাড়াও বিবেচনা করুন যে আপনি কোর প্রতি এক সিমড ইউনিট পাবেন তবে সাধারণত চেসিস প্রতি মাত্র একটি জিপিইউ, এবং জিপিইউ এই মুহুর্তে একটি ভাগ করা সংস্থান। এটি আপনি একটি জিপিইউতে চালাতে পারেন এমন কাজের সংখ্যা সীমাবদ্ধ করে। (কোরগুলির সংখ্যা সর্বদা বাড়ছে, তবে জিপিইউগুলির সংখ্যা নেই))
ছদ্মনাম

ইন্টেল জিপিইউগুলির ক্ষেত্রে খুব বেশি কিছু করে না (লারাবী / নাইটস ল্যান্ডিং :) বাদে) তবে আমি অনুমান করি যে তাদের পরিবর্তে এভিএক্স ঠেকানোর চেষ্টা করা তাদের পক্ষে স্বাভাবিক। যদিও ভারী এভিএক্স ব্যবহার খুব পারফরম্যান্সযুক্ত হতে পারে তবে এটি এখন তাদের নতুন সিপিইউগুলিতে ডাউনক্লকিংয়ের ফলস্বরূপ, তাই তারা কোনও কিছুর সাথে সীমাবদ্ধতা মারছে।
nsandersen

উত্তর:


16

কিছুই বিনামূল্যে। জিপিজিইউগুলি সিমডি হয় । জিপিজিইউগুলিতে সিমডি নির্দেশাবলী সিপিইউগুলিতে সিমডি নির্দেশিকার চেয়ে বিস্তৃত থাকে to জিপিজিইউগুলিতে সূক্ষ্ম-দানাযুক্ত মাল্টি-থ্রেডযুক্ত হয়ে থাকে (এবং সিপিইউগুলির তুলনায় আরও অনেক হার্ডওয়্যার প্রসঙ্গ রয়েছে)। জিপিপিইউগুলি স্ট্রিমিংয়ের জন্য অনুকূলিত হয়েছে । তারা ভাসমান পয়েন্ট ইউনিটগুলিতে ক্ষেত্রের একটি বৃহত্তর শতাংশ, ক্যাশে অঞ্চলের একটি কম শতাংশ এবং পূর্ণসংখ্যার পারফরম্যান্সের ক্ষেত্রে ক্ষেত্রের একটি কম শতাংশকে উত্সর্গ করে।

একটি তুলনা করা যাক। ইন্টেলের কোর i7-5960x 8 কোর আছে, 4-চওড়া সঙ্গে প্রতিটি (ডবল স্পষ্টতা) SIMD, 3; GHz (3.5GHz Turbo), একটি 20M L3 ক্যাশে, চিহ্নিত, চলমান হ্রাস 356mm ^ 2 এবং 140W এবং খরচ $ 1000 সুতরাং 8 * 4 * 3 * 4 = 384 ডাবল নির্ভুলতা GFlops। (অতিরিক্ত 4x হ'ল কারণ আপনি প্রতি চক্র প্রতি ভেক্টর লেনটিতে দুটি ফিউজড-মাল্টিপল-অ্যাড করতে পারেন)) এটি 768 একক নির্ভুলতা জিএফলপস করতে পারে। এটি প্রায় 1.08 ডিপি জিএফলপস / মিমি ^ 2 এবং 2.75 ডিপি জিএফলপস / ওয়াট। অন-চিপ ক্যাশে প্রায় 57.5 কেবি / মিমি ^ 2 রয়েছে।

এনভিডিয়া এর জিফোরস জিটিএক্স টাইটান ব্ল্যাকের 15 টি এসএমএক্স রয়েছে, যার প্রতিটি 32-প্রশস্ত ডাবল নির্ভুলতা সিমডি রয়েছে, 890MHz (980MHz টার্বো) এ চলছে, 3.51 L1 + L2 ক্যাশে, 561 মিমি ^ 2, 250W খরচ করে এবং ব্যয় $ 1000। তাই 15 * 32 * .89 * 4 = 1709 ডাবল নির্ভুলতা জিএফলপস। (চক্র প্রতি ভেক্টর লেনের জন্য দুটি ফিউজড-গুণিত-যোগ থেকে একই 4x।) এটি 5126 একক নির্ভুলতা GFlops করতে পারে। এটি প্রায় 3.05 ডিপি জিএফলপস / মিমি ^ 2 এবং 6.8 ডিপি জিএফলপস / ওয়াট। সুতরাং 3x ইউনিট ক্ষেত্রের প্রতি ডিপি ফ্লোটিং পয়েন্ট ঘনত্ব এবং 3x ডিপি ফ্লোটিং পয়েন্ট শক্তি দক্ষতা। আর ট্রেড অফ? অন-চিপ ক্যাশে 6.4 কেবি / মিমি ^ 2। সিপিইউ থেকে প্রায় 9x কম ঘন।

সুতরাং মূল পার্থক্যটি হ'ল জিপিইউ এমন একটি অঞ্চল ভারসাম্য বেছে নিয়েছে যা ক্যাশে ওপরে ভাসমান পয়েন্ট (এবং বিশেষত একক নির্ভুলতা ভাসমান পয়েন্ট) এর পক্ষে জোরালোভাবে সমর্থন করে। এমনকি আইপি / ও করার জন্য আপনার সিপিইউ এবং জিপিইউর মধ্যে পিছনে জিনিসগুলি অনুলিপি করা প্রয়োজন তা এড়িয়ে যাওয়া, সিপিইউর তুলনায় জিপিইউ কতটা ভাল করতে চলেছে আপনি যে প্রোগ্রামটি চালাচ্ছেন তার উপর নির্ভর করে।

আপনার যদি খুব কম নিয়ন্ত্রণ ডাইভারজেন্সের সাথে ডেটা সমান্তরাল ফ্লোটিং পয়েন্ট প্রোগ্রাম থাকে (সমস্ত ভেক্টর লেনগুলি একই সময়ে একই কাজ করে থাকে) এবং আপনার প্রোগ্রামটি স্ট্রিমিং করছে (ক্যাশে করে কোনও উপকার করতে পারে না), তবে জিপিইউ প্রায় হতে চলেছে প্রতি ইউনিট ক্ষেত্রের বা প্রতি ওয়াটে আরও বেশি দক্ষ। তবে আপনার যদি ডাইভারজেন্ট নিয়ন্ত্রণের কোনও উল্লেখযোগ্য পরিমাণ থাকে, অ-ডেটা-সমান্তরাল কাজ করতে হয়, বা বড় বেশি পঠন-বহুবারের ডেটা স্ট্রাকচার থেকে উপকৃত হতে পারে তবে সিপিইউ সম্ভবত আরও ভাল করবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.