মাইক পাউন্ড কেন তার কম্পিউটারের গণনার দক্ষতা তার গ্রাফিক্স কার্ডগুলি দিয়ে পরিমাপ করে, এবং এর প্রসেসরগুলি নয়?


17

আমি সম্প্রতি পাসওয়ার্ডগুলিতে একটি দুর্দান্ত কম্পিউটারফিলি ভিডিও দেখছিলাম যাতে মাইক পাউন্ড তার সংস্থার সুপার কম্পিউটারের 4 টি গ্রাফিক্স কার্ড (টাইটান এক্স এর সঠিক হতে পারে) এর ব্র্যাগ করে।

সংখ্যার সিমুলেশন উত্সাহী হিসাবে, আমি কেবলমাত্র সিমুলেশন কাজের জন্য ডেস্কটপ তৈরির স্বপ্ন দেখি। মাইক পাউন্ড কেন তার কম্পিউটারের গণনার দক্ষতা তার গ্রাফিক্স কার্ডগুলি এবং এটির প্রসেসরের সাহায্যে পরিমাপ করে না? আমি যদি কম্পিউটার তৈরি করছিলাম তবে আমার কোন আইটেমটির আরও যত্ন নেওয়া উচিত?


11
আমি মনে করি না যে এটি অগত্যা একটি গরিলা বনাম হাঙ্গর প্রশ্ন ... একটি সাধারণ প্রশ্ন আছে: "মাইক পাউন্ড তার গ্রাফিক্স কার্ডগুলি দিয়ে তার কম্পিউটারের গণনার দক্ষতা কেন পরিমাপ করে, এবং এর প্রসেসরগুলি কেন না?" যার উত্তর দেওয়া যায় এবং এর উত্তরের ভবিষ্যতের পাঠকদের জন্য গঠনমূলক মূল্য রয়েছে।
পারে_ ফ্যাক্টর

6
@gnat: এমনকি কাছেও নয়। অবশ্যই, প্রশ্নটি বর্তমান রূপে সত্যই সফটওয়্যার ইঞ্জিনিয়ারিং সম্পর্কিত নয়। তবে আমার ধারণা, এটি সিস্টেমের ইঞ্জিনিয়ারিং সম্পর্কে একটি প্রশ্ন হিসাবে ব্যাখ্যা করা যেতে পারে, যেখানে সিস্টেম = "হার্ডওয়্যার + সফ্টওয়্যার সংমিশ্রণ"।
ডক ব্রাউন

10
4 গ্রাফিক্স কার্ড সহ একটি কম্পিউটার সুপার কম্পিউটারের পরিমাণে হয় না (এবং সেই বিষয়টিতে 10 রাস্পবেরি পিসের একটি ক্লাস্টারও দেয় না)।
ম্যাটি ভির্ককুনেন

10
যে শুধু একটি খুব ব্যয়বহুল পিসি সেটআপ, এর না একটি সুপারকম্পিউটার ...
Bakuriu

3
প্রসঙ্গটি পাসওয়ার্ড ক্র্যাকিং হওয়ায় "মাইক পাউন্ড কেন তার গ্রাফিক্স কার্ডগুলির মাধ্যমে তার কম্পিউটারের গণনার দক্ষতা পরিমাপ করে" এর সহজ উত্তর নয়? আপনার যদি সমস্যা হয় তবে স্থানটি অন্য কিছু, আপনার যা যত্ন নেওয়া উচিত তা সম্পূর্ণ অন্য কিছু হতে পারে।
জিমি জেমস

উত্তর:


32

মাইক পাউন্ড স্পষ্টতই সিপিইউগুলির গণ্যক্ষমতার চেয়ে বেশি গ্রাফিক্স কার্ডগুলির গণনামূলক দক্ষতার মূল্য দেয়।

কেন? একটি গ্রাফিক্স কার্ড মূলত অনেক সরলিকৃত প্রসেসরের সমন্বয়ে গঠিত যা সমস্ত সমান্তরালে চলে। কিছু সিমুলেশন কাজের জন্য, সম্পূর্ণ প্রক্রিয়াকরণের সময় হ্রাস করে গ্রাফিক্স কার্ডগুলিতে পাওয়া হাজার হাজার কোরের সমান্তরালে খুব কমপিউশন সহজেই সমান্তরাল এবং প্রক্রিয়াজাত করা যায়।

আমার কোন আইটেমটি বেশি যত্ন করা উচিত? এটি আপনার যত্ন নেওয়া কাজের চাপ এবং গ্রাফিক্স কার্ডে ব্যবহারের জন্য কীভাবে সেই কাজের চাপ সমান্তরাল করতে পারে / তার উপর নির্ভর করে। যদি আপনার কাজের চাপটি সাধারণ গণনার একটি বিব্রতকরভাবে সমান্তরাল সেট হয় এবং সফ্টওয়্যারটি উপলব্ধ গ্রাফিক্স কার্ডগুলির সুবিধা নিতে লেখা হয়, তবে আরও গ্রাফিক্স কার্ডে আরও বেশি সিপিইউ (ডলারের বিনিময়ে ডলার) এর চেয়ে বেশি পারফরম্যান্স প্রভাব পড়বে।


5
কিছু নম্বর যুক্ত করা হচ্ছে। ধরা যাক আপনার প্রধান কম্পিউটার হাইপারথ্রেডিং সহ একটি এএমডি ইপিক সার্ভার, c৪ টি কোর, ১২৮। আসুন আমরা এটাও বলি যে একটি গ্রাফিক্স কার্ড "কোর" কেবল 10% হিসাবে দ্রুত। ওয়ান টাইটানএক্সের এখনও 3072 চুদা কোর রয়েছে, সেটআপের জন্য মোটামুটি 12000। ধারণা পাবেন? যদি আপনি গ্রাফিক্স কার্ডে সমস্যাটি চালাতে পারেন তবে এটি "দ্রুত" নয় - এটি ঘোড়ার গাড়ীর গতির সাথে সূত্র 1 গাড়ীর সাথে তুলনা করার মতো।
টমটম

3
'সরল গণনার বিব্রতকরভাবে সমান্তরাল সেট' এর জন্য +1, খুব ভাল লেখা। সংক্ষিপ্ত এবং বিন্দু।
মাইকেল ভিক্টর স্টারবার্গ

11
@ টমটম: আসলে আমার পছন্দের তুলনাটি একটি বুলেট ট্রেনের সাথে একটি সূত্র 1 গাড়ি (আপনার সিপিইউ) তুলনা করছে। অবশ্যই, ট্রেন এবং গাড়ি প্রায় একই গতি। তবে ট্রেনটি সূত্র 1 কারের চেয়ে 1000 জনকে এ থেকে বিতে আরও দ্রুত স্থানান্তর করতে পারে।
slebetman

2
@ স্লেবেটম্যান দ্য পয়েন্টটি হ'ল সিপিইউ সাধারণত সিঙ্গল-কোর পারফরম্যান্সে প্রায় দ্রুত (প্রায় একই গতি নয়) is হতে পারে আমরা আপস করতে পারি, এবং একটি সুপারসনিক জেট বিমানটি বাষ্পীয় ইঞ্জিনের সাথে তুলনা করতে পারি।
ড্যারেন রিঞ্জার 13

2
যদি আমাকে যানবাহনের উপর ভিত্তি করে কোনও উপমা বাছাই করতে হয়, আমি বলব সিপিইউ হ'ল ফাইটার জেটের মতো (পয়েন্ট-টু-পয়েন্ট ট্রান্সপোর্টের জন্য এটি অনেক দ্রুত এবং এর চাল অনেকগুলি কৌশল রয়েছে যা অন্যান্য যানবাহন পারে না, তবে কেবল খুব কম লোড বহন করুন) যখন জিপিইউ কার্গো জাহাজের মতো হয় (এটি সমান্তরালভাবে উল্লেখযোগ্যভাবে আরও বেশি বোঝা বহন করতে পারে তবে অনেক ধীরে ধীরে টার্নআরাউন্ডও থাকতে পারে)।
মিথ্যা রায়ান

5

পরীক্ষা করে দেখুন https://developer.nvidia.com/cuda-zone (এবং Google CUDA NVIDIA প্রচুর আরও তথ্যের জন্য)। ডেস্কটপ সুপার কম্পিউটারের জন্য চুদা আর্কিটেকচার এবং হাই-এন্ড গ্রাফিক্স কার্ডগুলি বেশ বিস্তৃতভাবে ব্যবহৃত হয়। অফ শেল্ফ হোয়াইটবক্স উপাদান ব্যবহার করে আপনি সাধারণত একাধিক-টিফ্লপ বক্স একসাথে K 10 কে (ইউএসডি) একসাথে রাখতে পারেন।

তাই ...

সংখ্যার সিমুলেশন উত্সাহী হিসাবে, আমি কেবলমাত্র সিমুলেশন কাজের জন্য ডেস্কটপ তৈরির স্বপ্ন দেখি

... চুদা আপনার শহরের পক্ষে সেরা খেলা অনেক দূরে এবং দূরে। এই ধরণের জিনিসটির সাথে আরও সরাসরি জড়িত হতে পারে /scicomp// বা অন্য স্ট্যাকেক্সচেঞ্জের ওয়েবসাইটে আবার জিজ্ঞাসা করার চেষ্টা করুন ।

(যাইহোক, আমি ধরে নিচ্ছি যে আমরা এই ধারণার সাথে স্বাচ্ছন্দ্য বোধ করছি যে আমরা এখানে প্রচুর পরিমাণে সমান্তরাল প্রোগ্রামিংয়ের কথা বলছি, তাই আপনাকে অ্যালগোরিদম ডিজাইনের জন্য সেই দৃষ্টান্তের সাথে পরিচিত হতে হবে))


এবং আমরা যথারীতি অর্ডোসে ফিরে এসেছি।
মাইকেল ভিক্টর স্টারবার্গ

2
@ মিশেলভিক্টর স্টারবার্গ আমি কি কেবলই একজন যে আর্ডোস রেফারেন্স বুঝতে পারছি না?
মার্নিক্স ক্লাস্টার রিইনস্টেটমোনিকা

আমি আশঙ্কা করছি আপনি ...: /
ইসমাইল মিগুয়েল

4
@ মার্নিক্সক্লুস্টার: আমার গুগল "অর্ডোস" ছিল। নিশ্চিত নয় যে চীনের একটি "ভূত শহর" সুপার কম্পিউটার বা টেলিফ্ল্যাপগুলির সাথে কী করবে।
রবার্ট হার্ভে

পুনঃটুইট করেছেন
jpmc26

2

আমি যদি কম্পিউটার তৈরি করছিলাম তবে আমার কোন আইটেমটির আরও যত্ন নেওয়া উচিত?

ব্যবহারিক দৃষ্টিকোণ থেকে আপনার সম্ভবত জিপিইউর তুলনায় আপগ্রেড করার আপেক্ষিক অসুবিধা দেওয়া মাদারবোর্ড এবং সিপিইউর দিকে সম্ভবত কিছুটা মনোযোগ দেওয়া উচিত। ক্রয়ের পরে আবিষ্কারের জন্য আপনার কাছে চারটি জিপিইউ বা একটি দ্রুত পর্যাপ্ত প্রসেসরের সকলকে ব্যস্ত রাখার জন্য জায়গা নেই তা আবিষ্কার করার এক দুরূহ সময়।

আপনার এও সচেতন হওয়া উচিত যে জিপিইউ পারফরম্যান্স প্রায়শই একক নির্ভুলতা এফএলওপিগুলিতে প্রকাশিত হয় এবং ডাবল নির্ভুলতার জন্য বেশ কিছুটা কমে যায়। আপনার সিমুলেশনগুলিতে অতিরিক্ত নির্ভুলতার প্রয়োজন হলে আপনি বিজ্ঞাপনের গতির নীচে শেষ করতে পারেন।

সফটওয়্যার ইঞ্জিনিয়ারিং রেস বন্ধ

একটি সফ্টওয়্যার দৃষ্টিকোণ থেকে সত্যিই দুটি প্রাথমিক উদ্বেগ রয়েছে, ভন নিউম্যান অটল এবং প্রোগ্রামিং মডেল। সিপিইউতে মূল স্মৃতিতে মোটামুটি ভাল অ্যাক্সেস রয়েছে, জিপিইউতে রয়েছে প্রচুর পরিমাণে দ্রুত মেমোরি অনবোর্ড। এটি অজানা নয় যে GPU এর ভিতরে এবং বাইরে সময় সঞ্চারিত ডেটা কোনও গতির জয়কে পুরোপুরি উপেক্ষা করে। সাধারণভাবে সিপিইউ প্রচুর পরিমাণে ডেটাতে পরিমিত গণনার জন্য বিজয়ী হয়, যখন জিপিইউ অল্প পরিমাণে ভারী গণনার ক্ষেত্রে ছাড়িয়ে যায়। এর সবই আমাদের প্রোগ্রামিং মডেলে নিয়ে আসে।

উচ্চ স্তরে সমস্যাটি হ'ল প্রাচীন এবং সম্মানিত এমআইএমডি / সিমডি বিতর্ক। মাল্টিপল-ইন্সট্রাকশন / মাল্টিপল-ডেটা সিস্টেমগুলি সাধারণ এবং বাণিজ্যিক কম্পিউটারে বড় বিজয়ী হয়েছে। এই মডেলটিতে, যার মধ্যে এসএমপি অন্তর্ভুক্ত রয়েছে, সেখানে একাধিক প্রসেসর প্রত্যেকে তাদের নিজস্ব স্বতন্ত্র নির্দেশের স্ট্রিম প্রয়োগ করে। এটি একটি ফরাসী রান্নাঘরের সমতুল্য কম্পিউটার, যেখানে আপনি তুলনামূলকভাবে জটিল কাজগুলি সম্পন্ন করতে দক্ষ সংখ্যক দক্ষ রান্নাঘরকে নির্দেশনা দেন।

অন্যদিকে সিঙ্গল-ইন্সট্রাকশন / একাধিক ডেটা সিস্টেমগুলি আরও নিবিড়ভাবে মাস্টার কন্ট্রোলারের নির্দেশ অনুসারে তাদের ডেস্কে বেঁধে রাখা ক্লার্কের পূর্ণ একটি বিশাল কক্ষের অনুরূপ। "প্রত্যেকে 3 এবং 5 লাইন এডি করুন!" এটি এর শুদ্ধ আকারে ILLIAC এবং কিছু "মিনি-সুপার" সিস্টেমে ব্যবহৃত হয়েছিল তবে বাজারে হারিয়ে গেছে lost বর্তমান জিপিইউগুলি একটি নিকটতম কাজিন, তারা আরও নমনীয় তবে একই সাধারণ দর্শন ভাগ করে।

সংক্ষেপে সংক্ষেপে:

  • যে কোনও অপারেশনের জন্য সিপিইউ দ্রুততর হবে, যখন জিপিইউ একসাথে অনেকগুলি সম্পাদন করতে পারে। পার্থক্যটি 64৪-বিট ফ্লোটের সাথে সর্বাধিক স্পষ্ট।
  • সিপিইউ কোরগুলি যে কোনও মেমরি ঠিকানার উপর পরিচালনা করতে পারে, জিপিইউর জন্য ডেটা অবশ্যই একটি ছোট অঞ্চলে প্যাক করা উচিত। আপনি কেবলমাত্র জিতবেন যদি আপনি স্থানান্তর সময়টি অফসেট করার জন্য পর্যাপ্ত গণনা করেন।
  • শর্তসাপেক্ষে ভারী কোডটি সিপিইউতে সাধারণত সুখী হয়।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.