সুপারকম্পিউটিংয়ে যোগাযোগ ওভারহেড


10

আমি নির্ভরযোগ্য রেফারেন্সের সন্ধান করছি যা জানিয়েছে যে প্রকৃত টাস্ক-সম্পর্কিত কাজ সম্পাদন করতে বনাম সুপার কম্পিউটারগুলি সমন্বয় করতে কত সংস্থান করে। সংস্থানগুলি প্রক্রিয়াকরণ শক্তি উপলব্ধ হতে পারে তবে ওয়াটসও একটি বৈধ ইউনিটের মতো মনে হয়।

আমি বিশ্বাস করি আমার এক অধ্যাপক বা পাঠ্য পুস্তক একবার বলেছিল যে ব্যাপকভাবে সমান্তরাল সিস্টেমে উপলব্ধ প্রসেসিং পাওয়ারের অর্ধেক পর্যন্ত টাস্ক এবং বার্তা পাসের সমন্বয় করতে ব্যয় করা হয়। দুর্ভাগ্যক্রমে, আমি এই অনুপাত সম্পর্কে এই রেফারেন্স বা অন্য কোনও উপাদান খুঁজে পাচ্ছি না।

আমি বুঝতে পারি যে সুপার কম্পিউটার আর্কিটেকচারের উপর নির্ভর করে এটি অনেকটা পৃথক হবে এবং আধুনিক বাস্তবায়ন সম্ভবত এই ক্ষেত্রে আরও দক্ষ, তাই একাধিক আর্কিটেকচার বা বিবর্তন (এই ডেডিকেটেড মেসেজ পাসওয়ার্ড হার্ডওয়্যারের আগে এবং পরে) জুড়ে এই মেট্রিকের একটি সংক্ষিপ্ত বিবরণ আরও ভাল হবে।


2
আপনি উপযুক্ত কম্পিউটার, অ্যালগরিদম এবং বাস্তবায়ন চয়ন করে আপনার যে কোনও নম্বর সহজেই পেতে পারেন।
ডেভিড কেচসন

উত্তর:


10

উচ্চ পারফরম্যান্স কম্পিউটিংয়ে একটি দীর্ঘ স্থায়ী প্রিয় বেনমার্ক হ'ল এইচপিএলিনপ্যাক বেঞ্চমার্ক, যা খুব বড়, ঘন, রৈখিক সমীকরণের সমাধান করার সময় প্রতি সেকেন্ডে ভাসমান পয়েন্ট অপারেশনগুলিতে কম্পিউটার সিস্টেমের গতি পরিমাপ করে। ধারণা করা হয় সমাধানটি নেয়2/3n3+2n2স্লোটিং পয়েন্ট অপারেশন এবং পরীক্ষককে সর্বাধিক কর্মক্ষমতা অর্জনের জন্য পরিবর্তিত হতে দেওয়া হয় । n

মাপদণ্ডের ব্যবস্থাগুলিতে আরপিইএকে (এই সিস্টেমের জন্য প্রতি সেকেন্ডে ফ্লোটিং পয়েন্ট অপারেশনগুলির তাত্ত্বিক সর্বাধিক সংখ্যক) এবং আরএমএএক্স (এইচপিএলপিনপ্যাক বেঞ্চমার্কে প্রতি সেকেন্ডের সর্বাধিক অর্জিত সংখ্যা) অন্তর্ভুক্ত রয়েছে)

আরপিইএকের পক্ষে আরএমএএক্সের যথেষ্ট পরিমাণে ভগ্নাংশ হওয়া সাধারণ, এটি নির্দেশ করে যে এই বেঞ্চমার্ক টাস্কে, বর্তমান সুপার কম্পিউটারগুলি তাদের তাত্ত্বিক শিখর পারফরম্যান্সের একটি উল্লেখযোগ্য ভগ্নাংশ অর্জন করতে পারে। উদাহরণস্বরূপ, নভেম্বর 2015 শীর্ষ 500 সুপার কম্পিউটার র্যাঙ্কিংয়ে, দ্রুততম মেশিন টিয়ানহে -2 এর কাছে আরপিইএসি = 54.902 পেটাফ্লপস এবং আরএমএএক্স = 33.863 পেটল্লফ রয়েছে।

তবে এইচপিএলপিনপ্যাক বেঞ্চমার্ককে বর্তমান কাজের চাপের প্রতিনিধি হিসাবে দেখা হচ্ছে না widely এইচপ্লিনপ্যাকের ফলাফলগুলি সাধারণত একটি বড় ফ্যাক্টর দ্বারা প্রকৃত অ্যাপ্লিকেশনগুলিতে সুপার কম্পিউটারগুলির কর্মক্ষমতাকে বাড়িয়ে তোলে।

এইচপিসিজি নামে একটি নতুন বেঞ্চমার্কটি চলছে under এই মানদণ্ডে বিচ্ছিন্ন পিডিই থেকে উদ্ভূত সমীকরণের বৃহত স্পার সিস্টেমগুলির সমাধানের জন্য সাধারণত পুনরাবৃত্ত পদ্ধতিতে সঞ্চালিত ক্রিয়াকলাপগুলি জড়িত। এই কাজের চাপ উচ্চ পারফরম্যান্স কম্পিউটারের জন্য অনেক বেশি চ্যালেঞ্জিং। এটি ব্যবহারের জন্য সুপার কম্পিউটারগুলি কী ব্যবহার করা হয় তার আরও অনেক বেশি প্রতিনিধি।

এইচপিসিজি থেকে কিছু প্রাথমিক ফলাফল আরপিইএকের 5% এরও কম সময়ে আসছে। উদাহরণস্বরূপ, তিয়ানহে -২ এর 0.5 টি পেটফ্লুপে আরপিইএসি = 54.902 পেটফ্লপস এবং এইচপিসিজি রয়েছে (এইচপিসিজিতে উপস্থাপনার নীচে রেফারেন্স দেখুন))

TOP500 HPLinpack মানদণ্ডটি এখানে পাওয়া যাবে:

http://www.top500.org/

এইচপিসিজি সম্পর্কিত একটি উপস্থাপনা এখানে পাওয়া যাবে:

http://www.hpcg-benchmark.org/downloads/isc15/HPCG-ISC15-FINAL-SLIDES_update1.pdf

এইচপিসিজির ওয়েবসাইট রয়েছে

http://www.hpcg-benchmark.org/


1
আমি কৌতূহল ছিল যেখানে 2/3n3+2n2ফ্লপ স্পেক থেকে এসেছে এবং এটি সন্ধান করতে হবে। কৌতূহলী অন্য কারও জন্য, এটি আংশিক পাইভোটিংয়ের সাথে এলইউ পচানোর জন্য অপারেশন গণনা, যেমন একটি ঘন সিস্টেম সমাধানের জন্য একটি পদ্ধতি।
অরেলিয়াস

3
এটি প্রশ্নের উত্তর দেবে বলে মনে হচ্ছে না, কারণ এটি বার্তা প্রেরণ সম্পর্কে কিছুই বলে না।
ডেভিড কেচসন

এটি আংশিকভাবে এই প্রশ্নের উত্তর দেয় যে এই মানদণ্ডগুলি আপনাকে বোঝায় যে ভাসমান পয়েন্ট ইউনিটগুলি কীভাবে দক্ষতার সাথে ব্যবহৃত হচ্ছে-আপনি সমস্ত কিছুর জন্য কতটা সময় ব্যয় করা হচ্ছে তা খুঁজে পেতে আপনি একজনের কাছ থেকে বিয়োগ করতে পারেন, যার মধ্যে অন্যান্য বিষয়ের মধ্যে বার্তা প্রেরণও অন্তর্ভুক্ত রয়েছে।
ব্রায়ান বোর্চারস 23:25

6

সৎ উত্তরটি আমরা জানি না। উত্তরটি আসলে কী চলছে এবং ব্যবহারকারী কী কোড লিখেছেন তার উপর নির্ভর করে depends ব্রায়ান বোর্চারস যেমন উল্লেখ করেছেন, দুটি বেঞ্চমার্কের মধ্যে একটি বড় পার্থক্য রয়েছে যেখানে আমাদের কাছে সমস্ত কোড রয়েছে এবং সম্ভবত সেই কোডটি কী করছে তা জানেন তবে এই কম্পিউটারটি সুপার কম্পিউটারের ব্যবহারকারীরা আসলে কী করছেন সে সম্পর্কে এই প্রতিনিধি কতটা প্রতিনিধি তা নিয়ে অনেক মতভেদ রয়েছে। বাস্তব উত্স কোড বিশ্লেষণ এবং বাস্তব মেশিনে বাস্তব কোডগুলির কিছু ভারী উপকরণ ছাড়া, এই অনুপাতটি খুঁজে পাওয়া অসম্ভব। কিছু প্রকল্প রয়েছে যা ডেটা সংগ্রহ করতে শুরু করেছে যা এই প্রশ্নের উত্তর দেওয়ার জন্য সম্প্রদায়কে পেতে সক্ষম হতে পারে তবে এটি নিষ্পত্তি হয় না settled

আসলে, প্রশ্নটি আসলেও পরিষ্কার নয়। যদি কোনও ক্লাস্টার নোডের যোগাযোগ কার্ডে এমন একটি প্রসেসর থাকে যা কেবল যোগাযোগের জন্য ব্যবহার করা যায়, আপনি এই সময়টিকে কীভাবে ব্যয় করেন যে এই কার্ডটি যোগাযোগ পরিচালনা করতে না পারায় অলস ব্যয় করে (অন্য কিছু নয়)? অর্থাৎ, "উপলব্ধ প্রক্রিয়াকরণ শক্তি" হিসাবে গণনা করা কী? আমরা কী খারাপভাবে লিখিত প্রোগ্রামগুলি গণনা করি যা অপটিমাইজড গণনা এবং যোগাযোগের রুটিনগুলি অপটিমাইজড হিসাবে একই হয়? যদি কেউ তাদের কোডে একটি পরিচিত অ্যান্টি-প্যাটার্ন ব্যবহার করে যা ইচ্ছাকৃতভাবে সিপিইউ-এর আন্ডার-ব্যবহার করে? বিব্রতকরভাবে সমান্তরাল প্রোগ্রামগুলি সম্পর্কে কী বলা যায় যা মোটেই যোগাযোগ করে না (এগুলি সুপার কম্পিউটারগুলিতে চালিত হয়, আমি আপনাকে প্রতিশ্রুতি দিই)?

আমি কোনও বইয়ে বা আপনার অধ্যাপকের কাছ থেকে অফ-দ্য-কফ মন্তব্যটি প্রমাণ করার চেষ্টা করতে আপনার সময় নষ্ট করব না। এই ধরণের বিবৃতি আমাদের মনে করিয়ে দেওয়ার জন্য রয়েছে যে সমান্তরাল প্রোগ্রামিং কঠোর এবং সাধারণত খারাপভাবে করা হয়। সুপার কম্পিউটারগুলি সমস্ত বর্জ্য অপসারণ বা অপ্টিমাইজ করার জন্য নিখুঁতভাবে ডিজাইন করা হয়নি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.