আমার কম্পিউটার সক্ষম এফএলওপগুলির পরিমাণ কীভাবে নির্ধারণ করবে


15

আমি আমার কম্পিউটারটি যে এফএলওপি (ফ্লোটিং পয়েন্ট অপারেশনস) করতে পারি তার তাত্ত্বিক সংখ্যা নির্ধারণ করতে চাই। কেউ কি আমাকে এই সাহায্য করতে পারেন? (আমি কেবল কিছু কম্পিউটারের সাথে আমার কম্পিউটারের মধ্যে পার্থক্য সম্পর্কে ধারণা পেতে তুলনা করতে চাই)

উত্তর:


9

তাত্ত্বিক শিখর ফ্লপ / সেকেন্ড দেওয়া হয়: কোরের সংখ্যা সহজ। তাত্ত্বিকভাবে গড় ফ্রিকোয়েন্সিটি টার্বো বুস্ট (ইন্টেল) বা টার্বো কোর (এএমডি) এর কিছু পরিমাণে ফ্যাক্টর হওয়া উচিত, তবে অপারেটিং ফ্রিকোয়েন্সিটি একটি ভাল নিম্ন সীমাবদ্ধ। চক্র প্রতি ক্রিয়াকলাপগুলি আর্কিটেকচার-নির্ভর এবং এটি সন্ধান করা কঠিন (স্যান্ডি ব্রিজ এবং আইভিব্রিজের জন্য 8, স্লাইড 26 দেখুন ) এটি এই স্ট্যাক ওভারফ্লো প্রশ্নটির বিষয় , এতে আধুনিক আর্কিটেকচারগুলির একগুচ্ছ সংখ্যা রয়েছে।

কোর সংখ্যা*গড় ফ্রিকোয়েন্সি*চক্র প্রতি অপারেশন

1
ঠিক আছে, আমার কাছে 2 টি কোর, অপারেটিং ফ্রিকোয়েন্সি: 1.8 গিগাহার্টজ, ইনটেল টার্বো বুস্ট প্রযুক্তি: ৩.০০ গিগাহার্টজ, আমি প্রতি চক্রটি অপারেশনগুলি খুঁজে পাচ্ছি না, এখানে ওয়েবসাইটটি রয়েছে: আরক.ইন.টেল.কম / প্রোডাক্টস / 4৫৪60০/২ ধন্যবাদ
ওল 'নির্ভরযোগ্য

হাসওয়েল 16 ডিপি / চক্র করতে পারে। আমি মাত্র একটি এসও উত্তরের উত্তর বডিটিতে একটি লিঙ্ক যুক্ত করেছি।
ম্যাক্স হাচিনসন

এর অর্থ কি আমার কম্পিউটার এটি করতে পারে: 2 x 3,000,000,000 Hz x 16 = 96 Giga FLOPs?
ওল 'নির্ভরযোগ্য

এর অর্থ এটি প্রকৃত গড় ফ্রিকোয়েন্সি অনুসারে 2 * 1.8 গিগাহার্জ * 16 ডিপি = 57.6 জিএফএলওপি / গুলি এবং 96 জিএফএলওপি / গুলি এর মধ্যে করতে পারে। আপনার যদি কোনও একক সংখ্যা ব্যবহার করার প্রয়োজন হয় তবে 57.6 হ'ল আইএমও fair
ম্যাক্স হাচিনসন

2
এফএলওপি হারগুলি সাধারণত একটি প্রসেসরের 'ধার্মিকতা' এর একটি দুর্বল পরিমাপ। উদাহরণস্বরূপ scicomp.stackexchange.com/questions/114/… দেখুন । আপনি আপনার টাস্কের সীমাবদ্ধ ব্যয়গুলি সম্পর্কে উদ্বিগ্ন হতে পারেন (উদাহরণস্বরূপ কম্পিউট বাউন্ড বনাম মেমরি বাউন্ড বনাম ডিস্ক বাউন্ড) এবং প্রাসঙ্গিক হার্ডওয়্যার (গণনা সিস্টেম, মেমরি সিস্টেম, I / O) উপর ফোকাস করুন।
সর্বাধিক হাচিনসন

4

আপনার মেশিনে সিপিইউগুলির মডেল এবং বিক্রেতাকে আপনার জানতে হবে। আপনার কাছে এটি হয়ে গেলে আপনি বিক্রেতার ওয়েবসাইটে (বা সম্ভবত উইকিপিডিয়ায়) ঘড়ির হার, চিপ / সকেটের সংখ্যা, চিপ প্রতি করের সংখ্যা, চক্র প্রতি ভাসমান পয়েন্ট অপারেশনগুলির সংখ্যা এবং সেই ক্রিয়াকলাপের ভেক্টরের প্রস্থের সন্ধান করতে পারেন । তারপরে, আপনি কেবল গুন করেন।

উদাহরণস্বরূপ, ইনটেল জিওন ই 5-2680 "স্যান্ডি ব্রিজ" প্রসেসরগুলি এতে প্রবেশ করুন স্ট্যাম্পেডে আমি যেখানে কাজ করি সেখানে । চশমা হ'ল:

  • 2.7GHz
  • 2 চিপ / নোড, 8 কোর / চিপ
  • 2 ভেক্টর নির্দেশাবলী / চক্র
  • 256-বিট প্রশস্ত AVX নির্দেশাবলী (4 একযোগে ডাবল-নির্ভুলতা অপারেশন)

এগুলির গুণমান 345.6 জিএফ / নোড বা 2.2 পিএফ দেয় সিস্টেমের অ-গতিযুক্ত অংশের জন্য।

আমরা সাধারণত ডাবল-স্পষ্টতা (-৪-বিট) অপারেশনগুলির ক্ষেত্রে বিবেচনা করি কারণ এটি আমাদের ব্যবহারকারীদের বিশাল সংখ্যাগরিষ্ঠের জন্য প্রয়োজনীয় যথার্থতা তবে আপনি যদি চান তবে আপনি একক-নির্ভুলতার ক্ষেত্রে গণনাটি আবারও করতে পারেন। এটি সাধারণত শেষ ফ্যাক্টরটি পরিবর্তন করে, 4 ডিপি ফ্লপ / ইনস্ট্যান্টের পরিবর্তে 8 এসপি ফ্লপ / নির্দেশনা বলুন তবে এটি এর থেকে বুনোভাবে আলাদা হতে পারে। পুরানো জিপিইউগুলি উদাহরণস্বরূপ, এসপি-র হারের প্রায় 1/8 তম ডিপি কেবলমাত্র ছিল। যদি আপনি কখনও আপনার সিস্টেমের জন্য একটি নম্বর উদ্ধৃত করেন তবে আপনার স্পষ্ট হওয়া উচিত যা আপনি এটি ব্যবহার করেছেন যদি এটি দ্বিগুন-নির্ভুলতা না হয় কারণ লোকেরা ধরে নেবে, অন্যথায়।

এছাড়াও, যদি আপনার চিপটি ফিউজড মাল্টিপল-অ্যাড (এফএমএ) নির্দেশাবলী সমর্থন করে এবং এটি সেগুলি সম্পূর্ণ হারে করতে পারে তবে বেশিরভাগ লোক এটিকে 2 ভাসমান-পয়েন্ট অপারেশন হিসাবে গণ্য করে যদিও একটি হার্ডওয়্যার পারফরম্যান্স কাউন্টার এটিকে কেবল একটি নির্দেশ হিসাবে গণনা করতে পারে।

অবশেষে, আপনি আপনার সিস্টেমে (জিপিইউ বা শিওন ফি এর মতো) যে কোনও ত্বকের জন্যও এটি করতে পারেন এবং তাত্ত্বিক মোট পাওয়ার জন্য সিপিইউ কার্য সম্পাদনে সেই কার্য সম্পাদন যুক্ত করতে পারেন।


সিপিইউ মডেলটি জানা যথেষ্ট নয়, আসল অপারেটিং ফ্রিকোয়েন্সিগুলি সন্ধান করা দরকার
আকাকাল

@ আকসাকাল, একটি তাত্ত্বিক বিশ্লেষণের জন্য, নামমাত্র ফ্রিকোয়েন্সি বেছে নেওয়া সম্ভবত ঠিক। আপনার চিপগুলি আসলে কী ফ্রিকোয়েন্সি চলবে তা জানা শক্ত, কারণ এটি কাজের চাপ এবং আপনার শীতাতপনিয়ন্ত্রণের মানের উপর নির্ভর করে।
বিল বার্থ

2

আমি বুঝতে পারি যে আপনি তাত্ত্বিক মান চেয়েছিলেন, তবে এটি যে কোনও রিয়েল কোড এমনকি প্রায় লাইনপ্যাক দ্বারা প্রায় অ্যাক্সেসযোগ্য তাই আপনি খুব বড় ম্যাট্রিকের জন্য কেবল ডিজিএমএম চালাতে (অপ্টিমাইজড) করতে চাইতে পারেন। যে কারণে আমি এই পদ্ধতির পছন্দ করি তা হ'ল এটি নির্দিষ্ট প্রসেসরের কিছু ত্রুটিগুলি প্রকাশ করে যা তাদের তাত্ত্বিক শিখরের ফ্লপ মান অর্জন করতে বাধা দেয়।

উদাহরণস্বরূপ, এনভিআইডিআইএ জিপিইউ বর্তমানে একই পাইপলাইনে পূর্ণসংখ্যা এবং ভাসমান-পয়েন্ট অপারেশন করে। এর অর্থ হ'ল আপনি যদি কোনও পূর্ণসংখ্যার গণনা না করেন তবে আপনি কেবল তাত্ত্বিক শিখর ফ্লপ / গুলি অর্জন করতে পারেন । অ্যারে ইনডেক্সিং এবং ডেটা অ্যাক্সেসের অন্য কোনও ফর্মের জন্য কোথাও কোনও পূর্ণসংখ্যার গাণিতিক প্রয়োজন, কোনও কোড কোনও এনভিআইডিএ জিপিইউতে তাত্ত্বিক শিখর ফ্লপ / গুলি অর্জন করতে পারে না। বেশিরভাগ ক্ষেত্রে, কেউ bound 80% উপরের সীমা হিসাবে দেখে। সিপিইউগুলির জন্য যা একই সাথে পূর্ণসংখ্যার এবং ভাসমান-পয়েন্ট অপারেশন জারি করে, এটি একটি নন-ইস্যু।

কিছু জিপিইউ-এর মতো মাল্টিকোর প্রসেসরের মতো ইন্টেল নাইটস কর্নার এবং ব্লু জিন / কিউতে অনুরূপ পাইপলাইন ইস্যুগুলির জন্য traditionalতিহ্যবাহী সিপিইউগুলির তুলনায় পিক ফ্লপ / গুলি অর্জন করা শক্ত (যদিও উভয়ই কমপক্ষে বৃহত ডিজিএমএম-তে ~ 90% শিখর অর্জন করতে পারে) )।


কেন কোনও কোড একটি এনভিআইডিআইএ জিপিইউতে তাত্ত্বিক শিখর ফ্লপ / গুলি অর্জন করতে পারে না?
স্কাইটি ট্রি

অনুচ্ছেদ 2 দেখুন, তবে এগুলি সমস্ত পুরানো স্থাপত্যগুলির সাথে প্রাসঙ্গিক ছিল। আরও সাম্প্রতিক এনভিআইডিএ আর্কিটেকচার একযোগে পূর্ণসংখ্যার এবং ভাসমান-পয়েন্টটি কার্যকর করতে পারে এবং> বৃহত ডিজিএমএমে 90% শিখর অর্জন করতে পারে।
জেফ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.