ভাল প্রশ্ন, বা একটি আকর্ষণীয় উত্তর কমপক্ষে একটি। এই উত্তরের অংশটি এমন এক বিশ্বকে চিত্র দেয় যেখানে সিপিইউগুলি একাধিক পৃথক কোরের পরিবর্তে প্রস্থে দক্ষতার সাথে স্কেল করতে পারে । লাইসেন্সিং / দামের মডেল আলাদা হবে!
বাকিরা কেন তারা পারছে না তা ব্যাখ্যা করে। সারাংশ:
- একাধিক কোরের ব্যয় লিনিয়ারির কাছাকাছি স্কেল
- 1 কোর এর সুপারসক্যালার পাইপলাইন আইশের প্রশস্তকরণের ব্যয় ~ চতুর্থাংশ এটি যাইহোক এক পর্যায়ে পর্যাপ্ত পরিমাণে শক্তি প্রয়োগের দ্বারা কার্যকর। ইন্টারেক্টিভ ব্যবহারের জন্য একক থ্রেডেড পারফরম্যান্স খুব গুরুত্বপূর্ণ (শেষ থেকে শেষের দিকে বিলম্বের বিষয়গুলি কেবল থ্রুপুট নয়), সুতরাং বর্তমান বিগ-কোর উচ্চ-শেষ সিপিইউগুলি সেই মূল্য দেয়। উদাহরণস্বরূপ স্কাইলেক (4-প্রশস্ত), রাইজেন (5 বা 6-প্রশস্ত) এবং অ্যাপলের এ 12 (বড় কোরগুলির জন্য 7-প্রশস্ত, ক্ষুদ্র শক্তি দক্ষ কোরগুলির জন্য 3-প্রশস্ত)
- গুরুতর কমা আইপিসি শুধু পাইপলাইন প্রসার থেকে আয় পরলোক 3 বা 4 ব্যাপী, এমনকি আউট-অফ-অর্ডার এক্সিকিউশন সঙ্গে এটি ILP । শাখা মিস এবং ক্যাশে মিস করা শক্ত, এবং এখনও পুরো পাইপলাইন স্টল করে।
আপনি ফ্রিকোয়েন্সি উল্লেখ করেন নি, কেবল আইপিসি, তবে স্কেলিং ফ্রিকোয়েন্সি খুব শক্ত। উচ্চ ফ্রিকোয়েন্সি উচ্চতর ভোল্টেজের প্রয়োজন, তাই ফ্রিকোয়েন্সি ঘনক্ষেত্র সহ পাওয়ার স্কেল : ^1
সরাসরি ফ্রিকোয়েন্সি ^2
থেকে এবং ভোল্টেজ থেকে। (ক্যাপাসিটার ভি ^ 2 সহ স্ট্রোকড এনার্জি স্কেলগুলি, এবং ফুটো বর্তমানের বাইরে গতিশীল শক্তির বেশিরভাগই এফইটি গেটস + তারের ক্যাপাসিটিভ লোডগুলিতে পাম্পিং চার্জ থেকে হয়))
পারফরম্যান্স = ফ্রিকোয়েন্সি বার আইপিসি। (একই আর্কিটেকচারের মধ্যে। বৃহত্তর সিমডি আপনাকে কম নির্দেশাবলীর সাহায্যে একই কাজটি করতে দেয় এবং কিছু আইএসএ অন্যদের চেয়ে স্বল্প, যেমন এমআইপিএস প্রায়শই x86 বা আআরচ 64 এর চেয়ে একই কাজটি করার জন্য আরও নির্দেশনা নেয়))
ব্যয়গুলি ডাই-এরিয়া (উত্পাদন খরচ) এবং / অথবা পাওয়ারে থাকে (যা পরোক্ষভাবে ফ্রিকোয়েন্সি সীমাবদ্ধ করে কারণ শীতলকরণ শক্ত)। এছাড়াও, ওয়াট প্রতি কম শক্তি এবং কর্মক্ষমতা নিজের মধ্যে একটি লক্ষ্য, বিশেষত মোবাইল (ব্যাটারি) এবং সার্ভারের জন্য (পাওয়ার ঘনত্ব / শীতলকরণের খরচ / বিদ্যুতের ব্যয়)।
প্রতি সকেট প্রতি মাল্টি-কোর একটি জিনিস হওয়ার আগে, আপনার উচ্চ-ব্যবহারের ক্ষেত্রে মাল্টি-সকেট সিস্টেম ছিল যেখানে আপনি তৈরি হতে পারে এমন একক সিপিইউ অর্জনের চেয়ে বেশি থ্রুপুট চেয়েছিলেন, সুতরাং সেগুলি কেবলমাত্র এসএমপি সিস্টেম ছিল। (সার্ভারস, উচ্চ-শেষ ওয়ার্কস্টেশন)।
যদি কোনও একক কোর আপনার ইচ্ছানুসারে দক্ষতার সাথে স্কেল করতে পারে তবে তাদেরকে একাধিক লজিক্যাল কোর হিসাবে কাজ করার জন্য আমাদের সকেট প্রতি 1 টি শারীরিক কোর এবং এসএমটি (যেমন হাইপারথ্রেডিং) সহ সিস্টেমগুলি থাকতে হবে । টিপিকাল ডেস্কটপ / ল্যাপটপের মধ্যে কেবল ১ টি শারীরিক কোর থাকে এবং আমরা এমন জিনিসগুলিকে সমান্তরাল করে তুলতে সংগ্রাম করব না যা আরও বেশি কোর দিয়ে রৈখিকভাবে স্কেল করে না। যেমন make -j4
মাল্টি-সকেট সার্ভারগুলির সুবিধা গ্রহণ করা, এবং / অথবা কোনও ডেস্কটপে আই / ও ল্যাটেন্সিকে আড়াল করা। (অথবা পাইপলাইনের প্রস্থটি যদি সহজেই স্কেল করা হয় তবে আইপিসি না করে আমরা এখনও অনেকগুলি সমান্তরাল করার চেষ্টা করব) সুতরাং আমাদের আরও এসএমটি থ্রেড ব্যবহার করতে হবে) সিপিইউ না থাকলে আপনার ওএস কার্নেলটি এখনও সমস্ত লজিক্যাল কোর জুড়ে চলতে হবে unless ওএসের কাছে এসএমটি উপস্থাপন করা খুব আলাদা ছিল, সুতরাং সমান্তরাল শিডিয়ুলিং অ্যালগরিদম এবং লকিং এখনও সেখানে প্রয়োজন হবে।
ডোনাল্ড নুথ ২০০৮ সালের একটি সাক্ষাত্কারে বলেছিলেন
আমি মাল্টিকোর আর্কিটেকচারের বর্তমান প্রবণতার সাথে আমার ব্যক্তিগত অসন্তুষ্টি সম্পর্কে কিছুটা শিখতে পারি। আমার কাছে এটি কমবেশি দেখে মনে হচ্ছে যে হার্ডওয়্যার ডিজাইনারদের ধারণা শেষ হয়ে গেছে, এবং তারা ভবিষ্যতে মুরের আইনের মৃত্যুর জন্য সফ্টওয়্যার লেখকদের কাছে দোষ চাপিয়ে দেওয়ার চেষ্টা করছেন যা কেবলমাত্র কয়েকটিতে দ্রুত কাজ করে এমন মেশিন আমাদের দিয়ে দিয়েছে us মূল মাপদণ্ড!
হ্যাঁ, আমরা যদি সত্যিকারের প্রোগ্রামগুলিতে 8x থ্রুপুট সহ অলৌকিক একক কোর সিপিইউগুলি পেতে পারি তবে আমরা সম্ভবত এখনও সেগুলি ব্যবহার করতাম। দ্বৈত সকেট সিস্টেমগুলির সাথে কেবল তখনই বেশি থ্রুপুট (একক থ্রেডেড পারফরম্যান্স নয়) এর জন্য অনেক বেশি মূল্য দেওয়া হয়।
একাধিক সিপিইউগুলি একাধিক প্রোগ্রাম চলাকালীন প্রসঙ্গ-স্যুইচ ব্যয় হ্রাস করে (তাদের মধ্যে দ্রুত স্যুইচিংয়ের পরিবর্তে সত্যিকারভাবে সমান্তরালে চালিয়ে দেয়); প্রি-ইম্পিটিভ মাল্টিটাস্কিংয়ের বিস্তৃত বিশাল আউট-অফ-অর্ডার মেশিনারি যেমন একটি সিপিইউ সম্ভবত এটি এখনকার চেয়ে আরও বেশি ক্ষতি করতে পারে।
শারীরিকভাবে এটি সিঙ্গেল কোর হবে (কোরগুলির মধ্যে আন্তঃসংযোগবিহীন একটি সাধারণ ক্যাশে শ্রেণিবিন্যাসের জন্য) তবে এসএমটি সমর্থন করবে (উদাহরণস্বরূপ ইন্টেলের হাইপারথ্রেডিং) যাতে সফ্টওয়্যার এটিকে 8 লজিকাল কোর হিসাবে ব্যবহার করতে পারে যা গতিশীলভাবে থ্রুপুট সংস্থার জন্য প্রতিযোগিতা করে। বা যখন কেবল 1 টি থ্রেড চলমান / স্থগিত নয়, তখন এটি সম্পূর্ণ সুবিধা পাবে।
সুতরাং আপনি যখন একাধিক থ্রেড ব্যবহার করবেন যখন এটি আসলে সহজ / প্রাকৃতিক ছিল (উদাহরণস্বরূপ পৃথক প্রক্রিয়াগুলি একবারে চলমান), বা নির্ভরশীলতা শৃঙ্খলাগুলির সাথে সহজেই সমান্তরাল সমস্যার জন্য যা এই জানোয়ারের আইপিসি সর্বাধিক প্রতিরোধ করতে পারে।
তবে দুর্ভাগ্যক্রমে নুথের পক্ষ থেকে এটি ইচ্ছুক চিন্তাভাবনা যে মাল্টি-কোর সিপিইউগুলি এই মুহুর্তে কোনও জিনিস হওয়া বন্ধ করবে।
একক থ্রেড কর্মক্ষমতা স্কেলিং
আমি মনে করি যদি তারা একটি 8 টি সিপিইউর 1 কোর সমতুল্য তৈরি করে, তবে একটি কোরের আইপিসিতে 800% বৃদ্ধি হবে যাতে আপনি একাধিক কোরগুলির জন্য অনুকূলিত হন না কেবল সমস্ত প্রোগ্রামগুলিতে সম্পূর্ণ পারফরম্যান্স পাবেন।
হ্যা, এটা সত্য. যদি এ জাতীয় সিপিইউ আদৌ তৈরি করা সম্ভব হয় তবে এটি খুব আশ্চর্য হবে। কিন্তু আমি মনে করি এটা আক্ষরিক একই অর্ধপরিবাহী উত্পাদন প্রক্রিয়া উপর অসম্ভব (ট্রানজিস্টর অর্থাৎ একই মানের / দক্ষতা)। আপনি 8-কোর সিপিইউ হিসাবে একই পাওয়ার বাজেট এবং ডাই এরিয়া দিয়ে অবশ্যই সম্ভব নয়, যদিও আপনি যুক্তি দিয়ে একসাথে আঠালো কোরগুলি সংরক্ষণ করতে চান, এবং প্রতি-কোর ব্যক্তিগত ক্যাশেগুলির জন্য তত জায়গার প্রয়োজন হবে না।
এমনকি যদি আপনি ফ্রিকোয়েন্সি বাড়ার অনুমতি দেন (যেহেতু আসল মাপদণ্ড প্রতি সেকেন্ডে কাজ করা হয়, প্রতি ঘড়ি প্রতি কাজ হয় না), এমনকি 2x দ্রুত সিপিইউ তৈরি করা একটি বিশাল চ্যালেঞ্জ হতে পারে।
যদি এই জাতীয় সিপিইউ তৈরির জন্য একই বিদ্যুত এবং ডাই-এরিয়া বাজেটের (সুতরাং উত্পাদন ব্যয়) কাছাকাছি যে কোনও জায়গায় এটি সম্ভব হত , হ্যাঁ সিপিইউ বিক্রেতারা ইতিমধ্যে তাদের সেভাবে তৈরি করবে।
বিশেষত আরও কোর বা আরও বৃহত্তর কোর? এই উত্তরটি বুঝতে প্রয়োজনীয় পটভূমির জন্য বিভাগ; এটি অর্ডার পাইপলাইন করা সিপিইউগুলি কীভাবে কাজ করে, তারপরে সুপারশালার (ঘড়ি প্রতি একাধিক নির্দেশাবলী) দিয়ে সহজ হয়। তারপরে ব্যাখ্যা করা হয় যে আমরা কীভাবে বিদ্যুতের দেয়ালটিকে পি 4 যুগের চারদিকে আঘাত করলাম, সহজেই ফ্রিকোয়েন্সি স্কেলিংয়ের সমাপ্তি ঘটিয়েছি, বেশিরভাগ মাত্র আইপিসি রেখেছি এবং নির্দেশ অনুসারে আরও কাজ করা হয়েছে (যেমন সিমডি) এমনকি সামান্য ট্রানজিস্টর দিয়েও with
পাইপলাইনকে আরও প্রশস্ত করা (প্রতি ঘড়ি প্রতি সর্বাধিক নির্দেশাবলী) প্রস্থ-বর্গক্ষেত্র হিসাবে সাধারণত ব্যয়ের স্কেল । বিস্তৃত সমান্তরাল নির্ভরতা পরীক্ষা (বিপদ সনাক্তকরণ), এবং চালানোর জন্য প্রস্তুত নির্দেশাবলীর সন্ধানের জন্য আরও বিস্তৃত অর্ডার শিডিয়ুলারের জন্য, এই খরচটি ডাই এরিয়া এবং / বা পাওয়ার হিসাবে পরিমাপ করা হয়। এবং আপনার রেজিস্টার ফাইলে আরও পঠন / লেখার পোর্ট এবং ক্যাশে আপনি অন্য নির্দেশাবলী চালাতে চাইলে ক্যাশে nop
। বিশেষত যদি আপনার কাছে 3 টি ইনপুট নির্দেশ থাকে যেমন এফএমএ বা অ্যাড-উইথ ক্যারি (2 রেজিস্টার + পতাকা)।
সিপিইউগুলিকে আরও বিস্তৃত করার জন্য আইপিসি রিটার্নও হ্রাস পাচ্ছে ; বেশিরভাগ কাজের চাপে সিপিইউগুলি শোষণের জন্য ছোট-স্কেল / স্বল্প-পরিসরের আইএলপি (নির্দেশনা-স্তর সমান্তরালতা) সীমাবদ্ধ রয়েছে, সুতরাং আইপিসি যদি ইতিমধ্যে প্রস্থের প্রস্থের চেয়ে কম সীমাবদ্ধ থাকে তবে মূল প্রশস্ত করা আইপিসি বাড়ায় না (প্রতি ঘড়ি প্রতি নির্দেশ) নির্ভরতা শৃঙ্খলা, শাখা মিস, ক্যাশে মিস বা অন্যান্য স্টল দ্বারা মূল। নিশ্চিত যে আপনি স্বাধীন পুনরাবৃত্তির সাথে কিছু অনিয়ন্ত্রিত লুপগুলিতে গতি অর্জন করতে পারেন তবে বেশিরভাগ কোড তার বেশিরভাগ সময় ব্যয় করে না। "টিপিকাল" কোড, আইআইআরসি-তে নির্দেশনা মিশ্রণের 20% অংশের তুলনা / শাখার নির্দেশাবলী রয়েছে। (আমি মনে করি আমি বিভিন্ন ডেটা সেটগুলির জন্য 15 থেকে 25% পর্যন্ত সংখ্যাগুলি পড়েছি))
এছাড়াও, একটি ক্যাশে মিস যা সমস্ত নির্ভরশীল নির্দেশাবলীর স্টল করে (এবং তারপরে আরওবির সক্ষমতা একবারে পৌঁছে যায়) এর বিস্তৃত সিপিইউয়ের জন্য বেশি খরচ হয়। (আরও কার্যকরকরণ ইউনিটকে অলস রেখে যাওয়ার সুযোগ ব্যয়; আরও বেশি সম্ভাব্য কাজ শেষ হচ্ছে না)) বা একইভাবে কোনও শাখা মিস করার কারণে বুদবুদ হয়ে যায়।
আইপিসি 8x পেতে, আমাদের শাখা-পূর্বাভাসের সঠিকতা এবং ক্যাশে হিট রেটে কমপক্ষে 8x এর উন্নতি প্রয়োজন । তবে ক্যাশে হিট রেট বেশিরভাগ কাজের চাপের জন্য একটি নির্দিষ্ট পয়েন্ট পেরিয়ে ক্যাশে সক্ষমতার সাথে ভাল স্কেল করে না। এবং এইচডাব্লু প্রিফেচিং স্মার্ট, তবে সেই স্মার্ট হতে পারে না । এবং 8x আইপিসিতে, শাখার ভবিষ্যদ্বাণীকারীদের আরও যথাযথ হওয়ার পাশাপাশি চক্র অনুসারে 8x হিসাবে বেশি পূর্বাভাস তৈরি করতে হবে।
ক্রম ছাড়াই সিপিইউগুলি তৈরির জন্য বর্তমান কৌশলগুলি কেবল স্বল্প পরিসরে আইএলপি খুঁজে পেতে পারে । উদাহরণস্বরূপ, স্কাইলেকের আরওবি আকারটি 224 টি ফিউজড-ডোমেন উফস, অ-এক্সিকিউটেড উফসের শিডিয়ুলার 97 টি অবরুদ্ধ-ডোমেন। দেখুন , দুটি দীর্ঘ নির্ভরতা শেকল দিয়ে একটি লুপ উপর lfence প্রভাব বোঝা লেন্থ বৃদ্ধির একটি মামলা যেখানে নির্ধারণকারী আকার নির্দেশাবলীর 2 দীর্ঘ চেইন থেকে ILP আহরণের মধ্যে সীমিত ফ্যাক্টর, যদি তারা পান খুব দীর্ঘ। এবং / অথবা এটি আরও সাধারণ এবং প্রারম্ভিক উত্তর দেখুন )।
সুতরাং দুটি পৃথক দীর্ঘ লুপের মধ্যে আইএলপি সন্ধান করা আমরা হার্ডওয়ারের সাহায্যে করতে পারি না। লুপ ফিউশনের জন্য গতিশীল বাইনারি-পুনঃসংশোধন কিছু ক্ষেত্রে সম্ভব হতে পারে, তবে ট্রান্সমেটা ক্রুসো পথে না যাওয়া সত্ত্বেও হার্ড এবং সিপিইউ কিছু করতে পারে না। (x86 ইমুলেশন স্তরটি একটি পৃথক অভ্যন্তরীণ আইএসএর শীর্ষে; সেক্ষেত্রে ভিএলআইডাব্লু)। তবে ইউওপ ক্যাশে এবং শক্তিশালী ডিকোডার সহ স্ট্যান্ডার্ড আধুনিক x86 ডিজাইন বেশিরভাগ কোডের জন্য বীট করা সহজ নয়।
এবং x86 এর বাইরে, এখনও ব্যবহৃত সমস্ত আইএসএগুলি ডিকোড করা অপেক্ষাকৃত সহজ, সুতরাং দূরত্বের অপ্টিমাইজেশান ছাড়া গতিশীল-পুনঃসংশোধনের জন্য কোনও প্রেরণা নেই। টিএল: ডিআর: হার্ডওয়ারে আরও আইএলপি প্রকাশ করতে পারে এমন ম্যাজিক সংকলকগুলির জন্য আশা করা ইটানিয়াম আইএ -৪৪ এর জন্য কার্যকর হয়নি , এবং কার্যকর করার একটি সিরিয়াল মডেল সহ কোনও বিদ্যমান আইএসএর জন্য একটি সুপার-ওয়াইড সিপিইউয়ের পক্ষে কাজ করার সম্ভাবনা নেই।
যদি আপনার কাছে একটি সুপার-ওয়াইড সিপিইউ থাকে তবে আপনি অবশ্যই এটি চাইবেন যে এটি এসএমটি সমর্থন করবে যাতে আপনি একাধিক লো-আইএলপি থ্রেড চালিয়ে কাজটি চালিয়ে যেতে পারেন।
যেহেতু স্কাইলেক বর্তমানে 4 টি উওপ প্রশস্ত (এবং প্রতি ঘড়িতে 2 থেকে 3 উওসের একটি সত্যিকারের আইপিসি অর্জন করে বা হাই-থ্রুপুট কোডে 4 এর কাছাকাছিও) তাই একটি অনুমান 8x প্রশস্ত সিপিইউ 32-প্রশস্ত হবে!
8 বা 16 লজিক্যাল সিপিইউগুলিতে সেইগুলি কার্যকর করার জন্য যেগুলি কার্যকরভাবে ভাগ করে নেবে তা ফিরিয়ে আনতে সক্ষম হওয়া দুর্দান্ত হবে: অবিচলিত থ্রেডগুলি সমস্ত ফ্রন্ট-এন্ড ব্যান্ডউইথ এবং ব্যাক-এন্ড থ্রুপুট পায়।
তবে 8 টি পৃথক কোরের সাহায্যে, যখন কোনও থ্রেড স্টলে স্টিকিউট ইউনিটগুলিকে খাওয়ানোর জন্য আর কিছুই থাকে না; অন্যান্য থ্রেড উপকার হয় না।
সম্পাদন প্রায়শই ফেটে যায়: এটি ক্যাশে মিস লোডের জন্য অপেক্ষা করে স্টল দেয়, তারপরে একবার সমান্তরালে অনেক নির্দেশাবলী উপস্থিত হলে ফলাফলটি ব্যবহার করতে পারে। একটি সুপার-ওয়াইড সিপিইউ দিয়ে, এটি ফেটে দ্রুত যেতে পারে, এবং এটি আসলে এসএমটি সাহায্য করতে পারে।
তবে আমাদের কাছে জাদুকরী সুপার-ওয়াইড সিপিইউ থাকতে পারে না
সুতরাং থ্রুপুট অর্জনের জন্য আমাদের পরিবর্তে থ্রেড-স্তরের সমান্তরালতার আকারে হার্ডওয়্যারে সমান্তরালতাটি প্রকাশ করতে হবে । সাধারণত বড় সংখ্যক লুপের মতো সহজ ক্ষেত্রে ছাড়া থ্রেডগুলি কখন / কীভাবে ব্যবহার করতে হয় তা জানার ক্ষেত্রে সাধারণত সংকলকগুলি দুর্দান্ত নয়। (ওপেনএমপি, বা জিসিসি -ftree-parallelize-loops
)। সমান্তরালভাবে কার্যকরভাবে কার্যকরীভাবে কার্য সম্পাদন করতে কোডটি পুনরায় রচনা করতে এখনও মানুষের চতুরতা লাগে, কারণ আন্ত-থ্রেড যোগাযোগ ব্যয়বহুল, এবং থ্রেড স্টার্টআপও।
টিএলপি হ'ল মোটা দানাযুক্ত সমান্তরালতা, কার্যকর করার একক থ্রেডের মধ্যে সূক্ষ্ম-দানাযুক্ত আইএলপির বিপরীতে যা এইচডাব্লু শোষণ করতে পারে।
ইন্টারেক্টিভ ওয়ার্কলোডগুলি (ইন্টেল / এএমডি এক্স 86, এবং অ্যাপল / এআরএম এআরচ 64 উচ্চ-শেষ কোরগুলি) লক্ষ্য করে সিপিইউগুলি অবশ্যই আইপিসি স্কেলিংয়ের হ্রাসকারী রিটার্নগুলিতে ধাক্কা দেয়, কারণ একক থ্রেডেড পারফরম্যান্স এখনও বিলুপ্তির বিষয়টি যখন এতটা মূল্যবান তবে কেবলমাত্র থ্রুটপুট জন্য নয় ব্যাপকভাবে সমান্তরাল সমস্যা।
প্রতিটি গেমের 8 টি অনুলিপি সমানতালে 15fps এ চালাতে সক্ষম হওয়া 45fps এ একটি অনুলিপি চালানোর চেয়ে অনেক কম মূল্যবান। সিপিইউ বিক্রেতারা এটি জানেন এবং এজন্যই আধুনিক সিপিইউগুলি আউট-অফ-অর্ডার এক্সিকিউশন ব্যবহার করে যদিও এর জন্য উল্লেখযোগ্য শক্তি এবং ডাই-এরিয়া ব্যয় হয়। (তবে জিপিইউগুলি তাদের কাজের চাপ ইতিমধ্যে ব্যাপকভাবে সমান্তরাল হওয়ার কারণে নয়)।
ইন্টেলের বহু-কোর জিয়ন ফাই হার্ডওয়্যার (নাইটস ল্যান্ডিং / নাইটস মিল) একটি আকর্ষণীয় অর্ধ-পথ বিন্দু: খুব সীমিত আউট-অফ-অর্ডার এক্সিকিউশন এবং এসএমটি 2 টি প্রশস্ত কোরগুলিকে সংখ্যার ক্র্যাঙ্কের জন্য AVX512 সিমডি নির্দেশাবলী দিয়ে খাওয়ানো। কোরগুলি ইন্টেলের লো-পাওয়ার সিলভারমন্ট আর্কিটেকচারের ভিত্তিতে তৈরি। (আউট-অফ-অর্ডার এক্সিকিউট তবে একটি ছোট রেন্ডারিং উইন্ডো রয়েছে, বড়-কোর স্যান্ডিব্রিজ পরিবারের চেয়ে অনেক ছোট smaller এবং একটি সঙ্কুচিত পাইপলাইন))
বিটিডাব্লু, এই সমস্তই সিমডের কাছে অর্থগোনাল। প্রতি নির্দেশ অনুসারে আরও কাজ করা সর্বদা সহায়তা করে, যদি এটি আপনার সমস্যার পক্ষে সম্ভব হয়।
দামের মডেল
সফ্টওয়্যার মূল্যের মডেলগুলি হার্ডওয়ারের বর্তমান ল্যান্ডস্কেপে পূর্বাভাস দেওয়া হয়েছে।
পার-কোর লাইসেন্সিং মডেলগুলি বহু-কোর সিপিইউগুলির আবির্ভাবের সাথে আরও ব্যাপক (এবং এমনকি একক-সকেট ডেস্কটপগুলির সাথেও প্রাসঙ্গিক) হয়ে উঠেছে। তার আগে, এটি কেবল সার্ভার এবং বড় ওয়ার্কস্টেশনের জন্য প্রাসঙ্গিক ছিল।
শীর্ষ গতিতে চালানোর জন্য যদি সফ্টওয়্যারটির একাধিক কোরের প্রয়োজন না হয়, তবে সত্যিকার অর্থে লোকেদের পক্ষে এটি সস্তা বিক্রির কোনও উপায় নেই যারা এটার থেকে খুব বেশি সুবিধা পাচ্ছেন না কারণ তারা এটি একটি দুর্বল সিপিইউতে চালায়। সফ্টওয়্যার / হার্ডওয়্যার ইকোসিস্টেমটি "এসএমটি চ্যানেলগুলি" -এর নিয়ন্ত্রণগুলি বিকশিত হয়েছে যা আপনাকে সেই লজিক্যাল কোরটিতে চলমান কোডের জন্য সর্বাধিক প্রয়োগের প্রস্থকে কনফিগার করতে দেয়। (আবার এমন এক বিশ্ব কল্পনা করা যেখানে সিপিইউগুলি একাধিক পৃথক পৃথক কোরের পরিবর্তে পাইপলাইনের প্রস্থে স্কেল করে))