সিপিইউ কীভাবে প্রতি চক্রে একাধিক নির্দেশ প্রদান করতে পারে?


41

প্রতি সেকেন্ড পৃষ্ঠায় উইকিপিডিয়া এর নির্দেশাবলী বলে যে একটি i7 3630QM 3.2 গিগাহার্টজ ফ্রিকোয়েন্সিতে 110,000 ডলার এমআইপিএস সরবরাহ করে; এটি হবে (110 / 3.2 নির্দেশাবলী) / 4 কোর = core 8.6 প্রতি প্রতি চক্র প্রতি নির্দেশাবলী ?! কীভাবে একটি একক কোর প্রতিটি চক্রের জন্য একাধিক নির্দেশ প্রদান করতে পারে?

আমার বোঝার জন্য একটি পাইপলাইন কেবল প্রতি ঘন্টার জন্য একটি ফলাফল সরবরাহ করতে সক্ষম হওয়া উচিত।

এগুলি আমার ধারণা:

  • অভ্যন্তরীণ ফ্রিকোয়েন্সিটি আসলে ৩.২ গিগাহার্টজ থেকে বেশি is
  • সিপিইউর কিছু অংশ এমনভাবে অ্যাসিঙ্ক্রোনাস যা আমার মতো নম্র মানুষ বুঝতে পারে না
  • কোর প্রতি একাধিক সমবর্তী পাইপলাইন আছে
  • একটি পাইপলাইন প্রতি ঘণ্টায় ফলাফলের চেয়ে বেশি সরবরাহ করতে পারে, কোনও নির্দেশ পাইপলাইন ধাপগুলি এড়িয়ে যেতে পারে এবং একাধিক উপস্থাপক রাখার জন্য রয়েছে
  • আমি কিছু মিস করছি

1
এটি 110,000 ধ্রিস্টোন এমআইপিএস সরবরাহ করে, তাই ডিএমইপস, এমআইপিএস নয়, এমন কিছু যা আমি সরাসরি দেখি - সম্ভবত এটি কোনও পার্থক্য করতে পারে? দেখুন en.wikipedia.org/wiki/Dhrystone

উত্তর:


44

প্রথমত, যেমন Keelan এর মন্তব্য এবং টার্বো জে এর উত্তর বিন্দু আউট পরিমাপ 113.093 ছিল Dhrystone MIPS না নেটিভ MIPS।

আই 7 ব্রিজ মাইক্রোআরকিটেকচার i7 3630QM কেবল চক্র প্রতি 4 টি ফিউজড ওপস প্রতিশ্রুতিবদ্ধ করতে পারে, যদিও এটি চক্র প্রতি 6 µops কার্যকর করা শুরু করতে পারে। (কোডের সন্ধানে ফিউশড ওপসের সংখ্যা প্রায় নির্দেশাবলীর সংখ্যার সমান; কিছু জটিল নির্দেশাবলীর একাধিক intoopsে ডিকোড করা হয় যা নিখরচায় নয় এবং কিছু জোড় নির্দেশাবলিকে একটি একক শীর্ষে মিশ্রিত করা যায়, যেমন, তাত্ক্ষণিক তুলনা করুন শর্তসাপূর্ণ লাফের পরে।)

একক চক্রে একাধিক নির্দেশনা কার্যকর করা যায় সে সম্পর্কে আপনার দুটি অনুমান যথেষ্ট বৈধ এবং প্রকৃত প্রসেসরগুলিতে ব্যবহৃত হয়েছে। আপনার প্রথম অনুমান, একটি দ্রুত অভ্যন্তরীণ ঘড়ি ব্যবহৃত হয়, মূল পেন্টিয়াম 4 এর "ফায়ারবল" ALUs এ ব্যবহৃত হয়েছিল। এই ALU গুলি বাকী মূলের দ্বিগুণ ফ্রিকোয়েন্সিতে আটকে ছিল যা ইতিমধ্যে তুলনামূলকভাবে বেশি।

(এটি একটি স্তম্ভিত ALU ব্যবহার করে সম্পন্ন হয়েছিল যেখানে একটি যোগক্রমে নিম্নের অর্ধেকটি একটি চক্রের মধ্যে সম্পন্ন করা হয়েছিল, একটি নির্ভরশীল অপারেশনটিকে পরবর্তী চক্রের ফলাফলের নীচের অর্ধেকটি ব্যবহার করার অনুমতি দেয় add অ্যাড, এক্সওর বা বাম শিফটের মতো ক্রিয়াকলাপের জন্য ফলাফলের সম্পূর্ণ নীচের অর্ধেক উত্পাদন করতে কেবল অপারেশনগুলির নীচের অর্ধেক অংশ প্রয়োজন, এ জাতীয় স্তম্ভিত - প্রস্থ-পাইপলাইনিং নামেও পরিচিত single একক চক্রের ফলাফলের বিলম্বের পাশাপাশি একক চক্রের মধ্য দিয়ে আউটপুট দেয়)

কিছুটা সম্পর্কিত কৌশল, ক্যাসকেড ALUs হাইপারস্পারসি ব্যবহার করেছিল। হাইপারস্পার্ক দুটি এএলইউ থেকে ফলাফলকে তৃতীয় এএলইউতে সরবরাহ করেছিল। এটি দুটি স্বতন্ত্র এবং তৃতীয় নির্ভরশীল ক্রিয়াকলাপকে একটি চক্রের মধ্যে কার্যকর করতে দেয়।

আপনার অনুমান যে "কোর প্রতি একাধিক সমবর্তী পাইপলাইন রয়েছে" অন্য কৌশলটি ব্যবহৃত হয়েছে। এই ধরণের নকশাকে সুপারস্যাকালার বলা হয় এবং এটি একটি চক্রের মধ্যে চালিত অপারেশনগুলির সংখ্যা বাড়ানোর সবচেয়ে সাধারণ উপায়।

এছাড়াও নির্দেশনা কার্যকর করার কিছু অন্যান্য প্রতিক্রিয়া এবং শেষ রয়েছে যা লক্ষণীয় হতে পারে। কিছু কার্যকর অপারেশন সাধারণ সম্পাদন ইউনিটের বাইরে আরও দক্ষতার সাথে সম্পাদন করা যেতে পারে। মুভ নির্মূলকরণের কৌশলটি রেজিস্টার পুনর্নবীকরণের সময় সরানো ক্রিয়াকলাপ সম্পাদনের জন্য আউট-অফ-অর্ডার প্রসেসরে রেজিস্টার নামকরণের ব্যবহারকে কাজে লাগায়; পদক্ষেপটি কেবল পুনরায় নামকরণ সারণীর এক অবস্থান থেকে শারীরিক নিবন্ধের নম্বরটি অন্য একটিতে অনুলিপি করে। এটি কার্যকরভাবে মৃত্যুদন্ডের প্রস্থকে বৃদ্ধি করে না তবে এটি নির্ভরতাও সরিয়ে দেয়। এই কৌশলটি স্ট্যাক-ভিত্তিক x87 এর সাথে প্রথম দিকে ব্যবহার করা হয়েছিল, তবে এখন ইন্টেলের উচ্চ পারফরম্যান্স x86 প্রসেসরে ব্যাপকভাবে ব্যবহৃত হয়। (X86-এ ধ্বংসাত্মক, দ্বি-অভিযানের নির্দেশাবলীর ব্যবহার চলন বিলোপকে সাধারণ আরআইসিসির তুলনায় আরও কার্যকর করে তোলে))

অপসারণের সরানোর অনুরূপ একটি কৌশল হ'ল নামকরণের সময় নিবন্ধের শূন্য নির্দেশাবলী পরিচালনা করা। শূন্য মান সরবরাহ করে এমন একটি নিবন্ধের নাম সরবরাহ করে একটি নিবন্ধক সাফ করার নির্দেশ (যেমন এক্সওর বা বিয়োগফল উভয় অপারেন্ডের সাথে একই রেজিস্টার হওয়া) কেবল নামটি পুনরায় নামকরণ সারণিতে (আরএটি) sertোকাতে পারে।

কিছু x86 প্রসেসর দ্বারা ব্যবহৃত অন্য কৌশল ধাক্কা এবং পপ ক্রিয়াকলাপগুলির ব্যয় হ্রাস করে। সাধারণত স্ট্যাক পয়েন্টার ব্যবহার করে একটি নির্দেশকে স্ট্যাক পয়েন্টারটির মান আপডেট করতে পূর্বের ধাক্কা বা পপের জন্য একটি সম্পূর্ণ চক্র অপেক্ষা করতে হবে। ধাক্কা এবং পপকে স্বীকৃতি দিয়ে স্ট্যাক পয়েন্টারে কেবলমাত্র একটি ছোট মান যুক্ত বা বিয়োগ করে, কেউ সমান্তরালে একাধিক সংযোজন / বিয়োগের ফলাফলগুলি গণনা করতে পারে। সংযোজনটির মূল বিলম্ব হ'ল বহন প্রচার, তবে ছোট মানগুলির সাথে বেস মানের আরও তাত্পর্যপূর্ণ বিট this এক্ষেত্রে স্ট্যাক পয়েন্টার only কেবলমাত্র একটি বহন করতে হবে। এটি ক্যারিল-সিলেক্ট অ্যাডেয়ারের অনুরূপ একটি অপ্টিমাইজেশনকে ছোট মানগুলির একাধিক সংযোজনে প্রয়োগ করতে দেয়। এছাড়াও, যেহেতু স্ট্যাক পয়েন্টারটি কেবলমাত্র ধ্রুবক দ্বারা আপডেট করা হয়,

একক, আরও জটিল ক্রিয়াকলাপে নির্দেশকে মার্জ করাও সম্ভব। একাধিক হিসাবে বিভাজন নির্দেশাবলী বিপরীত প্রক্রিয়া, সরল অপারেশন একটি পুরানো কৌশল, নির্দেশাবলী মার্জ করা (যা ইন্টেল ম্যাক্রো অপ ফিউশন হিসাবে অভিহিত করা হয়) প্রয়োগ নির্দেশাবলীর নির্দেশাবলী মধ্যে প্রকাশিত চেয়ে বেশি জটিল অপারেশন সমর্থন করতে পারবেন।

তাত্ত্বিক দিক থেকে, অন্যান্য কৌশল প্রস্তাব করা হয়েছে। শূন্য ব্যতীত ছোট স্থিরগুলি আরএটিতে সমর্থন করা যেতে পারে এবং এমন কিছু সাধারণ ক্রিয়াকলাপ যা ব্যবহার বা নির্ভরযোগ্যভাবে এ জাতীয় ছোট মানগুলি উত্পাদন করে তা তাড়াতাড়ি পরিচালনা করা যেতে পারে led ("ফিজিকাল রেজিস্টার ইনলাইনিং", মিক্কো এইচ। লিপাস্তি এট আল। 2004

ট্রেস ক্যাশে (যা নিয়ন্ত্রণ প্রবাহের বিশেষ অনুমানের অধীনে নির্দেশাবলীর ক্রমগুলি সংরক্ষণ করে) জন্য, শাখাগুলি দ্বারা পৃথক করা অপারেশনগুলিকে মার্জ করার এবং ট্রেসগুলিতে অপ্রয়োজনীয় ফলাফল তৈরি করার অপারেশনগুলি সরানোর সুযোগ থাকতে পারে। ট্রেস ক্যাশে অপ্টিমাইজেশনের ক্যাচিং প্রশিক্ষণ মার্জিংয়ের মতো অপ্টিমাইজেশানগুলিও উত্সাহিত করতে পারে যা প্রতিবার নির্দেশের স্ট্রিমটি আনার সময় যদি তাদের করা হত তবে তা কার্যকর হবে না।

নির্ভরতা অপসারণ করে সমান্তরালভাবে কার্যকর করা যায় এমন ক্রিয়াকলাপের সংখ্যা বাড়াতে মান পূর্বাভাস ব্যবহার করা যেতে পারে। একটি স্ট্রাইড-ভিত্তিক মান ভবিষ্যদ্বাণীকারী পূর্বে উল্লিখিত একটি বিশেষায়িত স্ট্যাক ইঞ্জিনের পপ / পুশ অপ্টিমাইজেশানের অনুরূপ । এটি বেশিরভাগ সমান্তরালভাবে সিরিয়ালাইজেশন সরিয়ে একাধিক সংযোজন গণনা করতে পারে। মান পূর্বাভাসের সাধারণ ধারণাটি একটি পূর্বাভাসিত মান সহ, নির্ভরশীল ক্রিয়াকলাপগুলি দেরি না করে এগিয়ে যেতে পারে। (শাখার দিকনির্দেশ এবং লক্ষ্য পূর্বাভাস কার্যকরভাবে মূল্য অনুমানের একটি খুব সীমিত আকার, নিম্নলিখিত নির্দেশাবলী যা শাখার "মান" এর উপর নির্ভরশীল — নেওয়া এবং না — এবং পরবর্তী নির্দেশিকার ঠিকানা, অন্য মানটি আনার অনুমতি দেয়))


অসাধারণ! মূল্যবান তথ্যের জন্য আপনাকে ধন্যবাদ। আপনি কি এমন কোনও বইয়ের পরামর্শ দিতে পারেন যেখানে আমি এই সমস্ত স্থাপত্য কৌশলগুলি পড়তে পারি?
নিরবচ্ছিন্ন

@ কর্মহীন মধ্যে gnasher729 এর উত্তর ) এবং একাডেমিক কাগজপত্র (ISCA এবং মাইক্রো [সম্মেলন] সাধারণভাবে ভাল কাগজপত্র আছে; HPCA, চুক্তি, ASPLOS, এবং সম্ভবত অন্য কয়েকজন ভালো সুনাম আছে)। অ্যান্ডি গ্লিউ (পেন্টিয়াম প্রোতে তাঁর কাজের জন্য সম্ভবত সবচেয়ে বিখ্যাত) ...
পল এ। ক্লেটন

1
... একটি কম্পার্চ উইকিতে কাজ করছিল যা আরও উন্নত ধারণা উপস্থাপন করবে, তবে অগ্রগতি ধীর ছিল এবং এটি সম্ভবত কিছুক্ষণ আগে হ্যাক হয়েছিল এবং এখন কেবল একটি ত্রুটি বার্তা দেয় ( semipublic.comp-arch.net/wiki )। তিনি বিভিন্ন উইকি সফটওয়্যার ব্যবহার করে উইকি (মূল পাঠ্যটি সংরক্ষণ করা হয়েছে) পুনরুদ্ধার করতে চান (তিনি যে সফ্টওয়্যারটি ব্যবহার করছিলেন তার সাথে তার কিছু সমস্যা ছিল এবং এটি উন্নতি করার সুযোগ হিসাবে গ্রহণ করছে), তবে "এটি কিছুটা সময় হবে"।
পল এ। ক্লেটন

সুপারশালার আর্কিটেকচারের সাফল্যের একটি ভাল উদাহরণ হ'ল ইনটেলের হাইপারথ্রেডিং - এই সমস্ত অপ্টিমাইজেশনের সাথে, ইন্টেলের ইঞ্জিনিয়াররা জানতে পেরেছিলেন যে প্রায় 30% ALU বেশিরভাগ সময় অব্যবহৃত ছিল, কারণ স্মৃতিশক্তি দ্রুত পর্যাপ্ত প্রবাহিত হতে পারে না, বা পাইপলাইন দক্ষতার সাথে পর্যাপ্তভাবে পূরণ করা যায় না। হাইপারথ্রেডিং আপনাকে আদর্শ দৃশ্যে নিখরচায় প্রচুর কাজ পেতে দেয়। এটি একটি পৃথক নতুন কোর থাকার তুলনায় অনেক কম, তবে এটি আরও সস্তা (এবং এটি মাল্টি-কোরের সাথেও মিলিত হতে পারে)।
লুয়ান

@ পলএ.ক্লেটন - সেই পৃষ্ঠার দুটি ক্যাপচার ওয়েব্যাকে রয়েছে। ডিসেম্বর 20 2013 , এবং ফেব্রুয়ারী 14 2014 । আমি জানি না যে এই ক্যাপচারগুলি পৃষ্ঠাটি নিয়ে সমস্যাগুলির পূর্বাভাস দেয় কিনা। দুর্ভাগ্যক্রমে, আমি যখন ওয়েব্যাকের সেই পৃষ্ঠাগুলি দেখার চেষ্টা করেছি, তখন আমি " বামার পেয়েছি this এই ফাইলটি যে মেশিনটি পরিবেশন করে তা ডাউন আছে We আমরা এটিতে কাজ করছি " "বার্তা, সুতরাং আমি নিশ্চিত না যে এই পৃষ্ঠাগুলিতে কী দেখা যাবে? ।
কেভিন ফেগান

10

আধুনিক প্রসেসরের অভ্যন্তরে কিছু গা dark় যাদু ঘটেছিল, তবে আপনার চিন্তা অবশ্যই সঠিক লাইন বরাবর রয়েছে।

আধুনিক প্রসেসরের দক্ষতা বোঝার মূল চাবিকাঠিটি যে তারা সুপারক্যালার । উইকিপিডিয়া থেকে (জোর দেওয়া খনি):

একটি সুপারশালার সিপিইউ আর্কিটেকচার একক প্রসেসরের মধ্যে নির্দেশনা-স্তরের সমান্তরালতা নামে সমান্তরালতার একটি ফর্ম প্রয়োগ করে । সুতরাং এটি প্রদত্ত ঘড়ির হারে অন্যথায় সম্ভব হবে তার চেয়ে দ্রুত সিপিইউ মাধ্যমে আউটপুট দেয়

আপনি অনুমান হিসাবে এই আধুনিক প্রসেসরগুলির মূল প্রতি একাধিক এক্সিকিউশন ইউনিট রয়েছে। হাইপার-থ্রেডিংটি বিবেচনা করা আকর্ষণীয়, পাইপলাইনের কিছু অংশ নকল হয়েছে তবে কিছুটি নয়।

আউট-অফ-অর্ডার এক্সিকিউশনটি সম্পর্কে পড়তে আগ্রহী, তবে সরাসরি আপনার প্রশ্নের উত্তর দেয় না। এটি যদিও "নষ্ট" সিপিইউ চক্রের সংখ্যা হ্রাস করে।

দক্ষতা এছাড়াও অন্যান্য অনেকগুলি বিষয় দ্বারা প্রভাবিত হয় যা প্রসেসরের অভ্যন্তরে স্টল সৃষ্টি করতে পারে, সহ (তবে অবশ্যই সীমাবদ্ধ নয়):

  • পূর্ববর্তী নির্দেশাবলীর ফলাফল পাওয়া যাচ্ছে না।
  • ক্যাশে মিস।
  • কোড ব্রাঞ্চিং, যা ইতিমধ্যে প্রাপ্ত নির্দেশাবলীকে অকার্যকর করবে ( এখানে এবং এখানে শাখার পূর্বাভাস সম্পর্কে পড়ুন )।

আধুনিক সংকলকগণ উপরের আইটেমগুলির সাথে অনেকগুলি সাহায্য করার চেষ্টা করেন, প্রসেসরটি তারপরে নেয়। একটি ভাল উদাহরণের জন্য এই প্রশ্নটি স্ট্যাকেক্সচেঞ্জে অন্য কোথাও দেখুন , যা একই নির্দেশাবলী করতে পারে এমন দুটি নির্দেশাবলীর মধ্যে একটি গুরুত্বপূর্ণ পার্থক্য তুলে ধরে (কিছু পরিস্থিতিতে)। তবে ব্যবহারের ক্ষেত্রে এক্সিকিউশন ইউনিটের কারণে কিছু প্রসেসরের ক্ষেত্রে অন্যটির তুলনায় একজন "দ্রুত" হতে পারে।

আধুনিক সিপিইউ পাইপলাইনের মানব পাঠযোগ্য ব্যাখ্যার জন্য, সিপিইউ পাইপলাইনের মাধ্যমে একটি যাত্রা দেখুন । একটি কিছুটা আরো প্রযুক্তিগত ব্যাখ্যার জন্য Agner কুয়াশা দেখা Microarchitecture কাগজ।


ব্যাখ্যা এবং খুব আকর্ষণীয় লিঙ্কের জন্য আপনাকে ধন্যবাদ। একটি নোট সেল দেখায় খুব আকর্ষণীয়, আমি অপেক্ষায় থাকবো cpu 'র আর্কিটেকচারের ^: _ ^ সম্পর্কে আরো অধ্যয়ন। "" X86 উপরে বর্ণিত হিসাবে "সুপারপাইলাইন" ব্যবহার করে। সেল পরিবার নয়টি মিনি-সিপাস জড়িত একটি "synergistic" পদ্ধতির ব্যবহার করে। এটি সত্য যে প্রতিটি মিনি-সিপিইউ বেশিরভাগ অর্ডার পাইপলাইন অনুসরণ করে, মিনি সিপাসে একটি পাইপলাইনের পরিবর্তে একাধিক সমান্তরাল সুপারসকলার পাইপলাইন থাকে have ""
কর্মহীন

3

আপনার কী ঘটেছিল বলে মনে করেন: ইন্টেল, এএমডি এবং আইবিএম-এর সমস্ত প্রকৌশলী পড়েন যে একটি পাইপলাইন কেবল চক্রের জন্য একটি ফলাফল সরবরাহ করতে পারে, এবং তারা বলেছিল "ওহ ভাল, ততক্ষণে এই প্রসেসরগুলিকে কোনও দ্রুততর করতে পারে না"। অথবা তারা এগুলি পড়েছিল এবং বলেছিল: "চক্র প্রতি একাধিক ফলাফল সরবরাহ করতে পারে না? আমরা সে সম্পর্কে দেখতে পাব!"।

উদাহরণস্বরূপ হ্যাসওয়েল আর্কিটেকচারের ভাল পরিচিতির জন্য আপনি এই লিঙ্কটি অনুসরণ করতে পারেন http://www.realworldtech.com/haswell-cpu/ বা আপনি কেবল ইন্টেল ওয়েবসাইটে যেতে পারেন এবং আপনি সেখানে কিছু ডকুমেন্টেশন পাবেন।

হাসওয়েল প্রসেসরের প্রতিটি কোরটিতে প্রচুর পরিমাণে এক্সিকিউশন ইউনিট রয়েছে, যা একে অপরের চেয়ে আলাদা অপারেশন সম্পাদন করতে পারে, তাই একাধিক ক্রিয়াকলাপ সমান্তরালভাবে সম্পাদন করা যায়। এর পরে, হ্যাসওয়েল প্রসেসরের বেশ কয়েকটি এক্সিকিউশন ইউনিট রয়েছে যা 256 বিট আকারের ভেক্টর অপারেশন পরিচালনা করে। একটি ভেক্টর অপারেশন উদাহরণস্বরূপ একটি ভেক্টর অপারেশনে চার ডাবল নির্ভুলতা ফ্লোটিং পয়েন্ট অপারেশন বা আটটি একক নির্ভুলতা ভাসমান পয়েন্ট অপারেশন করতে পারে। এবং পরিশেষে, হ্যাসওয়েল প্রসেসর "ফিউজড মাল্টিপল-অ্যাড" সমর্থন করে, যার অর্থ একটি বার বি প্লাস সি গণনা করা কেবল একটি একক ক্রিয়াকলাপ।

তাত্ত্বিক সর্বাধিক, যেহেতু হাসওলের দুটি ইউনিট ফিউজড মাল্টিপল-অ্যাড সক্ষম, চক্র প্রতি দুটি ফিউজড মাল্টিপল-অ্যাড অপারেশন, প্রতিটি ক্রিয়াকলাপ আটটি একক-নির্ভুলতা গুণক অতিরিক্ত সংযোজন, বা 32 একক নির্ভুলতা ভাসমান-পয়েন্ট অপারেশন করে।

3630 প্রসেসর ইন্টেলের সর্বশেষ দামের তালিকায় নেই, তবে এখানে চারটি কোর সহ 3740QM এর মতো মডেল রয়েছে। সুতরাং 32 এর পরিবর্তে আপনি প্রতি ক্লক সাইকেলে 128 ফ্লোটিং-পয়েন্ট অপারেশন পেতে পারেন। এটি তাত্ত্বিক সর্বাধিক। বাস্তব জীবনে এর অর্ধেক অর্জন করা একটি চ্যালেঞ্জ, তবে উপযুক্ত কাজের পক্ষে অসম্ভব নয়। 15 টি পর্যন্ত কোর সহ অন্য প্রসেসর উপলব্ধ রয়েছে (এমন দামের জন্য যা সর্বাধিক ধর্মান্ধ গেমিং ধর্মান্ধরাও প্রদান করবে না)।

সুতরাং আপনার বেশ কয়েকটি গুণকগুলির সংমিশ্রণ রয়েছে:

  1. প্রসেসরে একাধিক কোর।
  2. (হাইপারথ্রেডিং, পূর্বে উল্লিখিত নয়, আপনাকে তাত্ত্বিক সীমাতে আরও কাছে যেতে দেয়)
  3. ফিউজড মাল্টিপল-অ্যাড অপারেশন দুটি পাটিগণিত অপারেশন কেবল একটি হিসাবে গণনা করে।
  4. 256-বিট ভেক্টর 8 টি অপারেশন করছে কেবল একজন হিসাবে গণনা করছে।
  5. দুটি ভেক্টর এক্সিকিউশন ইউনিট ফিউজড-মাল্টিপ্লাইড অ্যাড পরিচালনা করতে সক্ষম।

চক্র প্রতি 8.6 অপারেশনগুলি অর্জন করা খুব কঠিন নয়। এমনকি কোর প্রতি চক্র প্রতি 8.6 অপারেশন খুব কঠিন নয়।


আমি অবাক হয়েছি x x 86 চালিত কিছু কোর এবং কিছু এমন একটি নির্দেশিকা সেট চালিয়েছিল যা সুপারসকালের আচরণের জন্য অনুকূলিত হয়েছিল এমন একটি সিপিইউ ডিজাইন করা ব্যবহারিক বা সুবিধাজনক হবে কিনা। আমি জানি যে ইন্টেল এবং এএমডি x86 নির্দেশিকাটিতে সীমাবদ্ধতার আশেপাশে কাজ করার জন্য বেশ চমকপ্রদ কিছু করে, তবে কিছু ক্ষেত্রে আমি মনে করব যে বর্তমান নির্দেশ সেটটি প্রকাশ করতে পারে না এমন কিছু জিনিস জেনে রাখা সহায়ক হবে। উদাহরণস্বরূপ, ADDওভারফ্লো অকার্যকর ছেড়ে দেওয়া উচিত কিনা, বা ওভারফ্লো দেখা দিলে সেট করা উচিত (এবং যদি না হয় তবে বাম সেট) তার উপর ভিত্তি করে নির্দেশাবলীর স্বতন্ত্র সংস্করণগুলি ।
সুপারক্যাট

1
আমি নিজেকে দুঃখ পেয়েছি যে এই দিন এবং যুগে বহু ভাষা ওভারফ্লো পরীক্ষা না করে ডিফল্ট। আমি জানি যে জাভা এর অর্থগত প্রয়োজনীয়তার দ্বারা অনেকটাই আটকে আছে, তবে সি # এর মতো ভাষায় ট্র্যাপিং এবং নন-ট্র্যাপিং পাটিগণিত অপারেটর উভয়ই অন্তর্ভুক্ত রয়েছে, কেবলমাত্র ওভারফ্লোকে ফাঁদে ফেলতে না দেখার একমাত্র ভাল কারণ কারণ একজনের মোড়কের আচরণের প্রয়োজন। বর্তমানে, ওভারফ্লো চেকিং একটি তাত্পর্যপূর্ণ গতির জরিমানা চাপিয়ে দিতে পারে, তবে কোনও মেশিন ল্যাঙ্গুয়েজ যদি এই ধারণাটি ঘিরে তৈরি করা হয় যে এতক্ষণ ওভারফ্লো ট্র্যাফিকিং সঠিকভাবে করা দরকার না কারণ কোডটি নিশ্চিত করতে পারে যে অপারেশনের আগে কোনও ওভারফ্লো হয়েছে না ...
সুপারক্যাট

... নির্দিষ্ট সমালোচনামূলক পয়েন্টে পৌঁছে যায়, ওভারফ্লো-ট্র্যাপিং ওভারহেডকে প্রায় শূন্যের মধ্যে হ্রাস করা উচিত। কোড যদি কোনও গণনা সম্পাদন করে, এবং তারপরে কোনও স্থানে একটি মান সঞ্চয় করে যা প্রথম গণনাটি ওভারফ্লো হয়ে যায় তবে প্রসেসরের প্রথম গণনা সফল হয় কিনা তা জানা না হওয়া পর্যন্ত স্টোরটি বিলম্ব করার দরকার নেই, তবে প্রসেসরের বর্তমানে কোনও উপায় নেই যে জেনে। কোড যদি সহজেই সমস্ত ক্রিয়াকলাপ সম্পাদন করতে পারে যা ওভারফ্লো হয়েছে কি না তা নিরাপদে সম্পাদন করা যেতে পারে এবং তারপরে যে
কোনওর

... মনে হয় এটি কার্যকর করা নির্ভরতা হ্রাস করতে সাহায্য করবে।
সুপারক্যাট

2

ড্রায়স্টোন বেঞ্চমার্কটি ১৯৮৪ সালের, এবং সংশ্লিষ্ট নামমাত্র 1 এমআইপিএস ভ্যাক্স মেশিনটি আধুনিক কথায় খুব দক্ষ নয়। এমনকি একটি কর্টেক্স এম 3 1,25 ডিএমপিআইএস / মেগাহার্টজ সরবরাহ করে।

ইন্টেল কোর অ্যাচিটেকচার প্রসেসর প্রকৃতপক্ষে একক কোরতে সমান্তরালে একাধিক নির্দেশনা চালাতে পারে, কারণ সেখানে একাধিক কম্পিউটিং ইউনিট উপস্থিত রয়েছে।


1

আমি আরস টেকনিকার জোন "হ্যানিবাল" এর কাছ থেকে অনেক কিছু শিখেছি মাইক্রোপ্রসেসর আর্কিটেকচার বিষয়ে চমৎকার এবং বিস্তৃত নিবন্ধগুলি। নিবন্ধগুলি একটু তারিখযুক্ত (এগুলি প্রায় 2004 সালের মনে হয়) তবে এটি এখনও খুব প্রাসঙ্গিক।

কোনও নিবন্ধের পরবর্তী অংশের কিছু লিঙ্কগুলি নষ্ট হয়ে গেছে, তবে মনে হচ্ছে আপনি প্রথম অংশের URL এবং পরবর্তী পৃষ্ঠার ভাঙা ইউআরএল (যেমন m-ইউআরএলটিতে স্বাদ যোগ করে) সাবধানতার সাথে তুলনা করে সেগুলি নিজেরাই ঠিক করতে পারেন ।

(হ্যাঁ, এটি একটি গৌরবযুক্ত লিংক-উত্তর, দুঃখিত, নিবন্ধগুলি উল্লেখ না করে খুব ভাল)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.