সিপিইউ চিপে র‌্যাম লাগানো হয় না কেন?


55

মেমোরি (র‌্যাম) সহ বাইরের সমস্ত জিনিসের তুলনায় আধুনিক সিপিইউগুলি খুব দ্রুত।

এটি বোধগম্য, যেহেতু সিপিইউ ঘড়ির ফ্রিকোয়েন্সি এমন একটি পর্যায়ে পৌঁছেছে যেখানে কেবল সিপিইউ থেকে রাম চিপস এবং পিছনে বাসে চলতে বৈদ্যুতিক সিগন্যালের জন্য বেশ কয়েকটি ক্লক টিক লাগে।

এটি অনেক স্তরেও জীবনকে জটিল করে তোলে: সিপিইউয়ের কাছাকাছি তথ্য সরবরাহের জন্য মাল্টি-লেভেল ক্যাশে হায়ারার্কিগুলি নির্মিত হয়েছিল, যার ফলে চিপটিতে জটিল সিঙ্ক্রোনাইজেশন লজিকের প্রয়োজন হয়। ডেটা আনার সময় অপেক্ষা চক্র এড়াতে প্রোগ্রামগুলি অবশ্যই ক্যাশে-বান্ধব উপায়ে লিখতে হবে।

যদি উল্লেখযোগ্য পরিমাণে র‌্যাম সরাসরি সিপিইউ চিপে পাওয়া যায় তবে এই সমস্যাগুলির মধ্যে অনেকগুলি এড়ানো যেতে পারে। এটি কোনও একচেটিয়া বিন্যাসের দরকার নেই: সম্ভবত ক্লাসের উপর নির্ভর করে চিপটিতে 1-4 জিবি রাখুন এবং অতিরিক্ত মেমরি আলাদাভাবে ইনস্টল করার অনুমতি দিন।

আমি নিশ্চিত যে ইন্টেল, এএমডি এবং এর মতো আরও ভাল কারণগুলি এটি করছে না। এই কারণগুলি কি? এটা কি চিপকে ছাড়ানোর মতো জায়গা নেই?


29
ক্যাশে র‌্যাম। স্পেস এবং ডাইতে পিনগুলি একটি প্রিমিয়ামে রয়েছে।
তামার.হাট

2
@ তামার.হাতি ক্যাচটি র‌্যাম, তবে ক্যাশে আকারটি ইনস্টল করা র‌্যামের একটি ছোট ভগ্নাংশ (সাধারণত, আমরা এমবিাইটেস বনাম জিবিটেস রেঞ্জের কথা বলছি)। আমি ভাবছি কেন সিপিইউ চিপে 1 জিবি রাখবেন না।
কম হেজহগ

5
সাধারণত এটি কিছু নির্দেশ / ডেটা ফ্লো মিক্সের জন্য অনুকূলিত হয়। এছাড়াও, র্যাম থেকে / থেকে সমস্ত ডেটা সিপিইউয়ের মধ্য দিয়ে যায় না।
তামার.হাট

1
ডাইটি সহজ, এটি সস্তা। এর অর্থ হ'ল আপনি বিভিন্ন প্রক্রিয়া আকার এবং প্রক্রিয়া পদ্ধতি ব্যবহার করতে পারেন।
যাত্রামন গীক

@ লেজারহেজহগ আপনার ক্যাশে হিট রেট সাধারণভাবে কত হতে পারে তার সীমাবদ্ধতা রয়েছে, তাই আরও ক্যাশে যুক্ত করা আসলে কোনও কাজে আসে না। এছাড়াও অনেকগুলি সিপিইউ আসলে ডিআরএএম এখনই এমবেড করেছে, বিশেষত মোবাইল / এমবেডেড স্পেসে (উদাহরণস্বরূপ অনেকগুলি এআরএম ভিত্তিক এসওসি)।
ফ্লফি

উত্তর:


79

ইন্টেলের হাসওয়েল (বা কমপক্ষে সেই পণ্যগুলি যা আইরিস প্রো 5200 জিপিইউ অন্তর্ভুক্ত করে) এবং আইবিএম এর পাওয়ার 7 এবং বিদ্যুৎ 8 এর মধ্যে এম্বেডড ড্রাম, "ইড্রাম" অন্তর্ভুক্ত রয়েছে।

একটি গুরুত্বপূর্ণ বিষয় যা ইড্রামের সাম্প্রতিক অবধি সাধারণ না হওয়ার জন্য পরিচালিত করেছে তা হ'ল ডিআরএএম ফ্যাব্রিকেশন প্রক্রিয়া যুক্তিযুক্ত প্রক্রিয়াগুলির সাথে সহজাতভাবে সামঞ্জস্যপূর্ণ নয়, যাতে অতিরিক্ত পদক্ষেপগুলি অবশ্যই অন্তর্ভুক্ত করা উচিত (যা ব্যয় বৃদ্ধি করে এবং ফলন হ্রাস করে) যখন ইড্রামের ইচ্ছা হয় তখন। সুতরাং, এই অর্থনৈতিক অসুবিধাটি পূরণ করার জন্য এটি অন্তর্ভুক্ত করতে চাওয়ার একটি বাধ্যতামূলক কারণ থাকতে হবে। বিকল্পভাবে, ডিআরএএম পৃথক ডাইয়ের উপর স্থাপন করা যেতে পারে যা স্বতন্ত্রভাবে উত্পাদিত হয়, তবে তারপরে সিপিইউতে একই প্যাকেজের সাথে সংহত করা হয়। এটি সত্যিকারের সংহত উপায়ে দুটি উত্পাদন করতে অসুবিধা ছাড়াই লোকালটির বেশিরভাগ সুবিধা সরবরাহ করে।

আর একটি সমস্যা হ'ল ডিআরএএম এসআরএ্যামের মতো নয় কারণ বিদ্যুৎ প্রয়োগের সময় এটি অনির্দিষ্টকালের জন্য এটির বিষয়বস্তু সংরক্ষণ করে না এবং এটি পড়ার ফলে সঞ্চিত ডেটাও নষ্ট হয়ে যায়, যা অবশ্যই পরে লেখা উচিত। সুতরাং, এটি পর্যায়ক্রমে এবং প্রতিটি পড়ার পরে রিফ্রেশ করতে হবে। এবং, কারণ একটি ডিআরএএম সেল একটি ক্যাপাসিটারের উপর ভিত্তি করে তৈরি করা হয়, যথেষ্ট পরিমাণে চার্জ করা বা স্রাব করা যাতে পরবর্তী রিফ্রেশের কিছুটা সীমাবদ্ধ সময় লাগার আগে ফুটো তার মানকে দূষিত করবে না। এই চার্জিং সময়টি এসআরএএমের সাথে প্রয়োজন হয় না, যা কেবল একটি ল্যাচ; ফলস্বরূপ এটি সিপিইউ হিসাবে একই হারে আটকানো যেতে পারে, যেখানে ডিআরএএম যুক্তিযুক্ত বিদ্যুৎ খরচ বজায় রেখে প্রায় 1 গিগাহার্জ সীমাবদ্ধ। এর ফলে ডিআরএএম-এর চেয়ে এসআরএএম-এর তুলনায় উচ্চতর অন্তর্নিহিততা রয়েছে, যা হ্রাসকৃত হারের মূল্য পরিশোধ করতে হবে এমন অতি বৃহত্ ক্যাশে ব্যতীত সকলের জন্য ব্যবহার করা সার্থক নয়।

এছাড়াও, যতদূর পর্যন্ত বিলম্বের বিষয়টি, অসুবিধার একটি বড় অংশ হ'ল শারীরিক দূরত্ব সংকেতগুলি অবশ্যই ভ্রমণ করতে হবে। আলো কেবল 3 গিগাহার্টজ সিপিইউয়ের ঘড়ির সময়কালে 10 সেমি ভ্রমণ করতে পারে। অবশ্যই, সংকেতগুলি মরা জুড়ে সরলরেখায় ভ্রমণ করে না এবং বাফারিং এবং ফ্যান-আউটের প্রয়োজনীয়তার কারণে আলোর গতির কাছাকাছি কিছুতেই তারা প্রচার করে না, যার ফলে প্রচারে বিলম্ব হয়। সুতরাং, একটি মেমরি সর্বাধিক দূরত্ব থেকে দূরে থাকতে পারে 1 বিলম্বতার ঘড়ি চক্র বজায় রাখার জন্য সর্বাধিক কয়েকটি সেন্টিমিটার, উপলব্ধ অঞ্চলে মেমরির পরিমাণকে সামঞ্জস্য করা যায় lim ইন্টেলের নেহালেম প্রসেসর আসলে এল 2 ক্যাশে বনাম পেন্রিনের ক্ষমতাকে আংশিকভাবে তার ল্যাটেন্সিটি উন্নত করার জন্য হ্রাস করেছিল, যার ফলে উচ্চতর পারফরম্যান্সের দিকে পরিচালিত হয়েছিল। * আমরা যদি বিলম্বিতা সম্পর্কে এত যত্ন না করি, তবে মেমরিটিকে প্যাকেজটিতে রাখার কোনও কারণ নেই,

এটিও লক্ষ করা উচিত যে বেশিরভাগ কাজের চাপের জন্য ক্যাশে হিটের হার খুব বেশি: প্রায় সব ব্যবহারিক ক্ষেত্রে 90% এরও বেশি, এবং এটি অস্বাভাবিকভাবে 99% এরও বেশি নয়। সুতরাং, মরার সাথে আরও বড় স্মৃতি অন্তর্ভুক্ত করার সুবিধা অন্তর্ভুক্তভাবে এই কয়েক শতাংশ মিসের প্রভাব হ্রাস করতে সীমাবদ্ধ। এন্টারপ্রাইজ সার্ভার মার্কেটের উদ্দেশ্যে প্রসেসরগুলি (যেমন পাওয়ার) সাধারণত প্রচুর পরিমাণে ক্যাশ থাকে এবং লাভজনকভাবে ইড্রাম অন্তর্ভুক্ত করতে পারে কারণ এটি অনেক এন্টারপ্রাইজ ওয়ার্কলোডের বৃহত কার্যনির্বাহী সেটকে সমন্বিত করতে দরকারী। জিএসইউ সমর্থন করার জন্য হ্যাসওয়েলের এটি আছে, কারণ টেক্সচার বড় এবং ক্যাশে সামঞ্জস্য করা যায় না। এটি আজ ইড্রামের জন্য ব্যবহারের ক্ষেত্রে, সাধারণ ডেস্কটপ বা এইচপিসি ওয়ার্কলোড নয়, যা সাধারণত আদর্শ ক্যাশে হায়ারারচি দ্বারা সরবরাহ করা হয়।

মন্তব্যে উত্থাপিত কিছু সমস্যা সমাধানের জন্য:

এই EDRAM ক্যাশেগুলি মূল মেমরির জায়গায় ব্যবহার করা যায় না কারণ এগুলি এল 4 শিকারের ক্যাশে হিসাবে তৈরি করা হয়েছে। এর অর্থ হ'ল এগুলি অস্থির এবং কার্যকরভাবে সামগ্রী-ঠিকানাযোগ্য, যাতে সেগুলিতে সঞ্চিত ডেটা কোনও নির্দিষ্ট স্থানে থাকা হিসাবে বিবেচিত হয় না এবং যে কোনও সময় তা ফেলে দেওয়া যেতে পারে। এই বৈশিষ্ট্যগুলি সরাসরি ম্যাপ করা এবং অবিরাম থাকার র‌্যামের প্রয়োজনীয়তার সাথে পুনর্মিলন করা কঠিন তবে এগুলি পরিবর্তন করা তাদের উদ্দেশ্যযুক্ত উদ্দেশ্যে ক্যাশেগুলি অকেজো করে দেবে। অবশ্যই এটি আরও প্রচলিত ডিজাইনের স্মৃতি এম্বেড করা সম্ভব, যেমন এটি মাইক্রোকন্ট্রোলারগুলিতে করা হয়, তবে বৃহত্তর স্মৃতিযুক্ত সিস্টেমগুলির পক্ষে এটি ন্যায়সঙ্গত নয় কারণ লো স্মৃতিশক্তিটি মূল স্মৃতিতে যেমন ক্যাশে রয়েছে তত সুবিধাজনক নয়, তাই বিস্তৃত বা ক্যাশে যুক্ত করা আরও সার্থক প্রস্তাব।

গিগাবাইটের ক্রম সহ ক্ষমতা সহ খুব বড় ক্যাশে হওয়ার সম্ভাবনা হিসাবে, একটি ক্যাশে কেবলমাত্র অ্যাপ্লিকেশনের জন্য কার্যকারী আকারের সর্বাধিক আকার হতে হবে। এইচপিসি অ্যাপ্লিকেশনগুলি টেরাবাইট ডেটাসেটগুলির সাথে ডিল করতে পারে তবে তাদের ভাল অস্থায়ী এবং স্থানিক স্থান রয়েছে এবং তাই তাদের কাজের সেটগুলি খুব বেশি বড় হয় না। বড় ওয়ার্কিং সেট সহ অ্যাপ্লিকেশনগুলি হ'ল উদাহরণস্বরূপ ডাটাবেস এবং ইআরপি সফ্টওয়্যার, তবে এই ধরণের কাজের চাপের জন্য অনুকূলিত প্রসেসরের কেবলমাত্র একটি সীমিত বাজার রয়েছে। সফ্টওয়্যারটির সত্যই এটির প্রয়োজন না হলে আরও ক্যাশে যুক্ত করা খুব দ্রুত হ্রাসকারী রিটার্ন সরবরাহ করে। সম্প্রতি আমরা প্রসেসরদের প্রিফেচ নির্দেশাবলী লাভ করতে দেখেছি, সুতরাং ক্যাচগুলি আরও দক্ষতার সাথে ব্যবহার করতে সক্ষম হয়েছে: কার্যকারী সেটটির পরম আকারের চেয়ে মেমরির অ্যাক্সেসের নিদর্শনগুলির অনিশ্চয়তার কারণে ঘটে যাওয়া মিসগুলি এড়াতে কেউ এই নির্দেশাবলী ব্যবহার করতে পারেন,

* বিলম্বের উন্নতি কেবল ক্যাশের ক্ষুদ্র দৈহিক আকারের কারণে নয়, তবে সহযোগিতা কমে যাওয়ার কারণেও হয়েছিল। বেশ কয়েকটি ভিন্ন কারণে নেহালেমের পুরো ক্যাশে শ্রেণিবিন্যাসে উল্লেখযোগ্য পরিবর্তন ছিল, যার সবকটিই পারফরম্যান্সের উন্নতির দিকে মনোনিবেশ করেননি। সুতরাং এটি উদাহরণ হিসাবে যথেষ্ট হলেও এটি কোনও সম্পূর্ণ অ্যাকাউন্ট নয়।


1
ভালভাবে ব্যাখ্যা করেছেন, @ অলেকসান্ডার আর। সংক্ষেপে, মনে হচ্ছে সিপিইউ এবং ডিআরএএম এর মধ্যে "প্রতিবন্ধকতা মেলে না" এর মতো কিছু রয়েছে যা দু'জনের মিলনকে কঠিন করে তোলে।
কম হেজেহগ

3
এবং অবশ্যই, এসআরএএম এখনও বেশ বিশাল - এমনকি ছোট (র‌্যামের তুলনায়) ক্যাচগুলি আধুনিক সিপিইউগুলিতে মৃতের প্রায় অর্ধেক অঞ্চল নেয় (ভাল, সংহত জিপিইউগুলি সহ সিপিইউগুলি বাদে: ডি)।
লুয়ান

2
আমি অবাক হয়েছি যদি প্রধান স্মৃতি ছাড়া চালানোর কোনও উপায় থাকে। স্লিমড-ডাউন লিনাক্স বিতরণ (বা উইন্ডোজের একটি পুরানো সংস্করণ) চালানোর জন্য 128 এমবি প্রচুর পরিমাণে হওয়া উচিত।
ব্যবহারকারী 253751

একে 'জিপিইউ-অন-ডাই' বলা হয়, 'জিপিইউ-অন-প্যাকেজ' নয়।
এশোফার

4
@ সাইবারমোনকি: নির্দেশগুলি আসলে এল 1 ক্যাশে থেকে প্রাপ্ত, মূল স্মৃতি নয়। এগুলিকে মূল স্মৃতি থেকে আনতে ভয়াবহ হবে - 60 এনএস চক্র সময় বা ততোধিক সময় যা আপনার সিপিইউকে একক কোর ডিজাইনের জন্য 16 মেগাহার্জ সীমিত করে দেয়।
MSalters

17

বৃহত মেমরি (ডিআরএএম এর গিগাবাইট) প্রধান কারণগুলি সিপিইউ ডাইতে অন্তর্ভুক্ত নয় মূলত ব্যয় সম্পর্কে। সিপিইউ ডাই স্পেসটি উল্লেখযোগ্যভাবে বেশি ব্যয়বহুল কারণ খুব ছোট বৈশিষ্ট্যগুলি তৈরি করতে প্রয়োজনীয় উত্পাদন প্রক্রিয়া। একই মরতে দু'টি তৈরি করাও সম্ভব নাও হতে পারে, যদিও এখানে কোনও নির্দিষ্ট উত্তর দেওয়ার জন্য বিশদ সম্পর্কে আমি যথেষ্ট জানি না।

আসুন সরাসরি সিপিইউ ডাইতে প্রচুর পরিমাণে ডিআআরএম রাখার সম্ভাব্যতাটি মূল্যায়ন করি।

22

যাইহোক, সিপিইউতে মেমরিটিকে আরও কাছে রাখার ধারণাটি সম্পূর্ণ হারানো কারণ নয়। এটি সম্ভবত ভবিষ্যতে স্মৃতি স্থানান্তরিত করবে কারণ সত্য আলোর গতি সীমাবদ্ধ এবং নির্দিষ্ট দূরত্বে এত দ্রুত যোগাযোগ করা সম্ভব।

মেমোরিটিকে সিপিইউয়ের আরও কাছে নিয়ে যাওয়ার বাস্তবসম্মত কৌশলগুলি (নোট করুন যে এগুলিতে প্রচলিত কৌশলগুলির সাথে বাণিজ্যও রয়েছে):

  1. এগুলি নিজেই সিপিইউর উপরে রাখুন। এটি ইতিমধ্যে রাস্পবেরি পাইতে করা হয়েছে এবং এটি ওয়াইড আই / ও মেমরি স্ট্যান্ডার্ডের একটি অংশ। মেমরিটি এখনও একটি পৃথক প্রক্রিয়াতে উত্পাদিত একটি পৃথক ডাই। যাইহোক, এটির সমস্যাটি হ'ল সিপিইউতে যে কোনও তাপ বিচ্ছিন্ন হওয়া উচিত তা হিট সিঙ্কে পৌঁছানোর আগে মেমরির মধ্য দিয়ে যেতে হবে। এর অর্থ এটি উচ্চ বিদ্যুৎ প্রসেসরের জন্য কাজ করবে না, এবং কেন এই প্রযুক্তির প্রাথমিক অ্যাপ্লিকেশনগুলি মোবাইল প্রসেসর / অন্যান্য এমবেডেড অ্যাপ্লিকেশনগুলিতে যেখানে আপনার সিপিইউ বহু দশক বা শত শত ওয়াট গ্রহণ করছে না।

  2. স্বল্প ব্যয়ের সাবস্ট্রেটে এগুলি সত্যিই কাছাকাছি আটকে দিন। এইচবিএমটি এভাবেই কাজ করার জন্য ডিজাইন করা হয়েছে, একটি খুব বড় বাসটি একটি স্বল্প ব্যয়যুক্ত "ইন্টারপোজার" ডাইতে তৈরি করা হয় এবং এটি উচ্চ-প্রান্তের জিপিইউ মেমরিটি যেদিকে চলেছে কারণ ব্যান্ডউইথ উল্লেখযোগ্যভাবে বেশি। মেমরি চিপস এবং ইন্টারপোজারগুলি এখনও প্রকৃত প্রসেসরের থেকে বিভিন্ন ডাইগুলিতে তৈরি।


5
আমি আশা করব যে আপনি চেষ্টা করার সাথে সাথে ফলন হ্রাস পাবে এবং আরও একটি বিলম্বিত ডাইয়ের উপরে আরও কয়েক বিলিয়ন ট্রানজিস্টরকে ক্র্যাম করুন - প্রতিটি অতিরিক্ত ডিভাইসের সাথে ত্রুটি বা ত্রুটি হওয়ার সম্ভাবনা বেড়ে যায়। আপনি যদি সিস্টেমটিকে কয়েকটি ছোট ছোট টুকরো করে বিভক্ত করেন তবে কোনও একটি টুকরোতে ত্রুটি দেখা দেওয়ার সম্ভাবনা ব্যাপকভাবে হ্রাস পাবে এবং একটি ত্রুটিযুক্ত অংশটি ছাড়ার ব্যয়ও কম হবে। আমি কল্পনা করতাম যে একটি বড় মরে যাওয়াও বানোয়াট করা আরও শক্ত হবে, অন্য সব কিছু সমান।
জন ইউ

4
2

@ জোহানু - একটি ডাইয়ের উপরে প্রচুর সংখ্যক বারবার মডিউল স্থাপনের সুবিধা রয়েছে যে কোনও ত্রুটি দেখা দিলে আপনি কেবলমাত্র এটির মধ্যে উপস্থিত মডিউলটি অক্ষম করতে পারেন এবং কম খরচের মান হিসাবে মরণকে মুক্তি দিতে পারেন (ডিআরএএম এর সাথে এটি অনেক কিছু ঘটে, ৮০-এর দশকে ফিরে যেতে যখন 32KB মডিউল থাকা অনেকগুলি মেশিন আসলে ত্রুটিযুক্ত বিভাগটি অক্ষম করে 64 কে চিপ ব্যবহার করে)) প্রকৃতপক্ষে এর অর্থ হ'ল আপনি যখন প্রসেসরের সাথে ডিআরএএম সংহত করতে পারেন তখন ফলন বৃদ্ধি পায় ...
জুলাই

7

সিপিইউতে বিপুল পরিমাণে ডিআরএএম যুক্ত করা কেন অনিবার্য হতে পারে তার বিভিন্ন কারণ রয়েছে।

  1. প্রক্রিয়া এবং কল্প DRAM জন্য সেট আপ করা যেতে পারে না। ড্রামের জন্য বিশেষ সার্কিট উপাদান প্রয়োজন যা উত্পাদন করতে অতিরিক্ত উত্পাদন পদক্ষেপ নেয়। এটি উত্পাদন ব্যয় বৃদ্ধি করে।

  2. সমস্ত স্মৃতি পরীক্ষা করতে হবে। মেমরি পরীক্ষা আপনার পরীক্ষার সময় বাড়ে। এটাই অন্য ব্যয় বৃদ্ধি।

  3. ডাই বাড়িয়ে দেওয়া নিজেই ব্যয় বৃদ্ধি, যেহেতু এর অর্থ দাঁড়ায় যে ওয়েফারে কম মারা যায়। এটি ফলনকেও প্রভাবিত করে - একটি ত্রুটি আপনার ওয়েফারের একটি বৃহত ভগ্নাংশ বের করে। এর চরম উদাহরণের জন্য, ক্যামেরায় ফুল-ফ্রেম (35 মিমি) চিত্র সেন্সরগুলির ব্যয় দেখুন।

  4. বিশেষ ধরণের স্মৃতি পরিচালনা করতে পারে এমন একটি প্রক্রিয়া বিকাশ করতে আরও সময়, অর্থ এবং কাজ লাগে এবং ব্যর্থতার ঝুঁকি বেশি থাকে। ডিআরএএম-এর যে কোনও সমস্যা সিপিইউ প্রকাশে বিলম্ব করবে। ডেস্কটপ সিপিইউগুলি সেমিকন্ডাক্টর উত্পাদনের মূল প্রান্তে রয়েছে, তাই বিলম্ব একটি বিশাল প্রতিযোগিতামূলক অসুবিধা হতে পারে। (দেখুন: এএমডি বনাম ইনটেল গত বেশ কয়েক বছর ধরে))

  5. পাঠাগুলির জন্য ডিআআরএএম-এর অ্যানালগ সংবেদনের পাশাপাশি পর্যায়ক্রমিক রিফ্রেশ দরকার। আমি কোনও ড্রাম বিশেষজ্ঞ নই, তবে আমি সন্দেহ করি যে এটি অফ-চিপ বা অন-চিপ নির্বিশেষে উচ্চ-সিপিইউর মতো দ্রুততর হতে পারে doubt সুতরাং আপনি সম্ভবত এখনও এসআরএএম ক্যাচিংয়ের সাথে আটকে যাবেন।

  6. এমনকি যদি আপনি উপরের সমস্যাগুলি কাটিয়ে উঠতে এবং সিপিইউতে একটি কয়েক গিগাবাইট ডিআরএএম-র ক্র্যাম করতে পারেন, তবে এটি কোনও ডেস্কটপ পিসি, ল্যাপটপ, বা সার্ভার চালানোর পক্ষে যথেষ্ট হবে না, তাই আপনাকে যাইহোক অফ-চিপ মেমরি থাকতে হবে ।


1
বেশিরভাগ ক্যাশে ইসিসি এর সাথে প্রয়োগ করা হয় এবং সাম্প্রতিক কিছু ইন্টেল প্রসেসর ক্যাশে চিপকিল এবং ব্লক রিডানডেন্সি অন্তর্ভুক্ত করে। এটি পরীক্ষার প্রয়োজনীয়তা হ্রাস করে এবং বৃহত্তর মরার জন্য ফলনকে উল্লেখযোগ্যভাবে উন্নত করে। বিপরীতে, একটি চিত্র সেন্সরের সাথে, ত্রুটি সংশোধন করার কোনও সম্ভাবনা নেই কারণ তথ্যগুলি একটি প্রাইরি হিসাবে জানা যায় না এবং আমরা যখন সিদ্ধান্ত নিতে পারি না, যখন পিক্সেলগুলির একটি ব্লক সঠিকভাবে কাজ করছে না, কেবল এটিকে উপেক্ষা করুন এবং একটি অতিরিক্ত ব্যবহার করুন তার জায়গা।
ওলেকসান্ডার আর

সত্য, স্মৃতি সহ উচ্চ ফলন পাওয়া সহজ। যেমনটি আমি বলেছিলাম, এটি চরম উদাহরণ ছিল।
অ্যাডাম হাউন

3

অন্যান্য উত্তরগুলির পাশাপাশি, এই জাতীয় সিস্টেম সম্পর্কে আরও অনেক কিছু বলা যেতে পারে। প্রধান ডাইয়ে স্মৃতি স্থানান্তরিত করা অন্যান্য প্রকৌশল সমস্যার একটি হোস্টকে অন্তর্ভুক্ত করবে। আপনাকে বাসগুলি পুনরায় বিভক্ত করতে হবে, প্রধান প্রসেসরে একটি ডিএমএ কন্ট্রোলার তৈরি করতে হবে, আইআরকিউ বাসটির পুনর্গঠন করতে হবে এবং নির্ধারণ করতে হবে যে কীভাবে ঘন জায়গায় আপনি অতিরিক্ত অতিরিক্ত তাপ বয়ে আনতে পারেন। এর অর্থ হ'ল মাদারবোর্ড প্রস্তুতকারককেও এ জাতীয় উল্লেখযোগ্য পরিবর্তনকে সমর্থন করতে জড়িত থাকতে হবে। নিম্ন-প্রান্তের সিস্টেমগুলি সম্ভবত এই জাতীয় পরিবর্তনের ফলে উপকৃত হবে, উচ্চ-প্রান্তের সিস্টেমে সম্ভবত যথেষ্ট ঠান্ডা লাগবে। আমি সন্দেহ করি যে গড় ল্যাপটপ যেমন একটি চিপ পরিচালনা করতে পারে।

এই জাতীয় চিপটি অনেক বেশি ব্যয়বহুল হবে, যদিও মূল মাদারবোর্ডের দাম কমবে (যদিও সম্ভবত প্রশংসাপূর্ণ নয়)। আপনি যদি কোনও ডিএমএ নিয়ামক, এবং র‌্যামের প্যাকেজগুলির জন্য প্যাকেজগুলি দেখে থাকেন তবে আপনি বিশ্বাস করতে কঠোর হবেন যে এই সমস্ত যুক্তি এককভাবে মারা যেতে পারে যা যথেষ্ট বড় হবে না। এও মনে রাখবেন যে সিপিইউগুলি একটি বিশেষ আকারের বড় ওয়েফারগুলি থেকে কাটা হয়। এর অর্থ হ'ল প্রস্তুতকারকের কাছে প্রতি ওয়েফারে কম সংখ্যক প্রসেসর থাকবে যা সামগ্রিক ব্যয়কেও বাড়িয়ে তুলবে।

মনে রাখবেন যে আমরা পুরো সিস্টেমের উপর ওয়াটেজ ব্যবহারের কথা বলছি না, যা হ্রাস পাবে, বরং এটি যে একক অঞ্চলে ওয়াটেজের আরও বেশি ঘনত্ব (এবং এইভাবে তাপ) থাকত, সম্ভবত এটির সম্ভাবনা বাড়িয়ে তোলে ব্যর্থতা.

অবশেষে, এখানে আরও একটি অসুবিধা রয়েছে এবং এটি হ'ল কাস্টমাইজড সিস্টেম সরবরাহ করার ক্ষমতা। এখনই, নির্মাতারা গ্রাহকের পছন্দের উপর ভিত্তি করে অভিন্ন প্রসেসরগুলি সহ বিভিন্ন পরিমাণের মেমরি বা বিভিন্ন প্রসেসরের সাথে একই পরিমাণের মেমোরি সহ সিস্টেম স্থাপন করতে বেছে নিতে পারেন। বিভিন্ন কনফিগারেশনের ভিড় উপস্থাপন করার জন্য, তাদের আলাদা আলাদা মেমরি গড়ে তুলতে হবে, প্রতিটিই আলাদা আলাদা সমাবেশ লাইনে।

এএমডি সক্রিয়ভাবে এমন প্রযুক্তি ব্যবহার করছে যা প্রকৃতপক্ষে সেইভাবে কাজ করে, যেখানে প্রসেসরের ডাইর প্রতিটি অংশই একটি পৃথক যুক্তিযুক্ত ইউনিট যা বিভিন্ন কনফিগারেশনের জন্য সরে যেতে পারে। ভবিষ্যতে, যদি এই জাতীয় নকশা কার্যকর হয়, আমরা সিপিইউগুলি দেখতে পেলাম যেগুলি ইন-চিপ মেমরির ব্যয়বহুল মডিউল আপগ্রেড হিসাবে প্রস্তাব দেয়, সম্ভবত বিনিময়ে কিছু প্রসেসিং শক্তি অদলবদল করে বা অন্য টুইটগুলি করে। উদাহরণস্বরূপ, একদিন আমাদের বিল্ট-ইন মেমরির 256 কোর বা বিল্ট-ইন মেমরির 128 কোরের মধ্যে বা পার্ট জিপিইউ, পার্ট সিপিইউ, পার্ট র‌্যামের মতো অন্যান্য কনফিগারেশনগুলির মধ্যে পছন্দ থাকতে পারে।


এই উত্তরের প্রধান সমস্যাটি হ'ল স্মার্টফোনের জন্য এসওসি ডিজাইনে আসলে র‌্যাম থাকে। এগুলি বেশি ব্যয়বহুল নয়, আসলে তারা সস্তা in
MSalters

@ এসএমএলটাররা বাদে তারা একই ডাইতে সংহত হয় না। মেমরিটি মারা যায় পৃথক, পরীক্ষা করা হয়েছে এবং সঠিকভাবে কাজ করার জন্য নিশ্চিত করা হয়েছে এবং মাইক্রোপ্রসেসর ডাইয়ের সাথে কেবল প্যাক করা হয়।
টুথব্রাশ

2

উপরের প্রায় সমস্ত + আরও একটি অতিরিক্ত সমস্যা: উত্তাপ।

ডিআআরএএম কোষগুলি মূলত ফুটো ক্যাপাসিটার are এবং এখানে ডাইলেট্রিকটি নিজেই সিও 2 স্তর। তাপমাত্রা বাড়ার সাথে সাথে ফুটো স্রোতগুলি আনুপাতিকভাবে বৃদ্ধি পায়। এই ডিআআরএএম কোষগুলি আরও দ্রুত স্রাব করে যার জন্য আরও দ্রুত রিফ্রেশ হারের প্রয়োজন হবে, যা জটিলতা বাড়িয়ে তুলবে, প্রয়োজনীয় বর্তমান এবং অবশ্যই আরও কিছু উত্তাপ যুক্ত করবে।


2

ইতিমধ্যে প্রদত্ত উত্তরের পাশাপাশি আরও একটি দিক রয়েছে: উত্পাদন ত্রুটির কারণে বর্জ্য:

ধরা যাক যে নির্দিষ্ট মডেলের উত্পাদিত সমস্ত সিপিইউগুলির 1/100 টি দোষযুক্ত (বাস্তবে এটি কম, অবশ্যই; 1/100 গণনা করা সহজ) এবং উত্পাদিত সমস্ত র‌্যামের 1/100 ত্রুটিযুক্ত।

যদি উভয় উপাদানই একটি একক চিপে একত্রিত হয় তবে সমস্ত চিপের 1/100 টিতে একটি ত্রুটিযুক্ত সিপিইউ এবং সমস্ত চিপের 1/100 টিতে একটি ত্রুটিযুক্ত র‌্যাম থাকবে।

এর অর্থ হবে:

  • 10000 চিপগুলির মধ্যে 1 টিতে ত্রুটিযুক্ত র‌্যাম এবং সিপিইউ উভয়ই থাকে
  • 99 চিপগুলির ত্রুটিযুক্ত র‌্যাম থাকবে
  • 99 চিপগুলির একটি ত্রুটিযুক্ত সিপিইউ থাকবে
  • উত্পাদিত 10000 অংশের সমস্ত 199 এর সমস্তই অপচয় হবে

পৃথক চিপ উত্পাদন গণনা নিম্নলিখিত এক:

  • 5000 টির মধ্যে 50 টি র‌্যাম ত্রুটিযুক্ত
  • 5000 এর 50 টি সিপিইউ ত্রুটিযুক্ত
  • উত্পাদিত 10000 অংশের 100 টি নষ্ট হবে

মনে রাখবেন যে এক জিবি র‌্যাম সাধারণত আটটি চিপ সমন্বিত একটি ব্যাঙ্ক আকারে তৈরি হয় যাতে আপনি একই চিপে র‌্যাম এবং সিপিইউ রাখতে চাইলে আপনাকে দুটি নয়, 9 টি উপাদান এক চিপে একত্রিত করতে হবে। এটি উপরের সাধারণ উদাহরণে উত্পাদিত 10000 প্রায় 865 ত্রুটিযুক্ত অংশে নিয়ে যাবে।

"আইবিএম সেল" সিপিইউগুলির ঠিক এই সমস্যা ছিল। "প্লেস্টেশন" কনসোলটিতে আংশিক ত্রুটিযুক্ত চিপ ব্যবহৃত হয়েছিল; প্লেস্টেশন সফ্টওয়্যারটি এমনভাবে লেখা হয়েছিল যাতে ত্রুটিযুক্ত কোর এবং এসআরএএম ব্যবহার করা হয়নি।


1
এএমডি একই কারণে কিছু সময়ের জন্য 3-কোর সিপিইউ সরবরাহ করে। আমি মনে করি অনুশীলনে অংশগুলি সাধারণত প্যাকেজ হওয়ার আগে ডাই লেভেলে পরীক্ষা করা হয়, তাই আপনার উদ্বেগ একতরফা সিপিইউ এবং মেমরি সংমিশ্রনের ক্ষেত্রে সর্বাধিক প্রযোজ্য।
ওলেকসান্ডার আর

ডারপা দারপা বাদে 3 ডিএসোকের ব্যবহার করে মেমরি ওয়ালকে অতিক্রম করে 50x পাওয়ার দক্ষতার জন্য একটি পুরস্কার নিয়ে এসেছিল যা দার্পা ছাড়া ডারপা ছাড়া ইন্টেল এবং কোয়ালকমের ইঞ্জিনিয়ারদের তুলনায় ফ্যান্টাসি ল্যান্ড। monolithic3d.com/blog/… এসওসির (একটি চিপের সিস্টেম) সমান্তরাল প্রসেসরের জন্য সেরা, যার অর্থ 2/16 এর পরিবর্তে 1000 টি গ্রুপ রয়েছে।
com. অপরিবর্তনীয়

1

র‌্যাম দুটি ধরণের আছে। এগুলি স্ট্যাটিক র‌্যাম এবং ডায়নামিক র‌্যাম RAM স্ট্যাটিক মেমোরি খুব দ্রুত তবে এটি আরও বেশি দামে আসে। এদিকে গতিশীল র‌্যাম স্ট্যাটিক র‌্যামের তুলনায় ধীরে ধীরে তবে স্ট্যাটিক র‌্যামের তুলনায় সস্তা ব্যয়ে আসে।

ক্যাশে মেমরি স্ট্যাটিক র‌্যামে পড়ে। আপনি দেখতে পাচ্ছেন যে তারা কেবি বা এমবি আকারে আসে। তারা দ্রুত। তবে উচ্চ ব্যয়।


ঠিক না, হ্যাঁ, তারা দ্রুত, তবে এটি মূলত কারণটি যে দূরত্বের ডেটা অবশ্যই ভ্রমণ করতে হবে তা ডিআরএএম-এর চেয়ে অনেক কম।
এশোফার

3
আসলে, এসআরএএম সেলটি দ্রুততর কারণ এটি সহজ। এটি একটি ডিজিটাল দ্বি-স্থিতিশীল সার্কিট। আপনি যদি দুর্ঘটনাক্রমে এটি এনালগ মান 0.8 এ সেট করে থাকেন তবে এটি স্থিতিশীল অবস্থানে 1.0 এ গিয়ে নিজেকে ঠিক করে দেবে। ডিআরএএম-এর মতো স্থিতিশীল রাজ্য নেই। এটি মধ্যবর্তী রাষ্ট্রগুলি থেকে সরে যায় না । সবচেয়ে খারাপ, এটি এই জাতীয় রাজ্যের দিকে এগিয়ে চলেছে, এজন্য আপনার অতিরিক্ত সংশোধক "রিফ্রেশ" সার্কিটের প্রয়োজন।
MSalters

@ এসএমএলটার্স: এসআরএএম সেলটি ডিআরএএম সেলের চেয়ে সহজ নয়। আপনি ঠিক বলেছেন যে এটি অনেক বেশি স্থিতিশীল, যা এটিকে সহজতর করে তোলে (উভয়কে সার্কিটরী এবং টাইমিং ডায়াগ্রাম সমর্থন করার ক্ষেত্রে)। তবে এসআরএএম কোষগুলি ডিআরএএম হিসাবে বিট প্রতি প্রায় 6 গুণ বেশি সার্কিটরি।
বেন ভয়েগট

1
@ বেনভয়েগ: ট্রানজিস্টর গণনায়, হ্যাঁ - 6 টি বনাম 1 টি। তবে ডিআরএএম এর একটি ক্যাপাসিটার রয়েছে যা বেশ বিজোড় উপাদান। এসআরএএম হ'ল কেবল ট্রানজিস্টর একসাথে তারযুক্ত।
MSalters

ডিআরএএম-তে ক্যাপাসিটারটি ট্রানজিস্টর হিসাবে প্রয়োগ করাও হতে পারে
বেন ভয়েগট

1

উল্লিখিত অন্যান্য কারণগুলি ছাড়াও অনেক সিস্টেমে একাধিক সিপিইউ কোর থাকে। এমন সময়ে যখন মূল ডিআরএএম-এ সংরক্ষিত তথ্যগুলি সমস্ত ক্যাশেড অনুলিপিগুলির সাথে সামঞ্জস্যপূর্ণ হয়, সমস্ত প্রসেসরের যে সমস্ত তথ্যে ক্যাশে থাকে না তার কাছে এটির সমান অ্যাক্সেস থাকবে। কিছু আর্কিটেকচার এই ধারণাটিকে ঘিরে তৈরি করা হয়েছে যে প্রতিটি সিপিইউ কোর বেশ কয়েকটি ঠিকানা স্পেসের "মালিকানাধীন" করবে এবং এমনকি যদি কোনও সিপিইউ অন্য প্রসেসরের মালিকানাধীন মেমরিটি অ্যাক্সেস করতে সক্ষম হয় তবে এই ধরণের অ্যাক্সেসগুলি তার নিজস্ব স্মৃতিতে অ্যাক্সেসের চেয়ে অনেক ধীর গতিতে হবে , তবে x86 সাধারণত এ জাতীয় ফ্যাশনে প্রয়োগ করা হয় না।

যদি কোনও সিস্টেম এই ধারনাটির আশেপাশে তৈরি করা হয়েছিল যে প্রসেসর কোরগুলির নির্দিষ্ট ঠিকানা ব্যাপ্তির মালিকানাধীন রয়েছে এবং কোডটিতে অন্যান্য প্রসেসরের অ্যাড্রেস রেঞ্জের ব্যবহারকে হ্রাস করার চেষ্টা করা উচিত, তবে প্রতিটি প্রসেসরের কোডটিতে অন-চিপ মেমরির উদার পরিমাণ অন্তর্ভুক্ত করা বোধ করা উচিত। এ জাতীয় নকশা প্রসেসর কোরের নিজস্ব স্মৃতিতে অ্যাক্সেসের জন্য প্রয়োজনীয় সময় কমিয়ে দিতে পারে তবে অন্য প্রসেসরের স্মৃতিতে অ্যাক্সেস করার জন্য এটি সম্ভবত প্রয়োজনীয় সময় বাড়িয়ে তুলবে। সিস্টেমটি যেমন অনুমানের আশেপাশে তৈরি না করা হয়, তবে, সম্ভবত এটি কখন প্রয়োজন ছিল তা বিবেচনা না করে ডেটা প্রসেসরের মধ্যে বিতরণ করা হবে। অন্য কোনও সিপিইউ থেকে বনাম কোনও অ্যাক্সেসের জন্য অতিরিক্ত সময় প্রয়োজন (বনাম একটি বাহ্যিক মেমরি সিস্টেম) কোনও অভ্যন্তরীণ অ্যাক্সেসে সময় সাশ্রয়ের চেয়ে অর্ধেক বেশি হলেও,

যদি আজকালকার প্রযুক্তির সাথে মানানসই জন্য কেউ স্ক্র্যাচ থেকে কোনও সিস্টেম ডিজাইন করছিলেন তবে একটি অ-ইউনিফর্ম মেমরি আর্কিটেকচার তার চেয়ে বেশি "বাকের জন্য ঠাঁই" দিতে পারে যার জন্য সমস্ত প্রসেসরকে দক্ষতার সাথে সমস্ত মেমরি অ্যাক্সেস করার অনুমতি দেওয়া দরকার। আজকের সফ্টওয়্যার ডিজাইনগুলি দেওয়া, তবে, প্রসেসরের মধ্যে ভাগ করা একটি বাহ্যিক মেমরি সিস্টেম থাকা প্রসেসরগুলিতে নিজের মধ্যে বাল্ক ডেটা স্টোরেজ করার চেষ্টা করার চেয়ে বেশি দক্ষ হতে উপযুক্ত।


2
অ-ইউনিফর্ম মেমরি আর্কিটেকচারগুলি ইতিমধ্যে ব্যবহৃত (এবং এমনকি সাধারণ)। একাধিক প্রসেসর সিস্টেমে ইন্টিগ্রেটেড মেমোরি কন্ট্রোলার সহ একটি সিপিইউর জন্য, অন্য প্রসেসরের শারীরিক মেমরির মধ্যে থাকা ডেটা স্থানীয়ভাবে সংযুক্ত র্যামের চেয়ে উচ্চতর ল্যাটেন্সির সাথে আরও দূরবর্তী এবং অ্যাক্সেসযোগ্য। অনুশীলনে, এই সিস্টেমে যা ঘটে তা হ'ল প্রসেসরগুলি অতিরিক্ত স্তরের ক্যাশে সজ্জিত থাকে এবং সংযোজনীয় ফ্যাব্রিক দ্বারা আংশিকভাবে সামঞ্জস্য ট্র্যাফিক পরিচালিত হয়। POWER7 এবং POWER8 এই ধরণের।
ওলেকসান্ডার আর

1

যদিও পূর্ববর্তী সমস্ত উত্তরগুলি সিপিইউতে আরও মেমরি যুক্ত করা কেন এতটা কঠিন তা নির্দেশ করার ক্ষেত্রে সঠিক, তবে এটিও সত্য যে আধুনিক সিপিইউগুলিতে প্রচুর স্মৃতি রয়েছে।

রিয়েল-টাইম ক্রিয়াকলাপগুলিতে যখন নির্বিচারে বিলম্ব গুরুত্বপূর্ণ তখন কোড এবং / বা ডেটার জন্য অন-চিপ ক্যাশে ঠিকানাযোগ্য মেমরি হিসাবে ব্যবহার করা শোনা যায় না। সুবিধাটি দ্রুত এবং অবিচ্ছিন্ন অ্যাক্সেসের সময় এবং অসুবিধাটি হ'ল অন চিপ মেমরিটি বেশ সীমিত।


1

আপনার মূল প্রশ্নে আপনি যে সমস্যাগুলি বর্ণনা করেছেন তা কেবল এড়ানো যেতে পারে যদি মেশিনে থাকা সমস্ত স্মৃতি সিপিইউতে অন্তর্ভুক্ত থাকে। মূল বোর্ডের স্লটগুলির মাধ্যমে মেশিনে যুক্ত হওয়া কোনও অতিরিক্ত মেমরি আপনার বর্ণিত একই বিলম্বের বিষয় হতে পারে এবং সিপিইউ / র‌্যাম এবং অনবোর্ড র‌্যামের মধ্যে মার্শালিং এবং লজিক নিয়ন্ত্রণ ডিভাইসগুলির প্রয়োজন হবে।

র‌্যাম সস্তার এবং ব্যবহারকারীরা তাদের সিপিইউ আপগ্রেড করার মধ্যে সাধারণত এক বা দ্বিগুণ প্রসারিত করে।

এছাড়াও মনে রাখবেন যে একটি সাধারণ "আনুন" কলটি করবে, এমনকি যদি র‌্যাম সিপিইউ ঘড়ির গতিতে চলছে, সিপিইউতে বেশ কয়েকটি নিষ্ক্রিয় টিক্স দেয়।

একটি মেশিনে মেমরির Theতিহ্যবাহী সংগঠনটি পিরামিড যা সিপিইউ রেজিস্টারগুলির সাথে শীর্ষে থাকে, তারপরে ক্যাশে, তারপরে র‌্যাম এবং তারপরে ডিস্ক থাকে। সাধারণত যে মেশিনগুলি ভাল সম্পাদন করে তাদের একটি শালীন ঘড়ির গতি, যুক্তিসঙ্গত পরিমাণ ক্যাশে, প্রচুর পরিমাণে র‍্যাম এবং একটি উচ্চ গতির হার্ড ডিস্ক (বা অ্যারে) এর সংমিশ্রণ থাকে। সাম্প্রতিক বছরগুলিতে, ডিস্ক পারফরম্যান্স সাধারণত বেশিরভাগ পিসির এবং উচ্চ আরপিএম ডিস্কগুলিতে সেরা পারফরম্যান্স উত্সাহ দেয়, ক্যাশে এবং সলিড স্টেট ডিস্ক সহ ডিস্কগুলি একটি ভাল কর্মক্ষমতা বাড়িয়ে তোলে।

হ্যাঁ, চিপে তার সমস্ত র‌্যামযুক্ত একটি মেশিন আধুনিক অ্যাপ্লিকেশনগুলিতে ভাল পারফর্ম করবে তবে মানক অপারেটিং সিস্টেম চালানো চিপটিতে এর কিছুটা র‌্যামযুক্ত একটি মেশিন সম্ভবত আপনি যে পারফরম্যান্স বাড়িয়েছেন তা ভাবতে পারে না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.