সিপিইউ ক্যাশে মেমরি এত দ্রুত কেন?


58

মূল স্মৃতি থেকে এত দ্রুত সিপিইউ ক্যাশে মেমরিটি কী করে? টায়ার্ড ক্যাশে সিস্টেমে আমি কিছু সুবিধা দেখতে পাচ্ছি। এটি বুঝায় যে একটি ছোট ক্যাশে অনুসন্ধান করা দ্রুত is তবে এটি আরও কিছু আছে।


2
মূল স্মৃতি বলতে কী বোঝ ?
মার্চকস 0 '12

1
@ মার্কোকগুলি স্বচ্ছতার জন্য সম্পাদিত। আমি সিপিইউ ক্যাশে মেমরি এবং প্রধান সিস্টেম মেমোরি উল্লেখ করছি, বেশিরভাগ মাদারবোর্ডে অপসারণযোগ্য ডিমেস।
কন্ডিশন


2
@ratchetfreak উহ ... ওপি খুব স্পষ্টতই একটি চূড়ান্ত কারণ নয়, একটি অনুমানের কারণ জিজ্ঞাসা করছে।
কাইল স্ট্র্যান্ড

1
বাহ আমি কখনই আমার কম্পিউটার ইঞ্জিনিয়ারিং ডিগ্রি ব্যবহার করব তা ভাবিনি। গৃহীত উত্তরটি আসলে কোনও উত্তর নয়। এটি কারণ সিপিইউ ক্যাশে অনেক বেশি ক্লক রেট (সিপিইউ ক্লক রেট, প্রায় 4GHz) এর সাথে পরিচালিত হয়, যখন মূল স্মৃতি বাস ক্লক রেটে (প্রায় 1600MHz) চালিত হয়। কেবল তা-ই নয়, সিপিইউ ক্যাশে 4 টি ক্লকচক্র পড়তে পারে তবে সিস্টেম র‌্যামে 100 টি সিস্টেম ক্লক চক্র লাগতে পারে। এছাড়াও, সিস্টেম র‌্যামের ডিস্ক বা নেটওয়ার্কের মতো অন্যান্য পেরিফেরিয়ালের সাথে যুক্তি রয়েছে, যখন সিপিইউ ক্যাশে নিবেদিত। তারের দৈর্ঘ্য যত দ্রুত গতিবেগের সাথে এটি চালিয়ে যেতে পারে clock tinyurl.com/zkdsstd
ক্লো

উত্তর:


115

সিপিইউ ক্যাশের ক্ষেত্রে এটি দ্রুত হয় কারণ এটি প্রসেসরের মতো একই মরে যায়। অন্য কথায়, অনুরোধ করা ডেটা প্রসেসরের কাছে ঝাঁকিয়ে পড়তে হবে না; এটি ইতিমধ্যে আছে।

হার্ড ড্রাইভে ক্যাশের ক্ষেত্রে এটি দ্রুত হয় কারণ এটি শক্ত অবস্থার স্মৃতিতে রয়েছে এবং এখনও ঘোরানো প্ল্যাটারগুলিতে নেই।

কোনও ওয়েবসাইটে ক্যাশের ক্ষেত্রে এটি দ্রুততর হয় কারণ ডেটাবেস থেকে ইতিমধ্যে ডেটা পুনরুদ্ধার করা হয়েছে (যা কিছু ক্ষেত্রে বিশ্বের যে কোনও জায়গায় অবস্থিত হতে পারে)।

সুতরাং এটি বেশিরভাগ লোকাল সম্পর্কে । ক্যাশে ডেটা স্থানান্তর পদক্ষেপ সরিয়ে দেয়।

স্থানীয় সময়কাল বা স্পেসে "একসাথে থাকা" ডেটা বলার অভিনব উপায় Local একটি ছোট, দ্রুত (তবে সাধারণত বেশি ব্যয়বহুল) মেমরির সাহায্যে ক্যাচিং কাজ করে কারণ সাধারণত সামগ্রিক ডেটার তুলনামূলকভাবে সামান্য পরিমাণই সেই ডেটা হয় যা প্রায়শই অ্যাক্সেস করা হয়।

উইকিপিডিয়ায় আরও পড়ার
ক্যাশে (কম্পিউটিং)


29
আমি মনে করি এটি একটি ভাল উত্তর। যাইহোক, এটি যোগ করার মতো হতে পারে যে ক্যাশেটির জন্য ব্যয়ক্রমক্রমও রয়েছে: স্থানীয় হার্ড ড্রাইভের তুলনায় নেটওয়ার্ক স্টোরেজ সস্তা, যা র্যামের চেয়ে সস্তা, অন-সিপিইউ ক্যাশে থেকে অনেক সস্তা। এটি যদি এর জন্য না হয় আমরা কেবলমাত্র 120 গিগাবাইট মেমরি অন চিপ সহ সিপিইউগুলি তৈরি করতাম এবং এটি দিয়ে হয়ে যাই।
চার্লস ই। গ্রান্ট

1
@ কনডিশনরেসার: একই কারণ এল 1 দ্রুত, তবে আরও ব্যয়বহুল, সুতরাং তারা আপনাকে খুব ব্যয়বহুল এল 1 এর সামান্য পরিমাণ দেয়, এবং আরও কম ব্যয়বহুল, তবে ধীর L2 দেয়। এছাড়াও দেখুন স্ট্যাকওভারফ্লো.com
রবার্ট হার্ভে

9
"এল 1 এর চেয়ে দ্রুত এল 1 কেন" - প্রশ্নটি প্রোগ্রামারদের জন্য বিষয়বস্তু হয়ে
দাঁড়ায় SEএসই

5
@ কনডিশনরেসার আইআইআরসি, এটি মেমোরিটি বাস্তবায়নের জন্য ব্যবহৃত প্রযুক্তির সাথে কাজ করে। আমি মনে করি এল 2 অন-চিপ ডিআআরএম, যেখানে এল 1 এসআরএএম বা এর মতো কিছু; অনেক বেশি ব্যয়বহুল, তবে আরও দ্রুত। আমি সিপিইউ ডিজাইনে কাজ করার এক দশক পেরিয়ে গেছে…
ডোনাল ফেলো

4
@ চার্লস.গ্রান্ট: যদিও ব্যয়ক্রমক্রমটি একটি ভাল উদাহরণ, অন্যদিকে আমাদের অন-চিপ 120 গিগা নেই: আরও বড় মেমরির ঠিকানা দেওয়ার জন্য আরও বড় ঠিকানা প্রয়োজন, তাই হয় বৃহত্তর নির্দেশাবলী বা আরও বেশি সিপিইউ চক্র। তাই দ্রুত হতে গেলে, নিবন্ধকের সংখ্যা তুলনামূলকভাবে কম থাকতে হবে। অবশ্যই, একজনের নিবন্ধগুলি ছাড়াও অন-চিপ মেমরি থাকতে পারে তবে দ্রুততম স্তরটি ছোট থাকতে হবে, অন্যথায় এটি আর দ্রুত হবে না।
vsz

33

এটি দ্রুত কারণ এটি উভয়ই কাছাকাছি এবং এটি SRAM হ'ল DRAM নয়।

এসআরএএম হ'ল এবং ডিআআরএমের চেয়ে মান দ্রুতগতিতে হতে পারে মানগুলি স্ট্যাটিকালি রাখা হয় ( এস র‍্যামে থাকা এস ) যাতে তাদের সতেজ হওয়া দরকার না যা চক্র সরিয়ে নিয়ে যায়। ড্রাম গতিশীল, ছোট রিচার্জেবল ব্যাটারির মতো, আপনার নিয়মিত রিচার্জ করতে হবে যাতে সেগুলি সরিয়ে না যায় এবং জিরো না হয়ে যায়। আপনাকে কীভাবে বিটগুলি অ্যাক্সেস করতে হবে তা ছাড়াও এই চক্রের সময়টি চুরি করে

প্রসেসরের রাউন্ড ট্রিপ হ্রাস বা নিকটবর্তী হিসাবে একই মরণে থাকাকালীন, L1 এবং L2 উভয়ই অ্যাক্সেসের দৃষ্টিকোণ থেকে ডিআরএএম এর চেয়ে দ্রুত।

ডিআরএএম আপেলগুলিতে নিয়ে যাওয়া আপেলের চেয়ে এসআরএএম দ্রুতগতিতে রয়েছে এবং ডিআরএএম এর চেয়ে অ্যাক্সেসের সময়কে আরও দ্রুততর করে তুলতে ক্যাচগুলি সাধারণত চিপ বা কাছাকাছি বা দ্রুত বাসে থাকে।


1
এসআরএএম বিট প্রতি আরও ক্ষুধার্ত, তাই আপনাকে এটিতে রেডিয়েটারগুলি যুক্ত করতে হবে এবং ব্যাটারি চালিত যে কোনও কিছুতেই ক্ষতি হতে পারে।
9000

1
এসআরএএমকে আরও বড় করে তোলা একে ওয়ে ধীর করে দেয় mention
দারখোগ

সম্মত, আরও শক্তি, এবং অন্যান্য শ্রমের তুলনায় ধীর। আমি মনে করি এটি শ্রমের জন্য বিট প্রতি 4 এবং ট্রামের জন্য বিট প্রতি 1 ট্রানজিস্টর। ড্রাম ভ্রূণের ক্যাপাসিটেন্সের উপর নির্ভর করে, যেখানে শ্রম ভাল পুরানো ফ্যাশন যুক্তির উপর নির্ভর করে। সুতরাং আপনাকে সেই সমস্ত ট্রানজিস্টরকে সর্বদা শক্তি দিতে হবে এবং পর্যায়ক্রমে কেবল চার্জটি পাম্প না করে।
old_timer

4
ক্যাশে থাকা এসআরএএম সাধারণত 4 টি নয়, 4 টি হয়। এছাড়াও, এসআরএএম (অবশ্যই 6 টি ভেরিয়েন্ট) আরও শক্তি দক্ষ। ডিআআরএমে আসল পাওয়ার অঙ্কন হ'ল রিফ্রেশ চক্র এবং এসআরএ্যামের কেবল এটির দরকার নেই। এসআরএএম ট্রানজিস্টরগুলি স্যুইচ করার সময় শক্তি আঁকেন, ডিআরএএম ক্যাপাসিটার সমস্ত সময় ফাঁস হয়। আপনি যদি ডিআরএএমের ফুটো ক্যাপটি প্রতিস্থাপন করেন তবে আপনি ইপ্রোমের সাথে সমাপ্ত হন তবে এটি দ্রুত নয়: চার্জটি ফাঁস করা যদি শক্ত হয় তবে এটিকে স্বাভাবিক উপায়ে বের করাও শক্ত।
এমসাল্টাররা

@ বাসিন্দা সিএমওএস এফইটিটিগুলি খোলা বা বন্ধ অবস্থায় থাকলে বিদ্যুৎ নিষ্কাশন করে না, তাই বিদ্যুৎ খরচ সম্পর্কে যুক্তিটি অবৈধ। তদতিরিক্ত, এটি সিএমওএস লজিক স্যুইচিং, যা সিপিইউগুলিকে তাদের বেশিরভাগ শক্তি নিষ্কাশন করে তোলে - বর্তমানের শিখরগুলি মধ্যবর্তী অবস্থায় (নন -1 এবং অ-0), তাই আপনি যা বলছেন তার থেকে বিপরীত পরিস্থিতি :)
রুসলান

21

একটি বিষয় যা স্পষ্টভাবে উল্লেখ করা উচিত তা হ'ল আলোর গতির প্রভাব। ইন এই ভিডিওটি গ্রেস ফড়িং পা দীর্ঘ, এটি আবার কতদূর একটি বৈদ্যুতিক সংকেত এক ন্যানোসেকেন্ড ভ্রমণ করতে পারেন * সম্পর্কে টেলিগ্রাম এক টুকরা দেখায়। যদি কোনও সিপিইউ 3 জিএইচজেডে কাজ করে, তবে এটি প্রতি ঘড়ির চক্রের 4 "দূরত্ব বোঝায় memory এটি মেমরির অ্যাক্সেসের গতিতে একটি কঠোর শারীরিক সীমা। এটি সিপিইউয়ের নিকটবর্তী হওয়ার কেন একটি বৃহত অংশ (এল 1 ক্যাশে হিসাবে রয়েছে), অনুমতি দেয় মেমরি দ্রুত হতে।

সম্পাদনা * আসলে শূন্যতায় আলো কত দূর যেতে পারে, তামা / সিলিকনের মধ্য দিয়ে দূরত্ব কম is


2
তামা জন্য হার্ড সীমা। যদিও এটি একটি ভাল বিষয়, আমি কতটা হাস্যকরভাবে দ্রুত আধুনিক প্রসেসর তা বিবেচনা করি নি।
কন্ডিশন

@ কনডিশনরেসার আমি কেবল একটি সংশোধন করেছি, ১১.৮ ইঞ্চি শূন্যতায় হালকা।
ম্যাথু ফিনলে

2
আপনার এই সংখ্যাটি অর্ধেক করা দরকার যেহেতু আপনার স্মৃতি পুনরুদ্ধারের জন্য একটি রাউন্ড ট্রিপ দরকার। সুতরাং এটি ভ্যাকুয়ামের বিলম্বের চক্রের জন্য কেবল 5 সেমি নয় ।
কোডসইনচাওস

2
আলোর গতি হ'ল কেন কয়েক বছর আগে মূল স্মৃতি বাসের ঘড়িটি দ্রুতগতিতে থেমেছিল (2000ish?) এটি সরাসরি প্রভাব নয় - এটি সিএমওএসের যুক্তির সংকেতগুলি বাসের ফ্রিকোয়েন্সিগুলিতে আর নিখুঁত বর্গাকার তরঙ্গ না হওয়ার সাথে করতে হয় - তবে সি শো গণিতে শীর্ষস্থানীয়।
zwol

5

অন্যান্য উত্তরগুলি ইতিমধ্যে সমস্ত প্রাসঙ্গিক বিটগুলি কভার করেছে: স্থানীয়তা (এবং সম্পর্কিত ডেটা ট্রান্সফার ব্যয়, বাসের প্রস্থ এবং ঘড়ি এবং এই জাতীয়); আলোর গতি (আবার, স্থানান্তর ব্যয় এবং বাসের প্রস্থ এবং থ্রুপুট সম্পর্কিত); বিভিন্ন মেমরি প্রযুক্তি (এসআরএএম বনাম ডিআরাম)। এগুলি সমস্তই ব্যয় / পারফরম্যান্সের ভারসাম্যের আলোকে ।

একটি বিট যা বাকি ছিল এবং এটি স্রেফ দারখোগ মন্তব্যে উল্লেখ করা হয়েছে: বৃহত্তর ক্যাশেগুলি ভাল হারের হারের চেয়ে বেশি তবে দীর্ঘসূত্রতা রয়েছে। একাধিক স্তরের ক্যাশে যেখানে এই ট্রেড অফকে সম্বোধন করার জন্য প্রবর্তিত হয়েছিল।

ইলেক্ট্রনিক্স এসই- তে এই বিষয়টিতে একটি দুর্দান্ত প্রশ্নোত্তর রয়েছে

উত্তরগুলি থেকে, আমার কাছে মনে হয় যে একটি বিষয় হাইলাইট করা হবে তা: যে ক্যাজিক পড়ার জন্য প্রয়োজনীয় সমস্ত ক্রিয়াকলাপ সম্পাদন করে সে যুক্তিটি এত সহজ নয় (বিশেষত যদি ক্যাশে বর্তমানে বেশিরভাগ ক্যাশের মতো সেট-অ্যাসোসিয়েটিভ হয়)। এটির জন্য দরজা এবং যুক্তি প্রয়োজন। সুতরাং, এমনকি যদি আমরা ব্যয় এবং মৃত্যুর স্থানটি বাতিল করি

যদি কেউ একটি হাস্যকর আকারে বড় এল 1 ক্যাশে প্রয়োগের চেষ্টা করে তবে ক্যাশে পড়ার জন্য প্রয়োজনীয় সমস্ত ক্রিয়াকলাপ সম্পাদনকারী যুক্তিটিও বড় হয়ে উঠত। এক পর্যায়ে, এই সমস্ত যুক্তি দিয়ে প্রচারের বিলম্ব খুব দীর্ঘ হবে এবং যে ক্রিয়াকলাপগুলি আগে একটি মাত্র ঘড়ি চক্র নিয়েছিল তা বেশ কয়েকটি ঘড়ির চক্রে বিভক্ত হতে হয়েছিল। এই বিলম্ব বৃদ্ধি হবে।


5

অন্যান্য উত্তরে প্রচুর ভাল পয়েন্ট উত্থাপিত হয়েছে, তবে একটি ফ্যাক্টর অনুপস্থিত বলে মনে হচ্ছে: ঠিকানা ডিকোডিংয়ের বিলম্ব cy

মেমরি অ্যাড্রেস ডিকোডিং কীভাবে কাজ করে তার একটি বিস্তৃত ওভারসিম্প্লিফিকেশন নীচে দেওয়া হয়েছে, তবে এটি কেন বড় ডিআআরএএম চিপগুলি সাধারণত বেশ ধীর হয়ে যায় তার একটি ভাল ধারণা দেয়।

প্রসেসরের যখন মেমরি অ্যাক্সেসের প্রয়োজন হয় তখন এটি নির্দিষ্ট শব্দটি ব্যবহার করতে চায় তা চয়ন করতে মেমরি চিপকে একটি কমান্ড প্রেরণ করে। এই কমান্ডটিকে একটি কলাম ঠিকানা নির্বাচন বলা হয় (আমরা আপাতত সারি ঠিকানাগুলি উপেক্ষা করব)। মেমরি চিপকে এখন অনুরোধ করা কলামটি সক্রিয় করতে হবে, যা কলামের সমস্ত কক্ষের সাথে সংযোগ স্থাপন করে এমন একক লিখন তৈরি করার জন্য ঠিকানাটি যুক্তি গেটগুলির একটি ক্যাসকেড লিখে পাঠিয়েছে। এটি কীভাবে কার্যকর করা হয়েছে তার উপর নির্ভর করে ফলাফলের অন্য প্রান্তটি বের না হওয়া পর্যন্ত প্রতিটি ঠিকানার জন্য নির্দিষ্ট পরিমাণে বিলম্ব হবে। একে মেমরির সিএএস লেটেন্সি বলা হয়। যেহেতু সেই বিটগুলি ক্রমানুসারে পরীক্ষা করতে হবে, এই প্রক্রিয়াটি প্রসেসরের চক্রের থেকে অনেক বেশি সময় নেয় (যার জন্য অপেক্ষা করার জন্য সাধারণত কয়েকটি ট্রানজিস্টর থাকে)। এটি একটি বাস চক্রের তুলনায় অনেক বেশি সময় নেয় (যা সাধারণত একটি প্রসেসরের চক্রের চেয়ে কয়েকগুণ ধীর হয়)। একটি সাধারণ মেমোরি চিপের একটি সিএএস কমান্ড সম্ভবত 5ns এর আদেশ গ্রহণ করতে পারে (আইআইআরসি - আমি সময় দেখলাম অনেকক্ষণ হয়ে গেছে), এটি প্রসেসরের চক্রের চেয়ে ধীর গতির আকারের চেয়ে বেশি।

সৌভাগ্যক্রমে, আমরা তিনটি অংশে (কলাম, সারি এবং ব্যাংক) ঠিকানাগুলি ভাঙ্গি যা প্রতিটি অংশকে ছোট হতে দেয় এবং সেই অংশগুলি একযোগে প্রক্রিয়া করতে পারে, অন্যথায় বিলম্ব আরও দীর্ঘ হয়।

প্রসেসর ক্যাশে অবশ্য এই সমস্যা নেই। এটি কেবলমাত্র অনেক ছোট নয়, সুতরাং ঠিকানা অনুবাদ করা একটি সহজ কাজ, এটি ঠিকানার কোনও ছোট অংশের চেয়ে বেশি অনুবাদ করার দরকার নেই (কিছু রূপে, এর কোনওটিই নয়) কারণ এটি সহযোগী। এর অর্থ মেমরির প্রতিটি ক্যাশেড লাইনের পাশাপাশি, অতিরিক্ত মেমরি কোষ রয়েছে যা ঠিকানার অংশ (বা সমস্ত) সঞ্চয় করে। স্পষ্টতই এটি ক্যাশেটিকে আরও ব্যয়বহুল করে তোলে, তবে এর অর্থ হল যে সমস্ত কক্ষগুলি একই সাথে আমাদের মেমরির নির্দিষ্ট রেখার অনুরোধ করতে পারে কিনা তা জানতে জিজ্ঞাসা করা যেতে পারে এবং তারপরে কেবলমাত্র একমাত্র (আশাবাদী) সঠিক ডেটা রয়েছে তা এটিকে ছুঁড়ে ফেলবে see একটি বাসে যা পুরো মেমোরিটিকে মূল প্রসেসরের কোরের সাথে সংযুক্ত করে। এটি একটি চক্রের চেয়ে কম ক্ষেত্রে ঘটে কারণ এটি অনেক সহজ is


-2

আমি যে দর্শনের দ্বারা অধ্যয়ন করেছি তার মধ্যে একটি হ'ল সর্বাধিক-মাধ্যমে-সর্বনিম্ন-হার্ডওয়্যার আন্দোলন যখন আমরা কোনও ক্যাশে ভিত্তিক মেমরির বিষয়ে কথা বলি, সে উদ্দেশ্যে সিপিইউ ক্যাশে, বাফার ক্যাশে বা মেমরি ক্যাশে হোক be তথ্য পুনরুদ্ধার / পড়া / লেখার জন্য কমপক্ষে বা কোনও হার্ডওয়্যার চলাচল এবং অপারেশনটি দ্রুত সম্পন্ন করা হয় যখন মূল উদ্দেশ্যটি অর্জন করা হয়।

ডিস্ক থেকে ডেটা স্থানান্তর করে -> প্রধান মেমরি (র‌্যাম) (অস্থায়ী স্টোরেজ) -> সিপিইউ ক্যাশে (প্রায়শই অ্যাক্সেস করা ডেটার জন্য সিপিইউর নিকটে ছোট অস্থায়ী স্টোরেজ) -> সিপিইউ (প্রক্রিয়াজাতকরণ)।

সিপিইউ ক্যাশে একটি ছোট, দ্রুত মেমরির স্থান যা সর্বাধিক ব্যবহৃত প্রধান মেমরি অবস্থান থেকে ডেটার অনুলিপি সঞ্চয় করে।

বাফার ক্যাশে একটি প্রধান মেমরি অঞ্চল যা সর্বাধিক ব্যবহৃত ডিস্কের অবস্থানগুলি থেকে ডেটার অনুলিপি সঞ্চয় করে।

ব্রাউজার ক্যাশে ডিরেক্টরি বা অনুরূপ স্থান যা ব্যবহারকারীদের দ্বারা সর্বাধিক পরিদর্শন করা ওয়েবসাইটগুলি থেকে ডেটার অনুলিপি সঞ্চয় করে।

তথ্যসূত্র: কম্পিউটার মেমরি কীভাবে কাজ করে


"অপারেটিং সিস্টেমের দর্শন ..." - এটি কি কেবল আপনার মতামত বা আপনি কোনওভাবে এটিকে ব্যাক আপ করতে পারেন?
gnat

মরিস বাখের ইউনিক্স অধ্যয়নকালে এ সম্পর্কে শেখানো হয়েছিল। দুর্ভাগ্যক্রমে কোনও সহায়ক ডকুমেন্টেশন নেই। সম্পাদিত ..
রোশন 4074

5
নির্ভরযোগ্য প্রযুক্তিগত তথ্য পাওয়ার জন্য হাউস স্টাফওয়ার্কস কুখ্যাতভাবে বিশ্বাসযোগ্য নয়। গড় জো ও জেন বুঝতে পারে এমন স্থূল সরলীকরণের জন্য তারা দুর্দান্ত but তবে এটি সম্পর্কে।
27 এ jwenting
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.