ইসিসি ম্যাম কী এবং এটি আরও ভাল কেন?


31

আমি সার্ভারগুলিতে ইসিসি র‌্যাম ব্যবহার সম্পর্কে দ্বিধা প্রকাশ করেছি। কেন এটা ভাল?


2
অন্য প্রশ্নের উত্তরে প্রশ্নের জবাব দেওয়া হয়েছে: serverfault.com/questions/5817/…
sh-beta

ইসির মেমরিটি ব্যবহার করার জন্য প্রয়োজনীয় বা উপকারী এমন কোনও প্রমাণ আছে কি? কার্যকারিতা এবং কার্যকারিতাটি বোঝা সহজ, তবে আমি এর ব্যবহারকে ন্যায়সঙ্গত করার পক্ষে প্রমাণ কখনও শুনিনি।
ড্রু স্টিফেন্স

এবং এই জাতীয় স্মৃতি (বিট) ত্রুটিগুলি অনুভব করে বিভিন্ন সম্ভাব্য পরিণতিগুলি কী কী? উদাহরণস্বরূপ, আমি মাত্র একটি সার্ভার স্যুইচড অফ করেছি যা অনলাইনে 5 বছরের জন্য নন-স্টপ (ইসিসি র‌্যাম সহ) ছিল, এবং সামগ্রিকভাবে সব ঠিকঠাক হয়েছে, আমার কাছে সেখানে হোস্ট করা ক্লায়েন্টদের কাছ থেকে কোনও অভিযোগ ছিল না বা কখনও কোনও বড় অভিজ্ঞ হয়েছে এর সাথে দোষ ... আমার ডেস্কটপ কম্পিউটারের অভিজ্ঞতার সাথে একই - এখানে একটি বিএসওড এবং খুব কমই দেখা যায়, তবে এটি কি সব? :)
ডেনিস ভলভিক

@ ডেনিস, আমি মনে করি আপনি যদি লোকেরা আপনার প্রশ্নের উত্তর দিতে চান তবে আপনাকে এটির মন্তব্যের পরিবর্তে পৃথক প্রশ্ন হিসাবে জিজ্ঞাসা করতে হতে পারে।
টবি অ্যালেন

উত্তর:


28

ইসিসি র‌্যাম প্যারিটি বিট ব্যবহার করে বিটের ছোট ত্রুটিগুলি থেকে পুনরুদ্ধার করতে পারে। যেহেতু সার্ভারগুলি একটি শেয়ার্ড রিসোর্স যেখানে আপ-টাইম এবং নির্ভরযোগ্যতা গুরুত্বপূর্ণ, ইসিসি র‌্যাম সাধারণত দামের মধ্যে কেবলমাত্র একটি সামান্য পার্থক্য সহ ব্যবহৃত হয়। ইসি র‌্যাম সিএডি / সিএএম ওয়ার্কস্টেশনগুলিতেও ব্যবহৃত হয় সামান্য বিট ত্রুটিগুলি গণনার ভুল হতে পারে যা কোনও ডিজাইন উত্পাদন করতে গেলে আরও তাত্পর্যপূর্ণ সমস্যা হয়ে ওঠে।


5
কারওর ছোট ব্যবসা অর্থ প্যাকেজ সহ অন্য কোথাও সংখ্যায় কিছুটা ত্রুটি খুব ছোট বা খুব বড় হতে পারে । এটি সব কি বিট উপর নির্ভর করে।
Zan Lynx 21

আপনি যখন একত্রীকরণের ভার্চুয়ালাইজ করেছেন তখন ভুল জায়গায় ভুল ত্রুটিটি একাধিক মেশিনকে নামিয়ে আনতে পারে এই বিষয়টি যুক্ত করুন।
মাইকিবি

1
আমি কেবল একটি বেscমান সংস্থার জন্য অপেক্ষা করছি যে তাদের অ্যাকাউন্টিং জালিয়াতি দাবি করা আসলে আসলে কিছুটা ত্রুটি ছিল।
এলফ

29

দুর্দান্ত বাস্তব-বিশ্ব গবেষণা:

বন্য অঞ্চলে ড্রাম ত্রুটি: একটি বৃহত্তর স্কেল ফিল্ড স্টাডি (পিডিএফ)

এই কাগজটি ক্ষেত্রে ডিআরএএম মেমরির ত্রুটিগুলির প্রথম বৃহত আকারের অধ্যয়ন সরবরাহ করে। এটি গুগলের সার্ভার বহর থেকে দুই বছরেরও বেশি সময় ধরে বহু মিলিয়ন ডিআইএমএম দিন তৈরির তথ্য সংগ্রহ করে। আমাদের গবেষণায় ডিআআরএএম একাধিক বিক্রেতা, ডিআরএএম ঘনত্ব এবং প্রযুক্তিগুলি (ডিডিআর 1, ডিডিআর 2, এবং এফবিডিআইএম) কভার করে।

কাগজটি নিম্নলিখিত প্রশ্নগুলিকে সম্বোধন করে: কম সোম সোম ব্যবহারে স্মৃতি ত্রুটি কিভাবে? তাদের পরিসংখ্যানগত বৈশিষ্ট্য কি? তারা তাপমাত্রা এবং সিস্টেমের ব্যবহারের মতো বাহ্যিক কারণগুলি দ্বারা কীভাবে প্রভাবিত হয়? এবং চিপ-ঘনত্ব, মেমরি প্রযুক্তি এবং ডিআইএমএম বয়সের মতো চিপ-নির্দিষ্ট কারণগুলির সাথে কীভাবে সেগুলি আলাদা হয়?

আমরা দেখতে পেয়েছি যে ক্ষেত্রের DRAM ত্রুটিগুলি সাধারণত অনুমানের থেকে খুব আলাদা আচরণ করে। উদাহরণস্বরূপ, আমরা ডিআরএএম ত্রুটি হারগুলি পর্যবেক্ষণ করি যা পূর্বের প্রতিবেদনের চেয়ে বেশি মাত্রার অর্ডার, প্রতি এমবিট প্রতি 25,000 থেকে 70,000 এবং প্রতি বছর আক্রান্ত ডিআইএমএম-এর 8% এরও বেশি দ্বারা ফিফের হার (বিলিয়ন ডিভাইস ঘন্টা প্রতি সময় ব্যর্থতা) with আমরা দৃ strong় প্রমাণ সরবরাহ করি যে মেমরি ত্রুটিগুলি নরম ত্রুটির পরিবর্তে হার্ড ত্রুটিগুলির দ্বারা প্রাধান্য পেয়েছে, যা বেশিরভাগ পূর্ববর্তী কাজ ফোকাস করে। আমরা দেখতে পেলাম যে ক্ষেত্রের ডিআইএমএম এর ত্রুটি আচরণকে প্রভাবিত করে এমন সমস্ত কারণগুলির মধ্যে তাপমাত্রার একটি আশ্চর্যজনকভাবে ছোট প্রভাব রয়েছে। অবশেষে, সাধারণভাবে ভীত হওয়ার বিপরীতে, আমরা DIMM- র নতুন প্রজন্মের সাথে প্রতি-ডিআইএমএম ত্রুটির হার বাড়ার কোনও ইঙ্গিত পর্যবেক্ষণ করি না।

আকর্ষণীয় যে বেশিরভাগ মেমরির ত্রুটিগুলি শক্ত ছিল - হার্ড মেমরি ত্রুটিগুলি অপরিবর্তনযোগ্য নয়, যার অর্থ মেমরিটিকে শারীরিকভাবে ব্যর্থ হিসাবে প্রতিস্থাপন করতে হবে , অন্যদিকে নরম মেমরির ত্রুটিগুলি সঠিক মান সহ মেমরির ওভাররাইট করে ঠিক করা যেতে পারে। এটি আমাকে বোঝায় যে ইসিসির মান মোটামুটি সীমিত।

দুটি ধরণের ত্রুটি রয়েছে যা মেমোরি সিস্টেমে সাধারণত দেখা দিতে পারে। প্রথমটিকে পুনরাবৃত্তিযোগ্য বা শক্ত ত্রুটি বলা হয়। এই পরিস্থিতিতে, হার্ডওয়ারের একটি অংশটি নষ্ট হয়ে গেছে এবং ধারাবাহিকভাবে ভুল ফলাফলগুলি প্রত্যাবর্তন করবে। কিছুটা আটকে থাকতে পারে যাতে এটি সর্বদা উদাহরণস্বরূপ "0" ফিরিয়ে দেয়, তাতে যাই লেখা আছে তা বিবেচনা করেই। হার্ড ত্রুটিগুলি সাধারণত আলগা মেমরির মডিউলগুলি, ফুঁকানো চিপস, মাদারবোর্ড ত্রুটিগুলি বা অন্যান্য শারীরিক সমস্যা নির্দেশ করে indicate এগুলি নির্ধারণ করা সহজ এবং সঠিক কারণ তারা ধারাবাহিক এবং পুনরাবৃত্তিযোগ্য repeat

গবেষণায় থাকা সমস্ত সার্ভারের মতো শব্দগুলি ইসিসি ব্যবহার করেছে, সুতরাং আমরা ইসিসি বনাম, নন-ইসিসি ত্রুটি হারগুলি জানতে পারি না ..

এই কাগজটি পণ্য সার্ভারের একটি বড় বহরে ড্রাম ত্রুটির ঘটনা এবং বৈশিষ্ট্যগুলি অধ্যয়ন করে। আমাদের গবেষণাটি 2 বছরেরও বেশি সময় ধরে সংগৃহীত ডেটার উপর ভিত্তি করে একাধিক বিক্রেতাদের, প্রজন্মের, প্রযুক্তি এবং সক্ষমতাগুলির ডিআইএমএমগুলি কভার করে। সমস্ত ডিআইএমএম কমপক্ষে একক বিট ত্রুটিগুলি সংশোধন করতে ত্রুটি সংশোধন যুক্তি (ইসিসি) দিয়ে সজ্জিত ছিল।


5
+1 সুন্দর প্রতিবেদন। যদিও আমি নন-ইসিসি ত্রুটি হার জানি না, তবুও আমি অনুমান করি যে নন-ইসিসি ত্রুটি হারগুলি প্রায় জিবি প্রতি ইসিসি ত্রুটি হারের মতো। ব্যবহৃত একই র‌্যাম চিপগুলি ইসিসি এবং নন-ইসিসি ডিআইএমএম উভয় ক্ষেত্রে ব্যবহৃত হয় (ইসিসি ডিআইএমএমগুলি কেবল 9/8 হিসাবে অনেকগুলি চিপ ব্যবহার করে - raw৪ টি বিট ডেটা শব্দ সংরক্ষণের জন্য raw২ টি কাঁচা মেমরি বিট এবং 8/9 ত্রুটির হার মোটামুটি একই ত্রুটি হার), এবং আমি কোনও কারণ দেখতে পাচ্ছি না যে কোনও ইসি ডিসিম ডিআইএমএম বনাম যখন ইসি-নন-ইসিসি ডিআইএমএম স্থাপন করা হয় তখন কোনও র‌্যাম চিপের একটি আলাদা ত্রুটি হার থাকে।
ডেভিড ক্যারি

9

সমতা ছাড়াই ইসিসির বিভিন্ন সুবিধা রয়েছে। একটির জন্য, এটি সিঙ্গল-বিট ত্রুটিগুলি সনাক্ত এবং মেরামত করতে পারে এবং পুরো সিস্টেমটি বন্ধ না করেই এটি করতে পারে। একাধিক-বিট ত্রুটিগুলি এখনও একটি সাম্য ত্রুটি ফিরিয়ে দেবে, তবে স্মৃতি নিজেই ত্রুটিযুক্ত না হলে এই ঘটনার প্রতিক্রিয়াগুলি কোনও পিসির জীবদ্দশায় জ্যোতির্বিজ্ঞানগতভাবে কম হয়। ইসিসি অটো বীমাের মতো: এটি আপনাকে বেশিরভাগ জিনিসের জন্য কভার করে যা ভুল হতে পারে, তবে এটি কোনও মাল্টি-গাড়ী পাইলআপ প্রতিরোধ করতে পারে না।

আরও বিশদ এখানে: ইসিসি মেমরি: একটি সার্ভারের জন্য অবশ্যই ডেস্কটপ পিসিগুলির জন্য নয়


1
আমি নিবন্ধটির সাথে একমত নই। আমি মনে করি সবাইকে ইসিসি ব্যবহার করা উচিত। আমি দিতে যাচ্ছিলাম না তবে আমি একটি নতুন কোর আই 7 চাই যা আমি শেষ পর্যন্ত করেছিলাম। তবে আমি নিশ্চিত যে আমার 6 গিগাবাইট র‍্যাম সমস্ত জায়গাতে ত্রুটি বাছাই করছে।
জ্যান লিংস 21

4
@ জাজান এবং এই ত্রুটিগুলি সম্পর্কে আপনি "নিশ্চিত", তাদের কী পরিণতি হবে?
জেফ আতউড

অনুমান করবেন না; সংশোধনযোগ্য ত্রুটিগুলি এমএসইগুলি হেনরেট করা উচিত যা ওএস-এ লগ ইন করা যায় (লিনাক্সে সিস্টেম লগ ইন, / ভের / লগ / এমসেলোগ)
মাইকিবি

@ জেফএটউড: সাধারণত কিছুই হয় না, তবে কোনও স্পষ্ট কারণ ছাড়াই আমার মাঝে মাঝে নীল পর্দা ছিল। সিস্টেম আমি যার উপর না ইসিসি আছে আমি প্রতি মাসে একক বিট ত্রুটি একটি দম্পতি দেখতে হবে।
ঝ্যান লিংস

@ জেফএটউড: এবং আমি নিশ্চিত প্রত্যেকের মতো আমাকে মাঝে মধ্যে একটি অ্যাপ্লিকেশন পুনরায় ইনস্টল করতে হয়েছিল (অফিস। ভিজ্যুয়াল স্টুডিও।) কারণ এটি দৃশ্যত উন্মাদ হয়ে গেছে। অ্যাপ্লিকেশন বাগ বা ইসিসি ত্রুটির কারণে কোনও দূষিত ডিস্ক ফাইল তৈরি হচ্ছে? আপনার ইসি না থাকলে কে জানে?
ঝ্যান লিংস

5

বিষয়গুলি সহজ করার জন্য, উইকিপিডিয়া থেকে উদ্ধৃত :

কোনও কম্পিউটার সিস্টেমের অভ্যন্তরে বৈদ্যুতিক বা চৌম্বকীয় হস্তক্ষেপের ফলে একক বিস্তৃত DRAM স্বতঃস্ফূর্তভাবে বিপরীত অবস্থায় চলে যেতে পারে। প্রাথমিকভাবে মনে করা হয়েছিল যে এটি মূলত চিপ প্যাকেজিং উপাদানের দূষক দ্বারা নির্গত আলফা কণাগুলির কারণে হয়েছিল, তবে গবেষণা [5] থেকে দেখা গেছে যে ডিআরএএম চিপসে বেশিরভাগ ওয়ান অফ ("নরম") ত্রুটিগুলি পটভূমির বিকিরণের ফলে ঘটেছিল
...
এই বিটগুলি শোষণ করে এমন অতিরিক্ত মেমরি বিট এবং মেমরি নিয়ামকগুলিকে অন্তর্ভুক্ত করে ডিআআরএএম মডিউল ব্যবহার করে এই সমস্যা হ্রাস করা যেতে পারে। এই অতিরিক্ত বিট সমতা রেকর্ড করতে বা ত্রুটি-সংশোধনকারী কোডটি ব্যবহার করতে ব্যবহৃত হয়

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.