সার্ভার-শ্রেণীর হার্ডওয়্যারটির জন্য কি বার্ন-ইন র‌্যাম প্রয়োজন?


31

অনেক সার্ভার-ক্লাস সিস্টেমগুলি ইসিসি র‌্যামের সাথে সজ্জিত রয়েছে তা বিবেচনা করে , তাদের মোতায়েনের আগে মেমরি ডিআইএমএম বার্ন-ইন করা কি প্রয়োজনীয় বা দরকারী ?

আমি এমন পরিবেশের মুখোমুখি হয়েছি যেখানে সমস্ত সার্ভার র‌্যাম দীর্ঘতর বার্ন-ইন / স্ট্রেস-টেস্টিং প্রক্রিয়াটির মধ্য দিয়ে রাখা হয়। এটি উপলক্ষে সিস্টেম মোতায়েনকে বিলম্ব করেছে এবং হার্ডওয়্যার নেতৃত্বের সময়কে প্রভাবিত করে।

সার্ভারের হার্ডওয়্যারটি মূলত সুপারমিক্রো , তাই বিভিন্ন বিক্রেতার কাছ থেকে র‌্যাম উত্সাহিত হয়; ডেল পাওয়ারেডজ বা এইচপি প্রোলিয়েন্টের মতো সরাসরি প্রস্তুতকারকের কাছ থেকে নয় ।

এটি কি দরকারী অনুশীলন? আমার অতীত অভিজ্ঞতায় আমি বাক্সের বাইরে কেবল বিক্রেতার র‌্যাম ব্যবহার করেছি। পোষ্ট মেমরি পরীক্ষাগুলি ডিওএ মেমরি ধরা উচিত নয় ? ডিআইএমএম আসলে ব্যর্থ হওয়ার অনেক আগে ইসিসির ত্রুটিগুলিতে আমি প্রতিক্রিয়া জানালাম, ইসি প্রান্তিকতা সাধারণত ওয়ারেন্টি স্থাপনের জন্য ট্রিগার ছিল।

  • আপনি কি আপনার র‌্যামে জ্বলছেন?
  • যদি তাই হয়, আপনি পরীক্ষাগুলি করতে কোন পদ্ধতি (গুলি) ব্যবহার করেন?
  • এটি স্থাপনার আগে কোনও সমস্যা চিহ্নিত করেছে?
  • বার্ন-ইন প্রক্রিয়াটির ফলে কোনও অতিরিক্ত প্ল্যাটফর্ম স্থায়িত্ব বনাম সেই পদক্ষেপটি সম্পাদন করা হয়নি?
  • যখন আপনি কি করবেন যোগ একটি বিদ্যমান চলমান সার্ভারে র্যাম?

উত্তর:


25

আমি সার্ভার মেমোরির সাথে কীভাবে তারা কাজ করে সে সম্পর্কে বিশদভাবে একটি দস্তাবেজ পেয়েছি , আমি বিশ্বাস করি যে এই প্রক্রিয়াটি সাধারণত বেশিরভাগ পরিচিত নির্মাতাদের জন্য একই রকম হয়। মেমোরি চিপস পাশাপাশি সমস্ত সেমিকন্ডাক্টর ডিভাইসগুলি একটি নির্দিষ্ট নির্ভরযোগ্যতা / ব্যর্থতার ধরণ অনুসরণ করে যা বাথটব কার্ভ নামে পরিচিত:

এখানে চিত্র বর্ণনা লিখুন

সময়টি অনুভূমিক অক্ষে প্রতিনিধিত্ব করা হয়, কারখানার চালান দিয়ে শুরু করে এবং তিনটি স্বতন্ত্র সময়কাল ধরে চালিয়ে যাওয়া:

  • প্রাথমিক জীবন ব্যর্থতা: বেশিরভাগ ব্যর্থতা প্রাথমিক ব্যবহারের সময়কালে ঘটে থাকে। যাইহোক, সময় হিসাবে, ব্যর্থতার সংখ্যা দ্রুত হ্রাস পায়। আর্লি লাইফ ব্যর্থতার সময়কালে, হলুদ রঙে দেখানো হয়, প্রায় 3 মাস।

  • দরকারী জীবন: এই সময়কালে, ব্যর্থতা অত্যন্ত বিরল। দরকারী জীবনকালটি নীল রঙে দেখানো হয়েছে এবং এটি 20+ বছর বলে অনুমান করা হয়।

  • জীবনের শেষ ব্যর্থতা: অবশেষে, অর্ধপরিবাহী পণ্যগুলি পরিধান করে এবং ব্যর্থ হয়। জীবনের শেষ সময় সবুজ দেখানো হয়

এখন কারণ কিংস্টন উল্লেখ করেছে যে উচ্চ ব্যর্থতা-হার প্রথম তিন মাসে ঘটবে (এই তিন মাস পরে ইউনিটটি ইওল প্রায় 15 - 20 বছর পরে না হওয়া পর্যন্ত ভাল বলে বিবেচিত হবে)। তারা কেটি 2400 নামে একটি ইউনিট ব্যবহার করে একটি পরীক্ষা ডিজাইন করেছিল যা উচ্চ ভোল্টেজের 100 ডিগ্রি সেলসিয়াসে 24 ঘন্টা সার্ভার মেমরি মডিউলগুলি নির্মমভাবে পরীক্ষা করে , যার দ্বারা প্রতিটি ডিআরএএম চিপের সমস্ত কোষ অবিরাম ব্যবহার করা হয়; এই উচ্চ স্তরের স্ট্রেস টেস্টিংয়ের মডিউলগুলি কমপক্ষে তিন মাসের মধ্যে বৃদ্ধ হওয়ার প্রভাব রয়েছে (যেমন সমালোচনামূলক সময়ের আগে উল্লেখ করা হয়েছে যেখানে বেশিরভাগ মডিউল ব্যর্থতা দেখায়)।

ফলাফলগুলি ছিল:

2004 সালের মার্চ মাসে, কিংস্টন ছয় মাসের একটি পরীক্ষা শুরু করেছিলেন যেখানে এর সার্ভার মেমরির 100 শতাংশ কেটি 2400 তে পরীক্ষা করা হয়েছিল। ব্যর্থতার পরিবর্তন পরিমাপ করতে ফলাফলগুলি নিবিড়ভাবে পর্যবেক্ষণ করা হয়েছিল। ২০০৪ সালের সেপ্টেম্বরে, সমস্ত পরীক্ষার ডেটা সংকলন ও বিশ্লেষণের পরে, ফলাফলগুলি দেখায় যে ব্যর্থতাগুলি 90 শতাংশ কমেছে। এই ফলাফলগুলি প্রত্যাশা ছাড়িয়ে গেছে এবং এমন একটি পণ্যের লাইনের জন্য উল্লেখযোগ্য উন্নতির প্রতিনিধিত্ব করে যা ইতিমধ্যে তার শ্রেণীর শীর্ষে ছিল।

সুতরাং কেন মেমরিতে জ্বলন্ত সার্ভার মেমরির জন্য দরকারী নয়? সহজ, কারণ এটি ইতিমধ্যে আপনার প্রস্তুতকারকের দ্বারা সম্পন্ন হয়েছে!


10
চিপ প্রস্তুতকারক, এবং এমনকি সার্ভার বিক্রেতাও কিছু চিপ পরীক্ষা করতে পারে । তবে ব্যয় হ্রাস করার জন্য আজকের দিনগুলিতে এমএসটি উপাদানগুলি কেবল নমুনা-পরীক্ষিত। এমনকি যদি আপনার চিপস বা পুরো ডিআইএমএম একবার পরীক্ষা করা হয়েছিল, তবে এটি আপনাকে জানায় না যে যোগাযোগ বা পিসিবি সমাবেশ বা শিপিংয়ের সময় কোনওভাবে টুইট করা বা গণ্ডগোল হয়েছে কিনা। আমাদের দুটি আলাদা সার্ভারের মেমরির সমস্যা রয়েছে, দুটি ভিন্ন সার্ভার বিক্রেতাদের বাইরে থাকা-বাক্সের বাইরে box যদি তারা এটি উত্পাদন করে তোলে, ইসিসি আমাদের বাঁচাতে পারে, কিন্তু নীরব ডাটাবেসের দুর্নীতিরও ফল হতে পারে।
rmalayter

7
এই বাথটাব বক্রতা কেবলমাত্র অর্ধপরিবাহী জন্য নয়। হার্ড ড্রাইভ, SSDs, শক্তি সরবরাহ (প্রধানত কারণ ক্যাপাসিটারগুলিকে এর), ভক্ত, ইত্যাদি: বেশীরভাগ মান নিয়ন্ত্রণ কোন ডিগ্রী নির্মিত উপাদান এটি অনুসরণ
voretaq7

6
ইলেক্ট্রনিক্সে আমি কখনই বর্ধিত ওয়ারেন্টি কিনে না দেওয়ার একটি কারণ এটি। ডিভাইস (বা উপাদান) হয় প্রথম কয়েক মাসে ব্যর্থ হতে চলেছে বা তার জীবদ্দশায় স্থায়ী হবে। এটি এও দেখায় যে খারাপ আপেলগুলি তাড়াতাড়ি ছড়িয়ে দেওয়া কেন এত গুরুত্বপূর্ণ, যাতে আপনি যত তাড়াতাড়ি সম্ভব মসৃণ নৌযানটিতে যেতে পারেন।
আতারি 911

@ rmalayter সুতরাং আপনি যে কোনওভাবে র‌্যাম পোড়ানোর পক্ষে পরামর্শ দিবেন?
ew white

2
হ্যাঁ, আমি পরীক্ষা করব। স্মারকটি বুট করতে কয়েক ঘন্টা বা তার বেশি সময় লাগে এবং এটি 384 জিবি র‌্যাম চেক করতে দেয়। আমরা একই স্টোরেজ আইওমিটার ব্যবহার করে সমস্ত স্টোরেজ সাবসিস্টেমগুলিতে বার্ন করি। গত বেশ কয়েকটি বছর ধরে বার্ন-ইন চলাকালীন বেশ কয়েকটি RAID কন্ট্রোলার বা ড্রাইভের মৃত্যু হয়েছিল, যদিও তারা ওএস ইনস্টলের সময় প্রাথমিকভাবে সূক্ষ্মভাবে কাজ করেছিল। কখনও কখনও এটি একটি খারাপ ফার্মওয়্যার জিনিস ছিল, কখনও কখনও RAID নিয়ামকটিতে ত্রুটিযুক্ত ক্যাশে র‌্যাম ছিল, কখনও কখনও এটি ছিল "কে জানে - এটি আরএমএ!"
rmalayter

30

না।

হার্ডওয়ারে জ্বলনের লক্ষ্য হ'ল এটি একটি উপাদানটির ব্যর্থতা অনুঘটক করার পর্যায়ে চাপ দেওয়া।

যান্ত্রিক হার্ড ড্রাইভ দিয়ে এটি করার ফলে কিছু ফলাফল পাওয়া যাবে, তবে এটি র‌্যামের জন্য খুব বেশি কিছু করবে না। উপাদানটির প্রকৃতি এমন যে পরিবেশগত কারণগুলি এবং বয়স র‌্যামে পড়া এবং লেখার চেয়েও ব্যর্থতার কারণ হতে পারে (এমনকি এটি কয়েক ঘন্টা বা দিনের জন্য সর্বোচ্চ ব্যান্ডউইদথেও) হতে পারে।

ধরে নিলে আপনার র‌্যাম যথেষ্ট উচ্চমানের যে সোল্ডার আপনাকে প্রথমবার ব্যবহার শুরু করার আগে গলে যাবে না, বার্ন-ইন প্রক্রিয়া আপনাকে ত্রুটিগুলি খুঁজে পেতে সহায়তা করবে না।


15

আমরা ব্লেড কিনে থাকি এবং আমরা সাধারণত একটি সময়ে তাদের যুক্তিসঙ্গত বৃহত ব্লকটি কিনে থাকি, যেমন আমাদের নেটওয়ার্ক বন্দরগুলি প্রস্তুত / সুরক্ষিত হওয়ার আগে আমরা সেগুলিতে প্রবেশ করি এবং তাদের সাথে ডে-ইএসের মাধ্যমে ইনস্টল করি। সুতরাং আমরা সেই সময়টি প্রায় ২৪ ঘন্টার জন্য স্মৃতি ব্যবহার করতে ব্যবহার করি, কখনও কখনও যদি এটি সপ্তাহান্তের চেয়ে বেশি সময় ধরে যায় - এটি হয়ে গেলে আমরা বেসিক ESXi স্প্রে করি এবং নেটওয়ার্কটি শেষ হয়ে গেলে তার হোস্ট প্রোফাইলটি প্রয়োগ করার জন্য আইপি প্রস্তুত। সুতরাং হ্যাঁ আমরা এটি পরীক্ষা করে দেখি, প্রয়োজনের তুলনায় সুযোগের বাইরে কিন্তু এটি আগে কয়েকটা ডিওএ ডিআইএমএম ধরা পড়েছে, এবং এটি শারীরিকভাবে আমি করছি না তাই এটি আমার কোনও প্রয়াস লাগে না। আমি এর জন্য আছি


3
একটি "সুযোগের পরীক্ষা" অর্থবোধ করে - সুযোগটি দিলে আমি এটি করতাম। যদি এটি মোতায়েনে বিলম্ব করতে চলেছে তবে আমি একটি খারাপ ডিআইএমএম এবং
ইসির

2
যদি আপনি স্থাপনার পরিকল্পনার পরীক্ষাটি তৈরি করেন তবে আপনি নিজেই সময়টি কিনে নিয়েছেন, আপনি যদি যত দ্রুত সম্ভব সবকিছু করেন তবে পরবর্তী সময়ে আপনি নিজেকে সমালোচনার জন্য দাঁড় করিয়ে দিচ্ছেন। আপনি যখনই পারেন
শক্ত

@ চপার্পার 3 সুতরাং আপনি যদি কোনও নীতি প্রতিষ্ঠা করেন তবে তা কি সর্বদা করবেন? , এটা কি? বা যখন আপনি করতে পারেন?
ew white

@ নিউ হোয়াইট - আমি দ্বিতীয়টি বলব, যদিও আমরা স্ট্যান্ডার্ড মোতায়েনের পরিকল্পনায় ইঞ্জিনিয়ার প্রবণতা রাখি, তাই প্রতিবারই এটি খুব সম্ভবত।
চপার 3

11

ভাল আমি অনুমান করি এটি আপনার প্রক্রিয়াগুলি ঠিক কী তার উপর নির্ভর করে। আমি কোনও সিস্টেমে রাখার আগে মেমোস্টেস্ট 86 চালিয়ে যাই (সার্ভার বা অন্যথায়)। আপনার সিস্টেম আপ এবং চলমান পরে, ত্রুটিযুক্ত মেমরির কারণে সমস্যাগুলি সমস্যা সমাধান করা কঠিন হতে পারে।

আসলে "স্ট্রেস-টেস্টিং" মেমরির জন্য; আপনি এখনও ওভারক্লকিংয়ের উদ্দেশ্যে পরীক্ষা না করে কেন এটি কার্যকর হবে তা এখনও আমার কাছে এখনও দেখা যায়নি।


মেমটেষ্ট 86 আপনাকে কী বলে? এই পদ্ধতিটি ব্যবহার করে কোনও সার্ভারে ইনস্টল করার আগে আপনি কি র‌্যামের সমস্যা খুঁজে পেয়েছেন?
ew white

4
আমি মেমটেস্ট 86 + এর সাথে অনেকগুলি ত্রুটি পেয়েছি যা BIOS এবং উইন্ডোজ মেমরি ডায়াগোনস্টিকসটি খুঁজে পাবে না। আমি এটি উচ্চ প্রস্তাব। হ্যাঁ, ইসিসি একই ত্রুটিগুলি খুঁজে পাবে, তবে একটি স্মৃতিচিহ্ন আপনাকে সময়ের আগে সমস্ত কিছু খুঁজে পেতে সহায়তা করবে।
ওভেন জনসন

6
মেমোস্টেস্ট আপনাকে জানাতে দেবে যে মেমরির অভ্যন্তরগুলিতে কোনও ত্রুটি রয়েছে কিনা। এটি কোনও ত্রুটি ট্রিগার করার প্রয়াসে মেমোরিতে বাইটের র্যান্ডম সেট পাশাপাশি বাইটগুলির নিদর্শনগুলি সংরক্ষণ করে এটি করে। মেমরিটি ভাল কিনা তা আপনাকে জানাতে প্রোগ্রামটি "পাস" চালাতে পারে তবে কেবলমাত্র নিশ্চিত করার জন্য আমি সাধারণত রাতারাতি একাধিক পাস চালাই। মেমটেষ্টের সুন্দর জিনিসটি হ'ল এটি আমাকে বলে যে আমি সিস্টেম স্থাপনের আগে স্মৃতিশক্তি খারাপ কিনা। এটি অনেকবার একটি আরএমএ ট্রিগার করেছে এবং আমাকে প্রচুর মাথা ব্যাথা থেকে বাঁচিয়েছে। মেশিনটি একবার এসএমএতে একটি ব্যথা আরএমএর কাছে মেমোরিতে স্থান করে দিলে।
আতারি 911

2
@ ওভেন জনসন সাধারণত যখন আপনি মেমটেষ্ট 86 (+) চালান আপনি মেশিনটি উত্পাদনের আগে এই ইসিসি ত্রুটিগুলি ট্রিগার করবেন বলে আশা করছেন :-)
ভোরেটাক 7

6

আমি তা করি না তবে আমি এমন লোকদের দেখেছি যারা করে। আমি কখনও এগুলি থেকে কিছুই লাভ করতে দেখিনি, যদিও আমি মনে করি এটি সম্ভবত হ্যাংওভার বা কুসংস্কার হতে পারে।

ব্যক্তিগতভাবে, আমি আপনার মতোই আছি যে ইসিসির ত্রুটি হারগুলি আমার পক্ষে বেশি কার্যকর - ধরে নিচ্ছি র‌্যাম ডিওএ নয় তবে আপনি তা কোনওভাবেই জানতে পারবেন।


6

নন-ইসিসি র‌্যামের জন্য মেমেস্ট ৮86 + এ 30 মিনিটের জন্য চালানো কার্যকর কারণ সিস্টেমটি চলমান অবস্থায় সাধারণত বিট-ত্রুটিগুলি সনাক্ত করার কোনও নির্ভরযোগ্য পদ্ধতি নেই।
নীল-স্ক্রিনিংকে নির্ভরযোগ্য পদ্ধতি হিসাবে বিবেচনা করা হয় না ...
এবং সামান্য ফ্ল্যাশযুক্ত র্যাম প্রায়শই তাত্ক্ষণিকভাবে প্রদর্শিত হয় না, কেবলমাত্র সিস্টেমটি কিছু পূর্ণ-মেমরি লোড দেখে এবং তারপরে কেবল তখনই যদি সেই র্যামের ডেটা কোড হয় যা ব্যবহার করা হয়েছিল এবং তারপর ক্র্যাশ। ডেটা-দুর্নীতি দীর্ঘ সময়ের জন্য অলক্ষিত হতে পারে।

ইসিসি র‌্যামের জন্য মেমরি নিয়ামক নিজে যা করবেন না এটি কিছুই করবে না এটি সত্যিকার অর্থে বোঝায় না। এটি কেবল সময়ের অপচয়।

আমার অভিজ্ঞতার মধ্যে যারা জ্বলতে জোর দেয় তারা সাধারণত পুরানো ছেলেরা যারা সর্বদা এটি করে থাকে এবং যারা সত্যকে সত্য সত্য চিন্তা না করে অভ্যাসের বাইরে রেখে চলেছে।
বা তারা পুরানো ছেলেদের দ্বারা লিখিত নির্ধারিত পদ্ধতি অনুসরণ করে তরুণ ছেলেরা।


খারাপ জ্ঞান, প্রজন্ম ধরে জুড়ে?
ew white

হ্যাঁ, যতদূর আমি জানি @ এবং আমি একটি বিএসসি আছে। কম্পিউটার হার্ডওয়্যার টেকনোলজিতে, তাই আমি কী সম্পর্কে বলব তা জানতে হবে :-)
টনি

থ্রেডে দেখানো হয়েছে এমন সমস্ত ঘটনা বাদে যারা আসলে ত্রুটিগুলি খুঁজে পেয়েছিল। এছাড়াও, যদি এটি সুস্পষ্ট না হয় তবে উত্পাদনে কোনও সার্ভার নেওয়ার আগে 24x7 এ চলমান একটি ডিবি সার্ভারে র্যামের প্রতিস্থাপনের আগে অংশগুলি অদলবদল করার মধ্যে পার্থক্য রয়েছে। যদি না ভেবে থাকেন যে এটি "গ্রোন্ড ত্রুটি" এবং অন্য প্রত্যেকেই পুরানো এবং কার্গো কাল্ট স্টাফ করছেন তবে এটি এখনও প্রোড সার্ভারটি অফলাইনে থাকার ক্ষতির কারণ হতে পারে।
ফ্লোরিয়ান হেইগল

1
@ ফ্লোরিয়ান হিগল আমি এর জন্য র‍্যামে জ্বলন্ত পক্ষপাতী করি না, তবে কমপক্ষে ২৪ ঘন্টার মধ্যে স্ট্রেস-টেস্ট না করে আমি কোনও সার্ভার উত্পাদন করার ক্ষেত্রে কখনও সমর্থন করব না। র‌্যাম সাধারণত সমস্যা হয় না। ফ্লেকি এইচডিডি, রেড কন্ট্রোলার, আইপিএমআই কার্ড, বিদ্যুৎ সরবরাহ, সিপিইউ, ভিআরএম এর ... আমি সব দেখেছি। (এবং প্রায়শই সার্ভার প্রাথমিক ইনস্টলটি ঠিক জরিমানা থেকে বেঁচে থাকে the এটি ভারী এবং / অথবা হিথ যে এটি যখন সত্যিই কাজ করতে হয় তখন তা করে))
টনি

3

এটা নির্ভর করে.

যদি আপনি ৫০,০০০ টি নতুন র‌্যাম নিযুক্ত করে থাকেন এবং আপনি জানেন যে এই নির্দিষ্ট হার্ডওয়্যারটি এক দিনেরও কম সময় পরিচালনার পরে 0.01% ব্যর্থতার হার রয়েছে, তবে পরিসংখ্যানগতভাবে বলতে গেলে তাদের মধ্যে বেশিরভাগই প্রথম দিনে ব্যর্থ হবে। পোড়ানো মানেই তা ধরা। সেই স্কেল মোতায়েনের সাথে, ব্যর্থতা আশা করা হয়, ব্যতিক্রমী পরিস্থিতি নয়।

আপনি যদি কয়েক শতাধিক আইটেম স্থাপন করছেন তবে ব্যর্থ অংশগুলি পেতে আপনার পক্ষে অবশ্যই খুব দুর্ভাগ্য হতে হবে statistics


আপনি একটি পয়েন্ট পেয়েছেন। বিটিটি আসুন এটির মুখোমুখি হোন, আমাদের বেশিরভাগই কখনও বড় মোতায়েন করতে পারে না। (যদি আপনি কোনও নতুন গুগল ডেটা-কেন্দ্র তৈরি না করেন)) আমাদের মধ্যে বেশিরভাগ সাধারণত একই সময়ে প্রায় 5 থেকে 10 সার্ভার স্থাপন করে। আমি ব্যক্তিগতভাবে সবচেয়ে বড়টি হ'ল 16 টি ইএসএক্স নোড (4x 4-নোড ক্লাস্টার) যা প্রত্যেকে 8 টি ডিআইএমএম নিয়েছিল took এটি 3 বছর আগে এবং তখন থেকে 1 ডিআইএমএম ব্যর্থ হয়েছিল (2 মাস আগে)। একই মেশিনগুলিতে 5 পাওয়ার-সাপ্লাই প্রতিস্থাপন করতে হয়েছিল। ইতিমধ্যে এক সপ্তাহ পরে প্রথম 1। তবে এইগুলি এইচপি প্রোলিয়েন্টস হিসাবে আমরা সাজানোর তা প্রত্যাশা করেছি। (এইচপি এবং পাওয়ার-সরবরাহ .. আমাকে শুরু করবেন না ...)
টনি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.