এটি আপনার সার্ভারের হার্ডওয়ারের উপর নির্ভর করে। একটি হোয়াইটবক্স বা একটি সুপার মাইক্রো সিস্টেম ডেল, এইচপি বা আইবিএম এর চেয়ে আলাদাভাবে এটি পরিচালনা করবে ...
হাই-এন্ড সার্ভারগুলির মান-যুক্ত বৈশিষ্ট্যগুলির মধ্যে একটি হ'ল হার্ডওয়্যার / ওএস সংহতকরণের একটি স্তর রয়েছে। উন্নত সার্ভারগুলি ম্যানেজমেন্ট এজেন্ট এবং / অথবা-অফ-ব্যান্ড ম্যানেজমেন্ট সলিউশন (আইএলও, ডিআরএসি, আইপিএমআই) এর অংশ হিসাবে আপনি যা খুঁজছেন তা প্রতিবেদন করবে।
আপনার হার্ডওয়্যার প্ল্যাটফর্মের নেটিভ সরঞ্জামগুলি ব্যবহার করা উচিত।
লিনাক্স এবং এইচপি ম্যানেজমেন্ট এজেন্টগুলির দ্বারা চালিত এইচপি প্রোলিয়েন্ট সার্ভারের অংশ:
Trap-ID=6056
ECC Memory Correctable Errors detected.
এবং
Trap-ID=6052
Advanced ECC Memory Engaged
বা আরও গুরুতর
Trap-ID=6029
A correctable memory log entry indicates a memory module needs to be
replaced.
বা সবচেয়ে খারাপ ... 6 দিনের জন্য ত্রুটি উপেক্ষা করে সার্ভারটি খারাপ র্যামের কারণে ক্রাশ না হওয়া অবধি
0004 Repaired 22:21 12/01/2008 22:21 12/01/2008 0001
LOG: Corrected Memory Error threshold exceeded (Slot 1, Memory Module 1)
0007 Repaired 02:58 12/07/2008 02:58 12/07/2008 0001
LOG: POST Error: 201-Memory Error Single-bit error occured during
memory initialization,
Board 1, DIMM 1. Bank containing DIMM(s) has been disabled.
0008 Repaired 19:31 12/08/2009 19:31 12/08/2009 0001
LOG: ASR Detected by System ROM
এগুলি লগ করা হয়েছিল, এবং এসএনএমপি ট্র্যাপগুলি এবং ইমেলগুলি প্রেরণ করা হয়েছিল।
জেনারিক্যালি, আপনি কার্নেল রিং বাফারে মেশিন চেক ব্যতিক্রমগুলি দেখতে পাবেন, যাতে আপনি mcelog পরীক্ষা করতে dmesg
বা চালাতে পারেন । আইপিএমআই ছাড়াই সুপারমাইক্রো গিয়ারের সাথে আমার অভিজ্ঞতাগুলিতে, যা সমস্ত কিছু ধরেনি, এবং আমার এখনও র্যামের ত্রুটিগুলি ফাটল ধরে আছড়ে পড়েছিল এবং আক্রমণের কারণ ঘটেছে। দুর্ভাগ্যক্রমে, এটি সিস্টেম মোতায়েনের আগে প্রত্নতাত্ত্বিক র্যাম বার্ন-ইন নীতিগুলি নিয়েছিল।