হার্ডওয়্যার RAID নিয়ামক ক্যাশে ব্যাটারি ব্যর্থতা ফ্রিকোয়েন্সি / আজীবন?


14

আমি এমন একটি পরিবেশে আছি যে অ্যাডাপটেক এবং এলএসআই মেগ্রেইড হার্ডওয়্যার র‌্যাড কন্ট্রোলারগুলি দিয়ে সজ্জিত অনেক সুপারমাইক্রো সার্ভার রয়েছে । এই নিয়ন্ত্রণকারীগুলিতে ব্যাটারি-ব্যাকযুক্ত ক্যাশে মডিউল রয়েছে যা লেখার কর্মক্ষমতা বাড়াতে এবং ইন-ট্রানজিটে ডেটা সুরক্ষিত করতে সহায়তা করে।

একটি ঘন ঘন সমর্থন সমস্যা হ'ল RAID নিয়ামক ব্যাটারি ব্যর্থতা। এটি অ্যারেটিকে লিখন- থেকে লিখন-মাধ্যমে মোডে স্থানান্তর করে। সিস্টেমটি অবনমিত লেখার গতিতে চলায় স্পষ্টত নেতিবাচক কর্মক্ষমতা প্রভাব রয়েছে। সিস্টেমটি পাওয়ার এবং ব্যাটারি প্রতিস্থাপনের জন্য ডাউনটাইম উইন্ডোটি স্থাপন করা না হওয়া পর্যন্ত এটি অব্যাহত থাকে।

এটি আমাদের জন্য খুব রুটিন অপারেশন; প্রায় সাপ্তাহিক কয়েক হাজার শারীরিক সার্ভার জুড়ে ... প্রতিস্থাপন ব্যাটারিগুলি প্রস্তুত করার জন্য আমাদের কাছে এমনকি চার্জিং স্টেশন রয়েছে যাতে কোনও চার্জ চক্র ছাড়াই অদলবদল করা যায়।

সম্ভবত আমি এইচপি প্রোলিয়েন্ট সার্ভার এবং স্মার্ট অ্যারে রেড কন্ট্রোলারগুলির সাথে একটি দীর্ঘ ইতিহাস দ্বারা নষ্ট হয়েছি , তবে এইচপি সিস্টেমে সাধারণত ব্যাটারির আজীবন 4-6 বছর থাকে। শেষ পর্যন্ত তারা ২০০৯-এর আশেপাশে RAID ব্যাটারির ব্যবহার সরিয়ে ফেলেছিল They এগুলি সুপার ক্যাপাসিটার-ব্যাকড মেমরি মডিউলগুলি (ফ্ল্যাশ-ব্যাকড রাইট ক্যাশে, বা এফবিডাব্লুসি) দিয়ে প্রতিস্থাপিত হয়েছিল এবং প্রতিস্থাপন, নিষ্পত্তি বা দীর্ঘতর প্রাথমিক চার্জ চক্রের প্রয়োজন হয় না।

যেহেতু আমি অ্যাডাপটেক এবং এলএসআই নিয়ন্ত্রক ব্যাটারি ব্যর্থতা মাঝে মাঝে 12 মাসেরও কম সময় ধরে পরিষেবাতে থাকা সিস্টেমে ঘটতে দেখি তাই আমি ভাবছি যে এটি অন্যান্য পরিবেশে সাধারণ কিনা।

যদি এটি সাধারণ হয় তবে অন্যান্য বড় সার্ভার পরিবেশগুলি কীভাবে এটি পরিচালনা করে?

  • RAID ব্যাটারি প্রতিস্থাপন পরিচালনা করার জন্য কোনও টিপস বা কৌশল?
  • এমন কোনও কনফিগারেশন প্যারামিটার রয়েছে যা সহায়তা করতে পারে?
  • আপনার পরিবেশে অপারেশন করতে এটি কতটা বিঘ্নজনক ?
  • দুর্বল চ্যাসি শীতলকরণ এবং তাপমাত্রা কোনও কারণ হতে পারে?
  • আমরা কি কিছু ভুল করছি?
  • ডেল পিইআরসি নিয়ন্ত্রকগুলি এলএসআই দ্বারা তৈরি। ডেল পরিবেশনা কি একই সংক্ষিপ্ত ব্যাটারি লাইফটাইম অনুভব করে?

এলএসআই পণ্যসাহিত্যে একটি নতুন প্রজন্মের ব্যাটারিটির রূপরেখা রয়েছে যা 1 বছরেরও বেশি সময় ধরে পরিষেবাতে থাকতে পারে। এখানে চিত্র বর্ণনা লিখুন

1000+ দিনের আপটাইম এবং একটি সুখী RAID ব্যাটারি সহ এইচপি প্রলিয়েন্ট DL585 জি 2 সার্ভার ...

# uptime 
 05:38:08 up 1031 days, 44 min, 31 users,  load average: 0.49, 0.64, 0.99

# hpacucli
   Cache Board Present: True
   Cache Status: OK
   Accelerator Ratio: 50% Read / 50% Write
   Total Cache Size: 512 MB
   Battery Pack Count: 1
   Battery Status: OK

2
কেবলমাত্র একটি ইঙ্গিত: অ্যাডাপটেক নিয়ন্ত্রণকারীদের শেষ প্রজন্ম ব্যাটারির পরিবর্তে সুপারক্যাপ / ফ্ল্যাশ ব্যবহার করে।
সোভেন

ওহ, আমি সচেতন আছি যে নির্মাতারা সব supercap ভিত্তিক সমাধান আছে এখন , কিন্তু বিদ্যমান ইনস্টলেশন পদাঙ্ক দেওয়া আইটি পরিকাঠামো জুড়ে বিস্তৃত পরিবর্তন করতে কঠিন।
ew white

2
আমি কখনই এটি করিনি (সম্ভবত এটি কোনও খারাপ ধারণা বলে মনে হচ্ছে এবং আপনার সমস্যাটি যতটা ঘন ঘন আমার কাছে আসেনি) তবে আপনি একটি চালক সার্ভারে একটি রেড ব্যাটারি প্রতিস্থাপনের চেষ্টা করতে পারেন । এটিকে স্লাইড আউট করুন, কভারটি বন্ধ করুন, খারাপ ব্যাটারি সংযোগ বিচ্ছিন্ন করুন এবং ভালটি সংযোগ করুন, তারপরে র্যাকটিতে ফিরে আসুন ... যদি সবকিছু ঠিকঠাক হয় তবে আপনার কাছে একটি নতুন ব্যাটারি প্রতিস্থাপন প্রক্রিয়া রয়েছে যা ডাউনটাইমকে জড়িত না।
আগস্ট

2
@ অগস্ট উহম, ঝুঁকিপূর্ণ প্রক্রিয়াগুলির হিসাবে এটি "ওএমজি যেখানে আমার ডেটা জিও" তালিকায় বেশ উচু মনে হচ্ছে।
ড্যান

2
হ্যাঁ এটি নিশ্চিত করে তোলে ... আমি এটি এক ভয়ঙ্কর ধারণা বলে মনে করি, তবে পরিস্থিতি এবং কোনও সময় নিরূপণের প্রয়োজন অনুসারে এটি একটি পরীক্ষার সার্ভারে (বা ত্রিশটি পরীক্ষার সার্ভারে ...) শট করার উপযুক্ত হতে পারে কিনা তা দেখার জন্য সম্ভব. হাজার হাজার সার্ভারে পৃথক RAID ব্যাটারির উপর নির্ভর না করার জন্য অবকাঠামোটি পুনরায় করা ছাড়া আর কোন বিকল্প কী?
আগস্ট

উত্তর:


9

আমি সন্দেহ করি যে আপনার সুপারমাইক্রোস একভাবে বা অন্যভাবে ভেঙে গেছে - সম্ভবত ব্যাটারি প্যাকগুলি অতিরিক্ত গরম হচ্ছে ating সাম্প্রতিক এলএসআইগুলি মেগাএলসিএলআইয়ের মাধ্যমে তাপমাত্রার প্রতিবেদন করবে - আপনি সার্ভারগুলিতে এই মানটি পর্যবেক্ষণ করতে চাইতে পারেন যা প্রতিস্থাপনের প্রয়োজন।

root@host:~/SOLARIS# ./MegaCli -AdpBbuCmd -GetBbuStatus -aALL

BBU status for Adapter: 0

BatteryType: BBU
[...]
Temperature: 41 C

আমি এলএসআই বিবিইউ কন্ট্রোলারের সাথে ডেল এবং ফুজিৎসু সিস্টেমে দু'একটি দেখেছি, তাদের কারওরই বার্ষিক ব্যাটারি প্যাক প্রতিস্থাপন ছিল না (আপনি ডিপ-ডিসচার্জ করে প্যাক আপকে বাদ দিয়ে)। সাধারণ জীবনের সময়টি প্রায় 3 থেকে 5 বছর কেটে গেছে।


4
আমি যুক্ত করব যে সিস্টেমটি এক্সপ্লিকেশনসভাবে RAID বিবিইউর গরম প্রতিস্থাপনের অনুমতি না দিলে আমি এটি চেষ্টা করব না। আমি কখনই দেখিনি যে কোনও সিস্টেমে RAID ক্যাশে ব্যাটারির বার্ষিক প্রতিস্থাপনের প্রয়োজন হয়। 3-5 বছর একটি সাধারণ সেবা জীবন।
voretaq7

আমার মনে হয় আপনি পেয়েছেন!
ew white

1

গড় ব্যাটারির আয়ু 3-5 বছর হওয়া উচিত। এবং ভুলে যাবেন না যে ফ্ল্যাশ-ভিত্তিক এফবিডাব্লুসিও ব্যর্থ হয়। আমি জানি না কেন / কীভাবে, তবে আমরা আমাদের এইচপি সার্ভারগুলিতে নিয়মিত তাদের পরী প্রতিস্থাপন করছিলাম। আমার ব্যাটারির চেয়ে বেশি দীর্ঘস্থায়ী হওয়া উচিত, তবে আমাদের পৃথক সার্ভারগুলির পরিসংখ্যান আমার কাছে নেই।

ব্যর্থ ব্যাটারি এবং ব্যাটারি শেখার প্রভাব প্রতিরোধের স্ট্যান্ডার্ড উপায় হ'ল একাধিক ব্যাটারি থাকা। এইচপি স্টোরেজ যেমন (এইচপি ইভিএ) এটি থাকে। আপনার কাছে দুটি হট-প্লাগ ব্যাটারি রয়েছে এবং একটিতে যখন কম চার্জ থাকে বা প্রতিস্থাপন করা হয়, তখন নিয়ামক বাকী একটিটির সাথে কাজ করে। আমি নিশ্চিত নই যে স্মার্টআরেতে একাধিক ব্যাটারি সংযুক্ত থাকা সম্ভব কিনা তবে hpacucli diagআউটপুট প্রস্তাব দেয় যে এটি সমর্থন করা উচিত:

Battery 1 firmware is up to date.
Battery 2 not present.
Battery 3 not present.

Battery Status:    Battery 1      Battery 2      Battery 3
---------------    ---------      ---------      ---------
Present:              YES             NO             NO
Responding:           YES            N/A            N/A
PIC Revision:          52              .              .         
Status:              0x80              .              .         
Extra Status:        0x01              .              .         
   Enabled:         FALSE              .              .         
   Charging:        FALSE              .              .         
   Good:             TRUE              .              .         
   Open:            FALSE              .              .         
   Shorted:         FALSE              .              .         
   Sample Err:      FALSE              .              .         
Control:             0x00              .              .         
Load Current: (0x70) 24.6mA            .              .    
   Per Memory Chip:  4920uA            .              .         
Voltage:      (0xae) 5640mV            .              .         
Capacity:             100%             .              .         
Depletion count:     0x00              .              .         

1

কয়েক শতাধিক ইনস্টলের ওপরে এলএসআই প্ল্যাটফর্মগুলির আইবিএম সংস্করণগুলির সাথে আমার অভিজ্ঞতা হ'ল গড় ব্যাটারি সবেমাত্র 2 বর্ষ তৈরি করে, এবং সুপারক্যাপটি এর চেয়ে ভাল কিছু নয়, যার কয়েকটি ফার্মওয়্যার আপডেট দিয়ে স্থির করা যায়, তবে এলএসআই কেবল এটি পায় নি have ঠিক আছে। আমি প্রথম 2 বছরে প্রায় 75% সুপারক্যাপ ব্যর্থতা পেয়েছি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.