আদর্শভাবে, যতটা সম্ভব ইনস্টল করা সহজ এবং সার্ভারগুলি রিবুট করার প্রয়োজন ছাড়াই। বেশিরভাগ ক্ষেত্রে DL380 G5's
যদি এটি সাহায্য করে।
আদর্শভাবে, যতটা সম্ভব ইনস্টল করা সহজ এবং সার্ভারগুলি রিবুট করার প্রয়োজন ছাড়াই। বেশিরভাগ ক্ষেত্রে DL380 G5's
যদি এটি সাহায্য করে।
উত্তর:
এটি সার্ভারগুলিতে যে অপারেটিং সিস্টেমে চলছে তার উপর কিছুটা নির্ভর করে তবে সাধারণভাবে, এইচপি প্রোলিয়েন্ট সার্ভার এবং স্মার্ট অ্যারে রেড কন্ট্রোলারের কাছ থেকে সতর্কতা পাওয়া সম্ভব।
আপনার DL380 G5 সিস্টেমগুলির জন্য পূর্ণ ড্রাইভার এবং সফ্টওয়্যার সমর্থন তালিকা এখানে তালিকাভুক্ত করা হয়েছে ।
এসএনএমপি এবং একটি পর্যবেক্ষণ সমাধান হ'ল সর্বোত্তম পদ্ধতির ... তবে আপনি এইচপি'র কয়েকটি সরঞ্জামের সাহায্যে এটি বাড়িয়ে নিতে পারেন। এইচপি এইচপি সিস্টেম অন্তর্দৃষ্টি পরিচালক , যা ডাউনলোডের জন্য উপলব্ধ এবং সার্ভারের সাথে আসে উপলব্ধ। এটি সার্ভার সংগ্রহের জন্য আদর্শ। আপনি যদি পরিচালনা বা পর্যবেক্ষণ অবকাঠামো না তৈরি করে এক-অফ সতর্কতাগুলির সন্ধান করেন তবে আপনি কেবল এইচপি ম্যানেজমেন্ট এজেন্টস (ওরফে প্রলিয়েন্ট সাপোর্ট প্যাক ) ইনস্টল করতে পারেন ।
স্বতন্ত্র লিনাক্স সিস্টেমের জন্য, আমি এজেন্টদের ইমেলের মাধ্যমে ফাঁদ পাঠাতে চাইছি। আমি সাধারণত ডিফল্ট বা কাস্টম বান্ডিল সহ সমর্থন প্যাকটি কনফিগার করব , তারপরে প্রাপক ঠিকানায় নির্দেশ করার জন্য লাইনটি সম্পাদনা করে /opt/hp/hp-snmp-agents/cma.conf
পরিবর্তন করব trapemail
:
########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
# trapemail /usr/bin/logger
# will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' systems@1234.net
আপনি যদি লিনাক্স চালাচ্ছেন এবং পুরো এইচপি পরিচালন স্যুটটি ইনস্টল করতে না চান, আপনি নিয়ামক / ডিস্কের স্থিতি অনুসন্ধানের জন্য cciss_vol_status ইউটিলিটিটির চারপাশে একটি স্ক্রিপ্ট বিকাশ করতে পারেন । আরও দেখুন: ওপেনফিলারটিতে এইচপি এজেন্ট ইনস্টল করা
ProLiant DL360 G7
সার্ভার পেয়েছি , এবং এইচপি সিম নিরীক্ষণের জন্য সেট আপ।
এইচপি অন্তর্দৃষ্টি পরিচালককে দেখুন
https://www.hpe.com/us/en/product-catalog/detail/pip.489496.html#
আমি বিশ্বাস করি এটি আপনার সার্ভারগুলির সাথে কাজ করা উচিত।
@ লাইটওয়েট প্রোগ্রামটি ব্যবহার করেছি যা @ নিউজাইটাইয়ে তার উত্তরে উল্লেখ করেছেন: সিসিস_ভোল_স্ট্যাটাস
যদি আপনি সহ ইনস্টল করা নির্দেশাবলী অনুসরণ করেন তবে স্ক্রিপ্টটি এতে স্থাপন করা হবে /usr/local/bin/cciss_vol_status
।
আমি cciss_vol_status এর আউটপুট গ্রেপ করতে ব্যবহার করি এবং একটি অ্যারে যদি FAILD এর স্থিতি থাকে তবে একটি ইমেল প্রেরণ করি Here
#!/bin/bash
#
# Check status of RAID volumes on HP Smart Array controllers. Send an email
# alert if any volumes have a FAILED status.
#
status=`/usr/local/bin/cciss_vol_status /dev/sd*`
# email lock file
lockfile=/tmp/raid.check.hp.smartarray.lock
# how often to send an email (minutes)
_notification_freq=59
_host=`hostname`
# To: email
_toemail=root
# create email lock file
[ ! -f ${lockfile} ] && /bin/touch ${lockfile}
if echo $status | grep -q FAILED
then
# make sure we haven't sent a notification in the last X minutes
if test `find ${lockfile} -mmin +${_notification_freq}`
then
echo -e "${status}" | /bin/mail -s "System Alert! RAID failure on ${_host}" ${_toemail}
# update lock file mod time
/bin/touch ${lockfile}
fi
fi
ক্রোন উপরের স্ক্রিপ্ট কল করুন। আমি প্রতি দুই মিনিটে চেকটি চালাই:
*/2 * * * * /usr/local/bin/raid.check.hp.smartarray.sh
আমরা এইচপি সিস্টেম অন্তর্দৃষ্টি পরিচালক ব্যবহার করি আমাদের এইচপি চালু আছে কিনা তা পরীক্ষা করতে, তবে এর বাইরে কিছুই নেই। আমি লিনাক্স এজেন্টকে আমাদের জন্য ওভারকিল বলে মনে করেছি, যেহেতু আমাদের কাছে অন্যান্য মনিটরিং সমাধান রয়েছে, সুতরাং উপরের এই স্ক্রিপ্টটি তার নির্দিষ্ট উদ্দেশ্যে ভালভাবে কাজ করে।
হালনাগাদ
আপনি যদি এটির মধ্যে চলে যান তবে সমস্যা সমাধানের পরামর্শ। এই স্ক্রিপ্টটি আজ সকালে সহায়ক হিসাবে প্রমাণিত হয়েছিল যখন আমি এর সাথে একটি ব্যর্থ অ্যারে সম্পর্কে ইমেল পেয়েছিলাম:
ক্যাশে নোংরা সীমা পৌঁছেছে
ডিভাইসটি কেবল পঠনযোগ্য হয়ে গেছে এবং এতে দৃশ্যমান ছিল না /proc/partitions
। আমি সার্ভারটি পুনরায় বুট করেছি এবং বুটগুলিতে এই বার্তাগুলি দেখেছি:
লজিকাল ড্রাইভগুলি সম্ভাব্য ডেটা হ্রাসের কারণে অক্ষম করা হয়েছে। লজিক্যাল ড্রাইভ (গুলি) অক্ষম করে চালিয়ে যেতে "F1" নির্বাচন করুন ডেটা ক্ষতি গ্রহণ করতে এবং লজিক্যাল ড্রাইভগুলি পুনরায় সক্ষম করতে "F2" নির্বাচন করুন
আমি F2 নির্বাচন করেছি এবং RAID ভাল ছিল এবং বুটে উঠেছে।
স্মার্টমনটোলগুলি ইনস্টল করুন। ড্রাইভ ব্যর্থ হওয়ার আগে আপনার মেলগুলি।