চেক_লোডের জন্য কী সতর্কতা এবং সমালোচনামূলক মান ব্যবহার করতে হবে?


13

এই মুহূর্তে আমি এই মানগুলি ব্যবহার করছি:

# y = c * p / 100
# y: nagios value
# c: number of cores
# p: wanted load procent

# 4 cores
# time        5 minutes    10 minutes     15 minutes
# warning:    90%          70%            50%
# critical:   100%         80%            60%
command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4

তবে এই মানগুলি প্রায় এলোমেলোভাবে বেছে নেওয়া হয়।

কারও কি কিছু পরীক্ষিত মান আছে?


2
আমি মনে করি কোন মান standardবা testedমান আছে। এটি আপনার প্রত্যাশিত সার্ভারের কাজের চাপের উপর নির্ভর করে। আপনি যদি উচ্চ লোডের আশা করেন তবে আপনার মানগুলি বাড়ানো উচিত। অন্যথায়, আপনার সার্ভার সর্বদা সমালোচনামূলক অবস্থায় উপস্থিত থাকবে।
খালেদ

হ্যাঁ, এটি আমার সমস্যা। আমি ক্রমাগত সমালোচনা বিজ্ঞপ্তি পেতে। আমার কি 3 দিয়ে সমস্ত গুণ করা উচিত?
সান্দ্রা

উত্তর:


9

লিনাক্স লোড আসলে সহজ। লোড গড় সংখ্যাগুলির প্রত্যেকটি হ'ল সমস্ত মূলের গড় লোডের সংমিশ্রণ। অর্থাৎ।

 1 min load avg = load_core_1 + load_core_2 + ... + load_core_n
 5 min load avg = load_core_1 + load_core_2 + ... + load_core_n
15 min load avg = load_core_1 + load_core_2 + ... + load_core_n

যেখানে 0 < avg load < infinity

সুতরাং একটি 4 কোর সার্ভারে যদি বোঝা 1 হয়, তবে এর অর্থ প্রতিটি কোর 25% ব্যবহার করা হয় বা একটি কোর 100% লোডের নিচে ব্যবহৃত হয়। 4 টির বোঝার অর্থ সমস্ত 4 টি কর 100% লোডের নিচে। > 4 এর একটি বোঝা মানে সার্ভারের আরও বেশি কোর দরকার।

check_load এখন আছে

 -r, --percpu
    Divide the load averages by the number of CPUs (when possible)

যার অর্থ এটি যখন ব্যবহৃত হয়, আপনি আপনার সার্ভারটিকে কেবল একটি কোর হিসাবে ভাবতে পারেন এবং তাই কোরের সংখ্যা না ভেবে সরাসরি শতাংশ ভগ্নাংশটি লিখতে পারেন। সঙ্গে -rসতর্কবার্তা এবং জটিল অন্তর হয়ে 0 <= load avg <= 1। অর্থাৎ। আপনাকে সার্ভার থেকে সার্ভারে আপনার সতর্কতা এবং সমালোচনামূলক মানগুলি সংশোধন করতে হবে না।

ওপি এর অন্তরগুলির জন্য 5,10,15 রয়েছে। এটা ভুল। এটি 1,5,15।


27

যদিও এটি একটি পুরাতন পোস্ট, এখনই জবাব দেওয়া কারণ আমি জানতাম যে চেক_লোডের প্রান্তিক মানগুলি নতুনদের জন্য মাথাব্যথা ..

একটি সতর্কতা সতর্কতা, যদি সিপিইউ 5 মিনিটের জন্য 70%, 10 মিনিটের জন্য 60%, 15 মিনিটের জন্য 50% হয়। একটি সমালোচনা সতর্কতা, যদি সিপিইউ 5 মিনিটের জন্য 90%, 10 মিনিটের জন্য 80%, 15 মিনিটের জন্য 70% হয়।

*command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7*

সিপিইউ লোড সম্পর্কে আমার সমস্ত অনুসন্ধান:

"বোঝা" বলতে যা বোঝায়: উইকিপিডিয়া বলেছেন:

সমস্ত ইউনিক্স এবং ইউনিক্সের মতো সিস্টেমগুলি কার্নেলের মধ্যে তিনটি "লোড গড়" সংখ্যার একটি মেট্রিক তৈরি করে। ব্যবহারকারীগণ সহজেই আপটাইম কমান্ডটি চালিয়ে ইউনিক্স শেল থেকে বর্তমান ফলাফলটি জিজ্ঞাসা করতে পারেন:

$ uptime
14:34:03 up 10:43,  4 users,  load average: 0.06, 0.11, 0.09

উপরের আউটপুট লোড গড় থেকে: 0.06, 0.11, 0.09অর্থ (একক সিপিইউ সিস্টেমে):

  • শেষ মুহুর্তের সময়, সিপিইউ 6% দ্বারা আন্ডারলোড করা হয়েছিল
  • শেষ 5 মিনিটের সময়, সিপিইউ 11% আওতায় ছিল
  • শেষ 15 মিনিটের সময়, সিপিইউ 9% আওতায় ছিল

$ uptime
14:34:03 up 10:43,  4 users,  load average: 1.73, 0.50, 7.98

1.73 0.50 7.98একক সিপিইউ সিস্টেমে উপরের লোড গড়ের হিসাবে:

  • শেষ মুহুর্তের সময়, সিপিইউ ওভারলোড হয়েছিল %৩% (১ সিপিইউ 1.73 চালানো যায় এমন প্রক্রিয়া সহ, যাতে 0.73 প্রসেসের জন্য কোনও সময়ের জন্য অপেক্ষা করতে হয়েছিল)
  • শেষ 5 মিনিটের সময়, সিপিইউ 50% আন্ডারলোড করা হয়েছিল (কোনও প্রক্রিয়াটির জন্য অপেক্ষা করতে হয়নি)
  • শেষ 15 মিনিটের সময়, সিপিইউ ওভারলোড হয়েছে 698% (1 সিপিইউ 7.98 চলমানযোগ্য প্রক্রিয়াগুলির সাথে, যাতে 9.৯৮ টি প্রক্রিয়াটির জন্য অপেক্ষা করতে হয়েছিল)

নাগিওস প্রান্তিক মান গণনা:

নাগিওস সিপিইউ লোড সেটআপের জন্য, যার মধ্যে সতর্কতা এবং সমালোচনা রয়েছে:

y = c * p / 100

কোথায়: y = nagios value c = number of cores p = wanted load procent

একটি 4 কোর সিস্টেমের জন্য:

time      5 min  10 min    15 min
warning:  90%    70%       50%
critical: 100%   80%       60%

command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4

একটি একক কোর সিস্টেমের জন্য:

y = p / 100

কোথায়: y = nagios value p = wanted load procent

time       5 min  10 min    15 min
warning:   70%    60%       50%
critical:  90%    80%       70%

command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7

ডাঃ গুন্থার সিপিইউ লোড বিশ্লেষণ সম্পর্কে একটি দুর্দান্ত শ্বেতপত্র: http://www.teamquest.com/pdfs/ whitepaper / ldavg1.pdf এই অনলাইন নিবন্ধে ডঃ গুন্থার ইউনিক্স কার্নেলের ভিতরে কীভাবে লোড গড়ের গড় জানতে পারেন তা ( "এলএ ট্রিপল্টস") গণনা করা হয় এবং তারা ক্ষমতা পরিকল্পনার মেট্রিক হিসাবে কতটা উপযুক্ত।


2
সময়টি 1,5 এবং 15
মিনিট

3

যতক্ষণ না প্রশ্নে থাকা সার্ভারগুলির একটি অ্যাসিনক্রোনাস ওয়ার্কলোড না থাকে যেখানে সারি গভীরতার পরিচালনা করার জন্য গুরুত্বপূর্ণ পরিষেবা মেট্রিক তখন এর সত্যতার সাথে এমনকি লোড গড়ের নিরীক্ষণেরও উপযুক্ত নয়। এটি পরিষেবাটির সময় (পরিষেবার সময় এবং পরিষেবার সময়) এর মতো মেট্রিক থেকে কেবলমাত্র একটি বিচ্যুতি।


2

খুব ভাল পরিপূরক নাগিওস হ'ল মুনিন বা ক্যাকটির মতো একটি সরঞ্জাম, তারা আপনার সার্ভারের বিভিন্ন ধরণের কাজের চাপ গ্রাফ করবে। এটি লোড-ওভারেজ, সিপিইউ ব্যবহার, ডিস্ক আইও বা অন্য কিছু হতে পারে।

এই তথ্যটি ব্যবহার করে নাগিওজে ভাল প্রান্তিক মান নির্ধারণ করা আরও সহজ।


1

আপনি কি জানেন যে কোন লোড এভারে আপনার সিস্টেমের কার্যকারিতা প্রভাবিত হয়? আমাদের শেষ কাজটিতে আমাদের এমন সার্ভার ছিল যা ধারাবাহিকভাবে 35-40 লোড গড়তে বসত, তবে এখনও প্রতিক্রিয়াশীল ছিল। এটি এমন একটি পরিমাপ যা এর জন্য সঠিক নম্বর পেতে আপনাকে কিছুটা গোয়েন্দা কাজ করতে হবে।

আপনি পরিবর্তে সিস্টেমে কিছু অন্যান্য মেট্রিকগুলি পরিমাপ করতে চাইতে পারেন, যেমন এসএসএইচ বা HTTP- র গড় সংযোগের সময়; এটি আপনার সিস্টেমের অধীনে কত বোঝা রয়েছে তার একটি আরও ভাল সূচক হতে পারে।


2
উদাহরণস্বরূপ, 35 লোড গড়ের অর্থ কী? সিপিইউ কোরগুলির সংখ্যাটি কি আলাদা করে?
সান্দ্রা

1

উদ্ভাবক সেকরের উত্তর বাড়ানোর জন্য: চেক-লোড এবং শতাংশ ব্যবহার করার সময় আমি বিশ্বাস করি অন্যদের সাথে আপনারও "-r" কমান্ড লাইন আর্গুমেন্টের প্রয়োজন হবে।

উদাহরণ স্বরূপ:

command[check_load]=/usr/local/nagios/libexec/check_load -r -w 0.7,0.6,0.5 -c 0.9,0.8,0.7
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.