Я работаю новым системным администратором. Система мониторинга работает хорошо, но несколько дней назад система мониторинга Nagios предупреждает меня о проблеме. Состояние критическое, нагрузка высокая.
Вот что мне постоянно присылают nagios:
***** Nagios *****
Notification Type: PROBLEM
Service: Current Load
Host: localhost
Address: 127.0.0.1
State: CRITICAL Date/Time: Tue Nov 17 08:57:15 CET 2015
Additional Info:
CRITICAL - load average: 6.25, 8.22, 8.28
Средняя нагрузка постоянно растет.
Я плохо разбираюсь в Linux, поэтому не знаю, как решить эту проблему.
Если он был запущен недавно, и вы не добавляли никакой дополнительной нагрузки на сервер (никаких изменений конфигурации или развертывания какого-либо нового программного обеспечения, или вы не уверены), стоит проверить свой сервер на предмет посмотреть, что вызвало увеличение нагрузки. Для этого вам необходимо иметь возможность войти на сервер и иметь root-доступ. Вы можете начать с таких инструментов, как вверх
, и продолжить изучение. См. Здесь несколько советов: Слишком высокая загрузка процессора. Как исследовать? .
Если вы не можете найти ничего ненормального и можете сделать вывод, что это нормальное поведение сервера, то вы можете настроить предупреждение и критическое значение плагина Nagios соответствующим образом. Вот как: Какие значения предупреждений и критических значений использовать для check_load?