В среде разрешена только пассивная проверка. Активные проверки невозможны.
Задача конфигурации состоит в том, чтобы Nagios сообщал об узле как о «неработающем», если узел не отправлял информацию (не сообщал о пассивных проверках) в течение более длительного времени, чем настроена актуальность.
Я создал очень простую лабораторную среду, воспроизводящую те же правила брандмауэра, что и в исходной среде, и ту же настройку. Лаборатория состоит всего из 1 сервера NagioXI и 1 клиента Linux.
В целях тестирования я настроил актуальность проверок служб и конфигурации хоста. В обоих случаях, когда порог свежести превышен, выполняется одна и та же команда проверки, которая представляет собой check_dummy ARG1 = 2 (Critical) и Arg2 = "Server down" или что-то вроде down.
В службах проверки предупреждения работают отлично . После превышения порога свежести отображается статус Критический. Однако в конфигурациях хостао хосте всегда сообщается, что он работает, и никаких сообщений не отображается.
Конфигурация служб
Конфигурация хоста
Проверить команду
И все службы находятся в состоянии «Вниз» с критическим статусом, как я и ожидал, но это это не то, чего я хочу достичь. Я хочу получить состояние «Хост отключен», однако он всегда находится в рабочем состоянии.
Состояние хоста
Как я могу установить для хоста состояние «отключен»?
После долгих поисков и устранения неполадок мне наконец удалось найти проблему. Проблема заключалась в том, что в файле nagios.cfg была отключена проверка свежести хоста
После замены:
check_host_freshness=0
на
check_host_freshness=1
Немедленно начать работать :)
Наблюдения: как упоминал Татер в комментариях , Максимальное количество попыток должно быть установлено на 1, чтобы оно работало должным образом в моем случае.