Nagios устанавливают состояние узла на КРИТИЧЕСКИЙ только после 2 проверок

У меня есть nagios сервер, который является сервером резервного копирования также. Этот сервер получает автоматические файлы резервных копий из-за 30 сетевых устройств в моей сети. Сетевые механизмы каждый час отправляют файлы резервных копий, но не одновременно. У меня есть простой сценарий, чтобы проверить, создавался ли файл резервной копии в течение прошлых 30 минут:

#! /bin/bash

PROGNAME=`basename $0`
PROGPATH=`echo $0 | sed -e 's,[\\/][^\\/][^\\/]*$,,'`

. $PROGPATH/utils.sh

if [ "$1" = "" ]
 then
  echo -e " Use : $PROGNAME -- Ex : $PROGNAME /etc/hosts \n "
  exit $STATE_UNKNOWN
fi

if [[ -z `find /backupdir/ -name "$1*" -mmin -30 -type f` ]]
 then
  echo "CRITICAL - $1 : backup not working for the last hour" 
  exit $STATE_CRITICAL
 else
  echo "OK : $1 config backup is working  "
  exit $STATE_OK
fi

как через 30 минут могли бы быть некоторые устройства, который был сохранен своевременный, там должен так или иначе установить сервис проверки для установки на КРИТИЧЕСКОЕ состояние только после 2 проверок через час? Я попробовал это, но, кажется, не работает:

 # 'check backup'
 define service {
         hostgroup_name                  ciscos
         service_description             auto backup config check
         check_command                   check_cisco_backup
         use                             generic-service
         normal_check_interval           30
         max_check_attempts              4
         retry_check_interval            4
         notification_interval           60
 }

У меня нет достаточной репутации для добавления комментария к ответу. Ниже примера должен разъяснить мой вопрос:

- router R1 backing up config file to nagios server N1 at the first minute of every hour 
- R2 -> N1 at 31st minute of every hour 
- I want N1 to run 'auto backup config check' service every 30 minute, 
- so at the first time the service run, apparently one of the two routers will be checked as CRITICAL and the other is OK, and the second the service run, the former OK one will be CRITICAL and vice versa

Посмотрите, можно ли помочь определить сервис или изменить сценарий самым оптимальным способом.

0
задан 26 October 2015 в 06:03
1 ответ

Какую версию nagios вы используете? Я предполагаю, что если вы выходите с критическим состоянием при каждой проверке, эскалации не будет. Вы можете выйти с помощью STATE_WARNING и использовать эскалацию проверки cf: Nagios проверяет частоту обслуживания в зависимости от статуса обслуживания

0
ответ дан 24 November 2019 в 07:46

Теги

Похожие вопросы