Большинство облачных поставщиков уже действительно использует кластеры. Где, если один хост спускается по погрузке других слабое. Это - единственный способ дать появление 100%-го времени работы (и даже затем это не достаточно иногда).
Править:
Программное обеспечение, которое Вы используете для включения Высокой доступности, будет зависеть, на каком гипервизоре Вы используете, и какой загрузка приложения Ваше выполнение в экземплярах. В Windows комбинация NLB и Служб кластеров может сделать это. ESXI имеет свою собственную кластерную установку; выравнивание нагрузки должно быть сделано иначе.
Можете ли вы успешно выполнить check_users с помощью sudo (как пользователь, выполняющий nrpe)? т.е.
sudo ./check_users -c 2 -w 2
Не случайно ли в CentOS есть requiretty в верхней части файла sudoers? Если да, то это вероятный виновник. Вы можете попробовать временно отключить его глобально или просто отключить для пользователя nagios.
Пожалуйста, проверьте, действительно ли процесс nrpe завершается после перезапуска службы. Раньше у меня была такая же проблема. Используйте:
ps -ef | grep nrpe
, чтобы проверить, работает ли процесс, а затем команду:
kill -9 `ps -ef | grep nrpe | awk '{print $2}'`
, чтобы убить его вручную.
Возможно, проблема с пользователем nagios. Пожалуйста, проверьте, есть ли у пользователя nagios права на запуск плагинов.
разрешения плагина должны быть такими:
rwxr-xr-x 1 nagios nagios 163831 May 30 2016 check_users
Мне кажется, что у вас нет строки "requiretty" в ваших файлах sudoers
, убедитесь, что у вас есть следующая строка:
Defaults:nagios !requiretty
Это означает, что пользователь nagios ( только) не требуется иметь tty для запуска команды, поэтому я подозреваю, что ваша команда не работает.
Если вы не уверены, какой пользователь запускает nagios, вы можете проверить это в файле конфигурации, который обычно находится в /etc/nagios/nrpe.cfg
.
Если бы я столкнулся с этой проблемой, я бы сначала хотел убедиться, что пользователь nagios может успешно выполнить команду, и для этого я бы включил п возможность пользователя agios войти в систему, отредактировав его строку в / etc / passwd
от:
nagios:x:113:120::/var/lib/nagios:/bin/false
до:
nagios:x:113:120::/var/lib/nagios:/bin/bash
Затем я бы su - nagios
продолжил устранение неполадок, а затем, после решения проблемы, я бы изменил эту строку обратно на / bin / false
.