nagios check_crash ||, как обнаружить, когда сервер разрушил и перезагрузил?

Если все неконтролируемо на вкладке Recycling и Performance рабочего процесса, IIS не должен завершать процессы. Есть ли какие-либо записи журнала событий, которые соответствуют времени, которое процесс "сводит на нет"? Это звучит мне как приложение WCF, потенциально отказывает. WCF не регистрирует исключения к журналу событий как стандартное приложение.NET поэтому, если Вы не пишете свои собственные журналы, можно хотеть включить WCF, прослеживающий, чтобы видеть, является ли, возможно, это проблемой.

Быстрое ужасное решение Вашей проблемы тем временем может состоять в том, чтобы создать своего рода дешевый тест или транзакцию только для чтения в Вашем сервисе WCF и просто настроить приложение мониторинга или сценарий для опроса его каждые X секунды для хранения рабочего процесса изобилующим кодом pre-JIT'd.

0
задан 20 February 2012 в 17:03
2 ответа

Как насчет того, чтобы написать его? Простым способом было бы запустить uptime в скрипте. Немного лучше было бы добавить сценарий инициализации, который отображает время во вращающийся файл журнала. Возьмите последние три записи в файле и проверьте время, прошедшее с момента первой.

1
ответ дан 4 December 2019 в 14:32

На Nagios Exchange есть несколько вариантов "check_uptime". Они позволяют отслеживать быстрые перезагрузки без установки max_check_attempts на 1 или 2 для проверки хоста (что предотвращает ложные срабатывания).

Этот , например, может быть запущен через NRPE (использует uptime ), но также можно проверить через SNMP (Linux, Windows и т. Д.).

1
ответ дан 4 December 2019 в 14:32

Теги

Похожие вопросы