Мы используем haproxy в качестве балансировщика нагрузки http. Иногда один из наших серверов перестает отвечать при приеме запросов на HTTP-соединение. Таким образом, на странице статистики серверы отображаются как зеленые «доступные», но наш сервер nagios сообщает «КРИТИЧНО - тайм-аут сокета через 20 секунд», и этот сервер на самом деле не отвечает.
Как указать haproxy, чтобы проверить время ответа страницы, и если это займет больше времени timeout, затем пометьте его как DOWN.
Вам необходимо пройти проверку работоспособности https://www.haproxy.com/doc/aloha/7.0/haproxy/healthchecks.html . Вам особенно нужны check_timeouts «Проверка тайм-аута: время, дающее серверу возможность ответить на проверку. Если установлены и промежуточная проверка, и проверка тайм-аута, то используется наименьшее значение из них обоих после установления TCP-соединения»