SBD, уничтожающий оба кластерных узла, когда существуют даже небольшие сетевые проблемы SAN

Это только зависит от TTL рассматриваемой записи DNS. Установите TTL для записи DNS, рассматриваемой к рыночной стоимости, скажем 60 минут, затем приблизительно 60 минут перед созданием массива изменений TTL к чему-то намного ниже скажем 5 минут, затем при внесении изменения, у Вас будет самое большее 5 минут для TTL для таймаута на тех хостах, которые имеют запись в их кэше DNS. Для хостов, которые не имеют записи в их кэше DNS, они будут сразу видеть изменение.

Лично я установил бы TTL для записи на 60 минут и оставил бы его в этом.

2
задан 5 June 2012 в 13:34
1 ответ

Вам необходимо проверить различные уровни:

1: параметры драйверов hba

modinfo <module_name>

2: таймауты многопутевого доступа и конфигурация особым образом параметр no_path_retry = fail

multipath -v3

из дампа sbd я видел «таймаут просмотра 10», я думаю, что тайм-аута с несколькими путями недостаточно

Схема должна быть следующей (быстро, без повторных попыток):

failed hba(report the down)-> linux scsi says (disks on that path are down) -> multipath says that disk is failed i don't retry there any io request and start to work the no failed path.

но если у вас есть значения по умолчанию для параметров, io запрос от вашего процесса sbd остается зависшим

0
ответ дан 3 December 2019 в 15:44

Теги

Похожие вопросы