Виртуальная Обработка отказа IP, когда машина перегружается

Вина и вероятные ситуации восстановления являются хорошим началом, но ничто не преподает как реальная авария, едва предотвращенная через героические усилия. Нам потребовались несколько лет, чтобы убедить власть имущих, что для наших ленточных библиотек была нужна замена. Это приложило слишком много усилий, и мы не получили то, в чем мы нуждались (мы должны были согласиться на SDLT320, не мочь позволить себе LTO), но по крайней мере это было лучше. Каждый раз, когда TPTB добираются, дикий заяц о должен полностью копироваться! Должен иметь сайт горячего резервного копирования! мы должным образом планируем, чего это стоило бы, и каждый раз, когда они решают, что не могут позволить себе его.

Кроме нового раунда. Для удивления они решили, что массив хранения данных среднего уровня мог получить живую репликацию. Верхний ряд... собирается ожидать своей замены, если вообще. Нижний уровень упал с обратной стороны бюджета.

Это прилагает постоянные усилия и очень утомляет по долгому пути. До сих пор у нас еще не было образовательной аварии.


В более общем плане это берет образование и настойчивость. Образование относительно факторов риска и вероятности того же (также известный как 'управление рисками', они, как предполагается, преподают такую вещь в школах бизнеса), а также смягчение и затраты. Если необходимо пойти туда, составив подробный отчет о точно, насколько завинченный компания то, если бы вероятный случай аварии прибывает и сколько денег было бы потеряно, не решив проблему, хорошее начало. Это делает их задание для них, но иногда Вы имеете к тому, чтобы сделать правильную вещь.

К сожалению, все еще не поможет, решают ли они, что Вы - просто паника mongering и игнорируете Вас. По крайней мере, у Вас теперь есть документация, показывающая Вам, знал о проблеме, которую попробовали к смягченному это, и был отклонен, в случае фактической аварии. Имеет попадание? Покажите тот отчет снова и посмотрите, повысился ли, цвет стирался их стекла все же.

3
задан 3 February 2013 в 15:35
1 ответ

Проблема в том, что я просто использую неправильные сценарии для проверки сама машина, если мастер работает нормально,

Да.

Например, когда у нас была проблема, когда система меняла местами все время. Нагрузка была 25 вместо обычных 5 и не было возможности ssh в машину. Пинг работал. Keepalived продолжал работать и виртуальный IP-адрес не был передан другому ведомому устройству.

Вы пытались написать свой собственный скрипт для проверки средней нагрузки, примерно так:

#!/bin/bash

LOAD=$(/command/to/get/the/load/average)
if [ $LOAD -ge 25 ]; then
    exit 1
else
    exit 0
fi

затем используйте его как track_script :

vrrp_script check_load {
    script "/path/to/check_load.sh"
    interval 2
    weight 2
}

vrrp_instance VI_1 {
    state BACKUP
    nopreempt
    ...
    authentication {
        auth_type PASS
        auth_pass Neifeaw7
    }
    virtual_ipaddress {
        192.168.6.8
    }
    track_script {
        check_load
    }
}

Но подождите, что произойдет, если виртуальный IP-адрес будет переключаться слишком часто?

1
ответ дан 3 December 2019 в 07:32

Теги

Похожие вопросы