Высокое аппаратное сцепление Доступности/Обработки отказа

Я узнаю о кластеризации и высоконадежных методах, и наткнулся на статью о конфигурировании сети с парой серверов, с помощью DRBD для репликации и heartbeat для контроля и обработки отказа. В статье говорится, что у меня должно быть 2 NICs на каждом сервере: и eth0 переходят к LAN и обоим, как которые eth1 должен быть подключен друг к другу через перекрестный кабель, в этом изображении:

http://i.stack.imgur.com/8BAm6.jpg

Описание изображения на статье:

Для обеспечения автоматической обработки отказа heartbeat контролирует основной сервер следующим образом: 1. Вторичный сервер непрерывно контролирует соединение с основным сервером по переходному кабелю, подключающему эти два сервера. Если основное устройство не доступно, то вторичное устройство принимает основное состояние. 2. Основной сервер непрерывно контролирует соединения с высоконадежным сетевым устройством, такие как маршрутизатор. Если сетевое устройство не доступно, то оно оставляет управление вторичному серверу. Обработка отказа является таким образом автоматической в случае следующих сценариев: 1. Сетевая обработка отказа для основных 2. Отказ оборудования, такой как источник питания, ЦП, RAM и т.д.

Это подняло следующий вопрос:

Если heartbeat на вторичном/пассивном сервере контролирует основное устройство через eth1, что происходит, если eth1 перестал работать на каком-либо из серверов?

Мне кажется, что heartbeat будет думать, что основное устройство мертво и активирует вторичное устройство. Разве это не создало бы "условие" мозга разделения? Поскольку основной сервер все еще подключен к LAN через eth0 и работу, это был просто heartbeat/ссылка репликации (eth1), это было повреждено. Таким образом, теперь у нас было бы два активных сервера одновременно?

Я все еще схватываю понятие, извините меня, если я говорю чепуху.

2
задан 4 October 2014 в 00:23
1 ответ

Прочитанная вами статья, скорее всего, давно устарела. Использование Heartbeat для управления ресурсами (остановка и запуск ресурсов после обхода отказа) устарело примерно с 2008 года. Кардиостимулятор является новым стандартным решением для управления ресурсами Linux-HA. Однако для работы кардиостимулятора все еще требуется что-то для управления взаимодействием на кластере. Для коммуникационного уровня можно использовать Heartbeat, но самым популярным решением на сегодняшний день является Corosync.

Что касается вашего исходного вопроса, то короткий ответ - да. Если вы прерываете сеть, которая несет соединения кластера, это может привести к расщеплению мозга, если только вы не используете STONITH, Который вы должны!. Хорошие статьи о том, зачем вам нужен STONITH, можно найти здесь и здесь .

STONITH в стороне, оба Heartbeat и Corosync имеют поддержку избыточных каналов/сетей. Это означает, что вы можете использовать несколько интерфейсов для обеспечения того, чтобы отказ одного интерфейса не мешал взаимодействию кластера.

Надеюсь, это поможет!

2
ответ дан 3 December 2019 в 11:41

Теги

Похожие вопросы