Я работаю с Pacemaker и Stonith для Высокой доступности с кластером с 2 узлами (узлы, названные здесь A и B). Оба узла имеют один IPMI как устройство забора.
Соглашение:
Затем я включаюсь от предоставления узел. Так каждый eth интерфейсы И IPMI на A недоступны. Здесь прибывает прием: B попытки неудачно для обеспечения вниз вызовите IPMI A, недостижимо. Когда попытки N были сделаны, B сдается и приводит себя к состоянию "Блока" (названный НЕАКТИВНЫМ в файле журнала).
Вот мой вопрос: как я могу вынудить B возвратить ресурсы даже если Stonith сбои?
Я понимаю последствия (параллельные записи, и т.д....), но мне скорее нравятся они по сравнению с сервисом, недоступным вообще.
У вас уже есть описанная проблема:
B безуспешно пытается сбить А, потому что IPMI А недоступен.
Если B не сможет выполнить успешную операцию с ограждением, оно будет висеть, чтобы избежать сценария split-brain. Вы можете смягчить это, настроив механизм вторичного ограждения.