Как я могу ускорить автоматическую обработку отказа кластера 2012 года Hyper-V?

Да, образование моста является ключом, чтобы сделать это.

Нет, Вам не нужен третий сетевой адаптер, если я разобрался в Вашей сети.

См. http://wiki.debian.org/BridgeNetworkConnections

1
задан 19 December 2013 в 01:20
1 ответ

Оглядываясь назад, думаю, я должен был знать. Ответ состоит из двух частей, потому что, на мой взгляд, есть запланированное аварийное переключение и «реальное» / unplanned failover --- и запланированное аварийное переключение не учитывается.

Запланированное аварийное переключение

Запланированное аварийное переключение - это фактически просто система кластеризации, опустошающая узел, а затем перезагружающая его за вас. Поэтому, когда вы напрямую перезагружаете узел через RDP или «Stop Cluster Service» в графическом интерфейсе приложения Clustering, первое, что происходит, - это виртуальные машины отключаются с Live Migrated. Поскольку на самом деле вы просто переносите виртуальные машины в реальном времени, время, которое потребуется, зависит от того, что нужно перенести, и от сетевого подключения. Если у вас сетевая карта 1 ГБ, это займет некоторое время (~ 118 МБ / с). Чем больше оперативной памяти у ваших виртуальных машин, тем лучше обслуживаются более быстрыми сетевыми адаптерами .

Настоящее аварийное переключение

Незапланированное / «настоящее» аварийное переключение происходит при отключении машины. В этом случае кластерная система автоматически запускает виртуальную машину на другом узле. Поведение для внешнего мира такое же, как если бы вы перезагрузили виртуальную машину. Для виртуальной машины это то же самое, как если бы вы ее "выключили", а затем снова запустили. Таким образом, «реальное» аварийное переключение всегда связано с тем, сколько времени требуется вашим виртуальным машинам для загрузки.

Tangent

Это разочарование для меня, концептуально, потому что я чувствую, что все разговоры о кластеризации на « Net предполагает, что ("жесткий") отказ узла скрыт системой кластеризации - это должно быть похоже на то, что службы никогда не прекращали работу. Скорее всего, это связано с тем, что все веб-страницы, которые я читал, тестировали отказоустойчивость кластера в программном обеспечении (плановое переключение на отказ). Так что все, что они на самом деле делают, - это доказывают, что Live Migration работает так, как заявлено (без простоев с точки зрения клиента).

Моя главная ошибка заключалась в непонимании самого аварийного переключения. В дополнение к концепции сервера горячего / горячего / холодного резервного копирования, когда на горячем сервере происходит автоматическое переключение при отказе, существует также переключение на горячий / теплый / холодный отказ. Как упоминалось здесь , горячее аварийное переключение происходит мгновенно, горячее аварийное переключение измеряется в секундах, а холодное аварийное переключение измеряется в минутах. Я был наивен, полагая, что все автоматические отказы «горячие». Думаю, я ожидал какой-то магии с ОЗУ, когда кластер обновит копию ОЗУ виртуальной машины на другом узле - что-то вроде доставки журналов транзакций с помощью Sql Server. Но для этого потребуется канал связи между машинами, по крайней мере, такой же быстрый, как RAM, чтобы гарантировать, что он будет работать.

там, где автоматическое переключение происходит на горячем сервере, есть также горячее / теплое / холодное переключение. Как упоминалось здесь , горячее аварийное переключение происходит мгновенно, горячее аварийное переключение измеряется в секундах, а холодное аварийное переключение измеряется в минутах. Я был наивен, полагая, что все автоматические отказы «горячие». Думаю, я ожидал какой-то магии с ОЗУ, когда кластер обновит копию ОЗУ виртуальной машины на другом узле - что-то вроде доставки журналов транзакций с помощью Sql Server. Но для этого потребуется канал связи между машинами, по крайней мере, такой же быстрый, как RAM, чтобы гарантировать, что он будет работать.

там, где автоматическое переключение происходит на горячем сервере, есть также горячее / теплое / холодное переключение. Как упоминалось здесь , горячее аварийное переключение происходит мгновенно, горячее аварийное переключение измеряется в секундах, а холодное аварийное переключение измеряется в минутах. Я был наивен, полагая, что все автоматические отказы «горячие». Думаю, я ожидал какой-то магии с ОЗУ, когда кластер обновит копию ОЗУ виртуальной машины на другом узле - что-то вроде доставки журналов транзакций с помощью Sql Server. Но для этого потребуется канал связи между машинами, по крайней мере, такой же быстрый, как RAM, чтобы гарантировать, что он будет работать.

Я был наивен, полагая, что все автоматические отказы «горячие». Думаю, я ожидал какой-то магии с ОЗУ, когда кластер обновит копию ОЗУ виртуальной машины на другом узле - что-то вроде доставки журналов транзакций с помощью Sql Server. Но для этого потребуется канал связи между машинами, по крайней мере, такой же быстрый, как RAM, чтобы гарантировать, что он будет работать.

Я был наивен, полагая, что все автоматические отказы «горячие». Думаю, я ожидал какой-то магии с ОЗУ, когда кластер обновит копию ОЗУ виртуальной машины на другом узле - что-то вроде доставки журналов транзакций с помощью Sql Server. Но для этого потребуется канал связи между машинами, по крайней мере, такой же быстрый, как RAM, чтобы гарантировать, что он будет работать.

4
ответ дан 3 December 2019 в 17:46

Теги

Похожие вопросы