Невозможно переместить ресурс ядра кластера

Я пытаюсь переместить основные ресурсы кластера с одного узла на другой в четырехузловом WSFC (это все виртуальные машины, работающие на Compute Engine в Google Cloud, Windows Server 2012 R2, каждая в отдельной подсети). Я запускаю

Move-ClusterGroup -Name "Cluster Group" -Node mynode

и получаю сообщение об ошибке:

Move-ClusterGroup: произошла ошибка при перемещении кластерной роли «Группа кластеров». Операция завершилась неудачно, потому что либо указанный узел кластера не является владельцем группы, либо узел не является возможный владелец группы

Я успешно переместил Доступную группу кластера хранения таким образом, это просто эта операция завершилась неудачей. В кластере размещается группа доступности SQL Server, которая подключена и работает, как ожидалось, и ранее неоднократно подвергалась сбоям.

В первый раз, когда я попытался сделать это, я получил сообщение об ошибке в событиях кластера:

Cluster ресурс «IP-адрес кластера [IP-адрес текущего хоста]» типа «IP-адрес» в кластерной роли «Группа кластера» не удалось.

На основании политик сбоев для ресурса и роли служба кластера может попытаться вернуть ресурс онлайн на этом узле или переместите группу на другой узел кластера, а затем перезапустите ее. Проверьте состояние ресурса и группы с помощью диспетчера отказоустойчивого кластера или командлета Windows PowerShell Get-ClusterResource.

Я проверил ресурсы IP для ресурсов ядра кластера и увидел, что у каждого из них есть возможный владелец всех 4 узлов, несмотря на то, что он ошибся подсети. Похоже, он пытался поднять текущий IP-адрес на целевом хосте, что, конечно, не сработало. Я удалил 3 ips в "неправильной" подсети из каждого ресурса кластера и с тех пор получаю первое сообщение об ошибке, которое я здесь включил.

Я запустил Get-ClusterGroup -Name "Cluster Group" | Get-ClusterOwnerNode , который изначально возвращал {} для OwnerNodes. С тех пор я пытался добавить текущего владельца + узел, который я m пытается перейти на использование Set-ClusterOwnerNode , и теперь я вижу двух, которых я ожидал бы, в качестве возможных владельцев, но это не имело никакого значения для перехода.

Я действительно задавался вопросом, может ли это быть Проблема с DNS. Я полагаю, что правильно иметь только одну запись в DNS для кластера с текущим онлайн-IP, поэтому она должна обновляться во время перемещения (в отличие от наличия нескольких записей A с разными IP-адресами). Я попытался обновить безопасность на этом, просто предоставив 2 узлам полный контроль на некоторое время, а также проверив разрешения для объекта кластера (который уже имел разрешения). Я больше не работал с AD / DNS, потому что не хочу облажаться.

Я провел проверку кластера, и она не дала ничего, что я мог бы считать причиной этого. Есть предупреждения против: различные ресурсы ядра IP-кластера, потому что они больше не могут принадлежать каждому узлу, настройки HostRecordTTL и RegisterAllIP, неподписанные драйверы, некоторые различия в программном обеспечении на 2 узлах (только обновления, которые были применены к тому, на который я пытаюсь перейти ).

0
задан 29 December 2017 в 13:10
1 ответ

Кажется, я исправил это:

Я добавил все узлы обратно к возможному владельцу всех IP-адресов на основе ошибки из командлета Move-ClusterGroup . Пытаясь переместиться снова, я получил начальную ошибку, пытаясь поднять IP-адрес подсети1 на узле в другой подсети. На этот раз я повторил аварийное переключение и превысил «максимальное количество перезапусков за указанный период», поэтому вместо того, чтобы просто вернуться в онлайн на узле подсети1, группа кластеров перешла в автономный режим. Как только это произошло, я вручную подключил IP-адрес подсети 2 через графический интерфейс. Это сработало и вывело группу кластеров на предполагаемый узел.

Как только я это сделал, я мог бы использовать Move-ClusterGroup между этими двумя узлами, как я и ожидал. Перемещение на узел в третьей подсети все еще не удалось, но выполнение того же трюка по отключению группы кластеров и ручному вводу IP-адреса кластера в оперативный режим сработало для этого узла.

Я действительно не знаю, что здесь произошло, я можно только сделать вывод, что это какое-то повреждение метаданных / реестра, которое было исправлено, когда IP был переведен в онлайн вручную. Возможно, кто-нибудь еще сможет меня просветить.

0
ответ дан 5 December 2019 в 06:56

Теги

Похожие вопросы