Я удалил все узлы Azure AKS Kubernetes, как вернуть кластер в исходное состояние?

Я новичок в мире Azure AKS Cluster, и возившись с тестовым кластером, я удалил все его узлы с помощью kubectl delete node xxxx, думая, что кластер излечится сам. Боже, как я ошибался.

Теперь позвольте мне объяснить проблему: когда я запускаю kubectl get nodes, я получаю No resources found. В "Пулах узлов" на портале я вижу, что есть 3 узла, Я увеличивал и уменьшал пул, но в kubectl показывает отсутствие узлов - No resources found. Когда я запускаю kubectl get pods, все pods показаны в состоянии ожидания.

Дополнительная информация:

  • Кластер AKS был создан вручную, шаблон ARM или скрипт не был сохранен.
  • Кластер AKS использует Availability Set (а не Scale Set) для пула, поэтому я не могу добавить новый пул и перенести туда стручки. Pool, и переместить туда капсулы.

Мой вопрос(и) к вам:

  1. Как заставить узлы снова отображаться в kubectl? (В пуле сидит 3 ноды)
  2. Могу ли я как-то восстановить работу кластера? Переместить узлы как-то, куда-то?
  3. Что бы вы сделали в этом случае?

EDIT:

  • после некоторого времени показа "No Resources found", когда я запустил "kubectl get nodes", теперь 2 узла снова появились в сети, но один все еще отсутствует. Пул имеет счетчик 3. 2 узла, которые отображаются, находятся в состоянии готовности. Но все узлы все еще находятся в состоянии Pending. В событиях ошибок нет.

Новый вопрос:

  • Есть ли способ начать заполнять 2 готовых узла отложенными стручками?

Еще раз спасибо, друзья.

0
задан 3 June 2021 в 13:51
2 ответа

Если вы запустили узел удаления kubectl, он больше не зарегистрирован в Kubernetes. Если вы использовали масштабные наборы, то лучшим вариантом было бы уменьшить масштаб, а затем снова выполнить резервное копирование, чтобы получить новые узлы и перерегистрировать их. В вашем сценарии с наборами доступности у вас нет такой возможности. Вы можете посмотреть запуск обновления узла, которое может перерегистрировать его, или вы можете удалить виртуальную машину и заставить AKS воссоздать ее.

Все это говорит о том, что наборы доступности - это не способ использовать AKS в настоящее время, на вашем месте я бы просто удалил кластер и воссоздал его с помощью VMSS, учитывая, что это тестовый кластер.

2
ответ дан 28 July 2021 в 13:51

Спасибо всем за помощь. Итак, у нас был сеанс поддержки с командой поддержки MS, и, как всегда, рекомендация была первой обновите кластер до поддерживаемой версии AKS, и тогда мы сможем увидеть, что делать дальше. Я запустил az aks upgrade до следующей поддерживаемой версии, и все узлы правильно развернулись, и подключилось к серверу API Модули начали работать нормально, и кластер снова в сети. Итак, если быть точным - решение заключалось в обновлении кластера до поддерживаемой версии кластера AKS с помощью интерфейса командной строки.

Еще раз спасибо, ребята

1
ответ дан 28 July 2021 в 13:51

Теги

Похожие вопросы