Безразличный сервер ESXi 5.5

У меня есть хост, который является частью 4 кластеров хоста в HA.

Когда-то вчера я заметил, что хост прекратил отвечать в vsphere консоли, это разоблачает greyed как (не отвечающий), и все VMs на нем обнаруживаются как (недоступные). VMs их сам все еще работают обычно, я могу удаленный рабочий стол им, и все произошло. На этой машине существуют критические серверы. Я попытался щелкнуть правой кнопкой по хосту и "Подключению" после нескольких часов, которые это просто приводит к сбою. Я не могу переместить VMs в него, все действия отображаются серым. На Хосте F2 нажатия дает мне приглашение ко входу в систему после ввода моих учетных данных, ничего не происходит. ALT+F1 не позволяет мне сделать что-либо, поскольку он не включен. SSH не включен. С ALT+F11 I видят, что hostd отказал, это - вероятно, проблема. Я назвал VMware, поскольку у меня есть полная поддержка, но после того, как очень краткосрочный вызов, который он сказал, там не имеет отношения, но сильно завершать работу хоста.

Я не сделал бы этого, я хотел бы перезапустить hostd, но у меня, может казаться, нет доступа. Я попробовал PowerCLI, но соединение с хостом испытывает таймаут. Vsphere непосредственно к хосту также испытывает таймаут. Проверка с помощью ping-запросов работ хоста, таким образом, по крайней мере, существует сеть.

Кто-либо знает какой-либо другой способ получить оболочку?

Спасибо.

Подробнее: Выполняя ESXI 5.5.0 1331820, на Dell PowerEdge R720, Dell PERC H710

Я проверил DRAC, и локальный том здоров. Это - на самом деле только набег 1, все VMs находятся на SAN. VMware esxi работы страницы приветствия, но если я нажимаю на "browse datastores in this host's inventory" это, никогда не обнаруживается. Толпа, кажется, работает правильно также "hostip/mob/? moid=ServiceInstance&doPath=content";

На консоли ALT+F11: 2014-09-11T7:15:02.329Z cpu12:57750311) hostd обнаруженный, чтобы быть non-reponsive

Та же строка, другое время и CPU 11 раз.

3
задан 11 September 2014 в 19:27
1 ответ

Для меня это звучит, как проблема с локальным хранилищем. Я работал в окружении сотен хостов ESXi, которые работали на локальном RAID-массиве. К сожалению, локальные контроллеры хранилищ в аппаратуре были нестабильны... токсичная смесь плохих версий LSI прошивок, дефектных объединительных плат и аппаратуры Supermicro.

Но поведение, которое вы описываете, говорит о проблеме с локальным хранилищем. Ваши работающие ВМ находятся в оперативной памяти, сетевой стек не затронут, но возможность управления хостом скомпрометирована. Ваш логин не работает, потому что хост не может читать с локального диска. То же самое относится и к любым другим командам, требующим доступа к диску.

Вашим лучшим вариантом здесь является планирование упорядоченного выключения ВМ (из гостевых операционных систем). Оттуда вручную выйдет из строя хост (выключение питания, перезагрузка и т.д.) Пусть он остается в режиме обслуживания или за пределами выбора кластера. Включите свои ВМ и позвольте им работать в другом месте кластера vSphere.

Если вы заинтересованы в отладке проблем хоста, проверьте Dell DRAC на предмет информации о состоянии массива хранилища. Это укажет вам правильное направление

.
2
ответ дан 3 December 2019 в 07:01

Теги

Похожие вопросы