У меня есть автономный ESXi 5.5.0 b2143827. Это работает на Dell R710 с 144 ГБ RAM. Это имеет приблизительно 20 VM's на нем.
Прямо сейчас я не могу добраться на консоль через клиент VMware vSphere или SSH. Это просто действует, как будто сервер не существует. Хост возвратится в на вид случайные времена, и я могу добраться на хост через SSH и vSphere клиент, но затем он просто уйдет сеть снова в неопределенное время в будущем. Я могу получить доступ к нему через чрезвычайную консоль на самом физическом хосте (Alt+F1
).
Однако весь VM's является активным и рабочим. Но приблизительно 10 раз в день, весь VMs привезет сеть для между 15 секундами и 5 минутами. Затем они возвратятся очень хорошо, и все продолжает отсчитывать.
Я сделал следующее:
/sbin/services.sh restart
- это не помогает ситуацииAlt+F1
) Я проверил с помощью ping-запросов другое физическое устройство в сети. Это не отбрасывает пакетов вообще.tail -f /var/log/hostd.log
некоторое время и ничего не видел неблагоприятный случай тамDD
'd карта к другой карте, затем загрузил его на новой карте. Та же проблема.Я в замешательстве, куда пойти отсюда. Этот сервер работал безупречно в течение прошлых 2,5 лет. VMware раньше устанавливался на физическом диске, но 6 месяцев назад он перешелся на SD-карту, таким образом, мы могли реконфигурировать физические диски.
После 3 дней отсутствия прекратите устранение неполадок, я в конце концов обнаружил, что проблема в том ... подождите ... наш Cisco ASA взламывает сам себя и наводняет сеть фиктивным трафиком.
Поскольку мы выполняли довольно простую коммутацию, а серверная среда - 100 % virtualised, мы ничего не заметили внутри сетевого стека.
Самым большим отвлекающим фактором, от которого я столкнулся, был пинг гостевой ОС с ее хоста. Я бы подумал, что это было полностью автономно по отношению к физическим сетевым адаптерам, но, по-видимому, нет.
В конце концов я обнаружил проблему, зеркалировав порт управления на коммутаторе и наблюдая за трафиком к нему / от него с помощью Wireshark, и наблюдая, как трафик покидает источник порт, но никогда не прибывают в пункт назначения. Поскольку я не мог видеть его внутри самой сети, мне потребовалось всего 4 часа, чтобы изолировать ASA как источник проблемы.
После удаления ASA из сети все шло гладко.
Оказалось, что ASA не взломал сам себя, кто-то создал искаженное правило NAT, в котором не было no-proxy-arp
], поэтому он начал отвечать на запросы ARP по всему внутреннему / 24. Удаление этого правила и оказание твердой поддержки тому, кто его добавил, и теперь у нас есть что, почему и кто.
Это также объясняет, почему сеть только для хоста не работала должным образом. ASA отвечал на запрос ARP, поэтому хост не знал, что нужно сделать его сетевым запросом только для хоста.
Я бы посоветовал обновить прошивку сетевых адаптеров Broadcom на вашем сервере Dell PowerEdge. Тот факт, что вы видите проблему с внешним подключением в дополнение к пингам, специфичным для виртуальной машины, указывает на проблему с сетевой картой.
Что касается загрузки SDHC, я действительно рекомендую использовать загрузку SD / USB только на серверах ESXi, которые входят в vSphere и общее хранилище. Из-за режима отказа этих карт под ESXi нет никаких преимуществ в использовании их для загрузки автономных систем. Посмотрите разницу между устанавливаемым и встроенным режимами ESXi .