У меня есть несколько виртуальных машин Ubuntu 18.04.1, установленных на VMWare ESXi 6.5, все они имеют 3 ядра, 3 ГБ оперативной памяти, подключенные к массиву SAS Storage.
Серверы работают под управлением nginx 1.14.0
в качестве обратного прокси для 3-5 виртуальных хостов. ufw
включен, чтобы разрешить SSH с IP-адресов LAN и http / https с остальных.
Когда я выключаю ufw
, сервер случайным образом имеет одно ядро на 100% и становится не отвечает на консоли, но также больше не отвечает на веб-запросы. Это также иногда случается, когда ufw
включен, но гораздо реже.
Что может случиться, если сервер сделает это? И как этого избежать?
Вывод iptables-save
Проблема оказалась известной ошибкой VMWare ESXi 6.5.0
в сочетании с драйвером VMXNET3
.
После VMWare KB2151480 устранил проблему.
Какие процессы используют больше всего ЦП в это время? Вы видите что-нибудь в syslog или dmesg в это время? Одна вещь, которую вы можете попробовать, - это установить поверх, а затем вернуться через журналы поверх, после того, как это произойдет, чтобы увидеть, какие процессы поглощают процессор. Как выглядит сетевой трафик в веб-клиенте vsphere для этих виртуальных машин прямо перед тем, как они перестанут отвечать? Это может быть син-флуд или что-то подобное, но ufw тоже может быть отвлекающим маневром.