В праздничные выходные у одного из наших клиентов отключилось электричество. Когда все снова подключилось к сети, казалось, что с большинством устройств все в порядке, но некоторые (один из наших хостов ESXi и несколько VDI) не смогли получить правильный IP-адрес. Они получали 169 APIPA из Windows. Я просмотрел журналы DHCP, и с момента отключения электроэнергии было 0 договоров аренды или продления. Это было похоже на то, как будто DHCP простаивал все выходные.
Я отказался от него, и внезапно все арендные договора начали поступать, и все, что получало APIPA, получило нормальный адрес, и все вернулось в норму.
Мой вопрос: есть ли какие-то настройки с DHCP, которые заставляют его действовать таким образом? Мне кажется, что серьезный сбой не должен нарушить DHCP, особенно если он получает новую перезагрузку.
Я хотел бы выяснить, что произошло, чтобы в случае следующего сбоя мы не столкнулись с теми же проблемами.
12259] Временная шкала журнала:
25 ноября, 23:15, сервер запущен после сбоя:
00,11/25/20,23:12:23,Started,,,,,0,6,,,,,,,,,0
64,11/25/20,23:12:23,No static IP address bound to DHCP server,,,,,0,6,,,,,,,,,0
примерно через час устройства начинают терять свои адреса:
24,11/26/20,00:00:19,Database Cleanup Begin,,,,,0,6,,,,,,,,,0
18,11/26/20,00:00:19,Expired,10.x.x.16,,,,0,6,,,,,,,,,0
18,11/26/20,00:00:19,Expired,10.x.x.18,,,,0,6,,,,,,,,,0
18,11/26/20,00:00:19,Expired,10.x.x.19,,,,0,6,,,,,,,,,0
etc...
Через пару часов после этого записи начинают удаляться
24,11/26/20,03:12:24,Database Cleanup Begin,,,,,0,6,,,,,,,,,0
16,11/26/20,03:12:24,Deleted,10.x.x.16,,,,0,6,,,,,,,,,0
16,11/26/20,03:12:24,Deleted,10.x.x.18,,,,0,6,,,,,,,,,0
16,11/26/20,03:12:24,Deleted,10.x.x.19,,,,0,6,,,,,,,,,0
etc...
После этого никаких действий, кроме очистки базы данных:
24,11/26/20,21:12:29,Database Cleanup Begin,,,,,0,6,,,,,,,,,0
25,11/26/20,21:12:29,0 leases expired and 0 leases deleted,,,,,0,6,,,,,,,,,0
25,11/26/20,21:12:29,0 leases expired and 0 leases deleted,,,,,0,6,,,,,,,,,0
24,11/26/20,22:12:29,Database Cleanup Begin,,,,,0,6,,,,,,,,,0
etc... (until reboot)
Сегодня, когда я перезагрузился, все снова начало получать адреса
01,11/30/20,05:17:21,Stopped,,,,,0,6,,,,,,,,,0
00,11/30/20,05:17:26,Started,,,,,0,6,,,,,,,,,0
55,11/30/20,05:17:26,Authorized(servicing),,<redacted>.net,,,0,6,,,,,,,,,0
10,11/30/20,05:17:26,Assign,10.x.x.16,<redacted>
10,11/30/20,05:17:26,Assign,10.x.x.18,<redacted>
10,11/30/20,05:17:26,Assign,10.x.x.74,<redacted>
etc...
Это не ответ на на ваш вопрос, поскольку я считаю, что информации недостаточно, чтобы действительно определить, что произошло.
Для предотвращения проблем с серверами DHCP многие системные администраторы предпочитают давать своим серверам фиксированные IP-адреса. При этом я предпочитаю отдавать в аренду как можно больше устройств DHCP, чтобы иметь центральную базу данных с информацией об IP-адресах.
Для портативных компьютеров приемлемо короткое время аренды (например, 2-4 часа). DHCP-клиент обновит свою аренду через половину срока аренды (то есть 1-2 часа), что идеально подходит для людей, которые не работают в одном месте 8 часов. Вы также можете установить более длительный срок аренды, например 8 часов.
Однако для серверов и принтеров, и в целом для любого резервирования DHCP, вы можете значительно увеличить время аренды, так как они никогда не получат другой IP-адрес. Если вы установите, например, 30 дней, он запросит продление через 15 дней, и если ваши DHCP-серверы не работают более 15 дней, у вас будут большие проблемы, чем у других серверов, не получивших IP-адреса.
Я не называю это «Решением» на данный момент, так как мы не видели другого полного отключения с момента последнего произошло, но мы тестируем идею о том, что (по какой-либо причине) сетевая карта не завершает запуск при запуске службы DHCP. Мы настроили службу DHCP на отложенный запуск.
Это единственное, о чем мы можем думать, что могло бы объяснить странное поведение.
Я обновлю это, если окажется, что это сработало, но это может занять некоторое время поскольку сбои такого масштаба случаются нечасто.