Micosoft HPC Pack 2012 R2 не работает с Network Direct после присоединения к новому домену

Я работаю с кластером из 13 компьютеров, работающим на Windows Server 2012 R2, с использованием MS HPC Pack 2012 R2. Головной узел работает нормально. Серверы подключены к корпоративной сети по IPv4 на стандартных адаптерах. Однако узлы также связаны друг с другом через infiniBand.

Неделю назад кластер был перемещен в новый домен с теми же именами хостов. Полное доменное имя, конечно, изменилось, и в большинстве случаев оно работает правильно, за исключением того, что для Network Direct теперь установлено значение false на всех 12 вычислительных узлах.

После миграции на головном узле были переустановлены все компоненты HPC. Узлы остались нетронутыми. Поскольку я думал, что это причина включения Network Direct, я также попытался переустановить HPC на одном из узлов. Это не решило проблему.

Брандмауэр Windows выключен на всех уровнях на всех узлах, включая головной.

В

  • адаптере ifiniBand на головном узле: Mellanox ConnectX-3 Pro IPoIB Adapter
  • inifiniBand адаптер на узлах: HP 10Gb / 40Gb 2-портовый 544 + адаптер FLR-QSFP IPoIB

Серверы отвечают на PING-запросы на IP-адреса, заданные для адаптеров infiniBand.

У кого-нибудь есть идеи по этому поводу? Заранее спасибо.

3
задан 11 March 2018 в 18:59
1 ответ

Прошивка сетевых карт Mellanox в Etherent, чтобы все работало надежно. InfiBand с Windows - это такая ПИТА!

http://www.mellanox.com/page/firmware_table_ConnectX3IB

2
ответ дан 3 December 2019 в 06:54

Теги

Похожие вопросы