Низкая скорость сети на хостах ESXi

Я занимался этой проблемой около полугода (имел роскошь времени) и не смог ее решить, так что я наконец подал в отставку и пришел сюда, чтобы попросить помощи у других, а не только у Google (наша поддержка vmware закончилась около 3 лет назад, и наши руководители предпочли не заказывать продление от vmware).

Проблема

Я не занимался с производительностью виртуализации или виртуальных машин все работает нормально. Я действительно получил удар в спину, когда мне нужно было установить новое программное обеспечение для резервного копирования виртуальных машин. Все хосты, хранилища и серверы резервного копирования оснащены сетевыми адаптерами 10GigEth и подключены к одному коммутатору 10Gig. Когда я хочу скопировать VMDK с хоста и его хранилища, подключенного к iSCSI, на сервер резервного копирования, скорость будет стабильной 150 Мбит / с. Каждую ночь мне приходится делать резервную копию примерно 2-5 ТБ, и с такой скоростью это невозможно. Цель состоит в том, чтобы увеличить скорость копирования как минимум до 100 МБ / с (5 ТБ примерно за 14 часов).

Топология

  • Сеть X 192.168.xxx.0 / 24
  • Сеть Y 10.0 .yyy.0 / 24
  • Корпоративная сеть (мы не управляем ею, мы ее только используем), которая включает в себя различные vlan для физических устройств и виртуальных машин.
    • Сетевая VLAN A
    • Сетевая VLAN B

Топология кластера

Cluster topology

10-гигабитный коммутатор Dell действительно является сердцем кластера, поскольку все подключено к нему кабелем Cat6. Коммутатор SW2 подключается к нему шлейфом и служит точкой подключения для резервного подключения от хоста ESXi к сети X. На любом из этих коммутаторов нет других vlan, кроме 1 (по умолчанию). Все хосты и серверы подключены к VLAN A (или B), чтобы быть доступными из наших офисов и иметь доступ к Интернету, а также к остальной части корпоративной сети. Datasotres для кластера - это хранилища Dell (SFP) и HP (Copper), подключенные через iSCSI ко всем пяти хостам. Все хосты и серверы ESXi имеют медную связь Cat5 с SW3 в сеть Y, где также подключены все BMC и другие порты управления. На одном из резервных серверов включена маршрутизация для предоставления доступа к Интернету в сети X через сеть VLAN A. vMotion включен в сетях X и VLAN A. Все сетевые адаптеры 10Gig от устройств в сети X имеют включенные jumbo-фреймы и сообщают о скорости 10Gb в полнодуплексном режиме

Тесты

Я тестировал довольно много программ резервного копирования, и с тех пор У rig было только сетевая карта 100Base, я тогда не видел проблем с производительностью сети, но когда мы купили программное обеспечение и обнаружили, что скорость не будет превышать 150 Мбит / с, я понял, что мне нужно сделать некоторые настройки. То, что я пробовал, следует. Скорость результата каждого теста составляла 150 Мбит / с , если не указано иное.

  1. Это желаемый пример использования. Серверы резервного копирования подключаются через сеть X к хосту и загружают все резервные копии (в форме моментальных снимков) в локальное хранилище и / или хранилище NAS.
  2. Я создал прямую связь от одного из 10-гигабайтных портов хоста к 10-гигабайтному серверу резервного копирования. порт и попробовал SCP, WINSCP, SSH и программное обеспечение для резервного копирования, чтобы загрузить моментальный снимок виртуальной машины из хранилища Dell.
  3. Я создал хранилище NFS на одном из серверов резервного копирования и перенес на него тестовую виртуальную машину (~ 500 МБ / с, 20 ГБ, стабильно), затем я снова попробовал методы в Тесте 2.
  4. Я отключил хост ABC (сетевая VLAN A) от кластера и повторно подключил его как XYZ (сеть X), удалил его подключение к сети VLAN A и его соединение 1Gig в X и снова попробовал Тест 3. Миграция (~ 500 МБ / с, 20 ГБ, стабильная).
  5. Я возился с настройками виртуального коммутатора и политикой пропускной способности при выполнении тестов 1, 3 и 4.
  6. Я попытался запустить 20 заданий резервного копирования одновременно, и каждое из них выполнялось на 150 Мбит / с. Затем я начал запускать больше заданий, и скорость на всех из них начала снижаться примерно на 30-32 одновременно выполняемых задания, так что доступная пропускная способность составляет не менее 550 МБ / с.

Инфраструктура

  • Пять идентичных компьютеров Dell PowerEdge R610 (двойной Xeon X5660, 200+ ГБ ОЗУ, 4x GLAN (Broadcom NetXtreme II BCM5709), 1x двойной 10GLAN (Intel 82599), без внутренней памяти)
  • Три корпуса Dell PowerVault (10 ТБ каждый, 10 тысяч жестких дисков SAS по 600 ГБ каждый)
  • Один HP MSA 2040 (10 ТБ,три SSD-диска SAS 300 ГБ в качестве кэша, остальное - 10 тыс. жестких дисков SAS)
  • SW1 Dell PowerConnect 8024
  • SW2 Cisco 2960G
  • SW3 Cisco 2950
  • Сервер резервного копирования Dell PowerEdge R530
  • Сервер Vsphere Sunfire (что-то- old)

Я действительно могу сказать, где проблема, но, на мой взгляд, это будет в ESXi. Виртуальные машины могут без проблем достигать скорости 500 МБ / с между собой на разных хостах, но сами хосты не могут.

Я буду очень признателен за каждый ответ на это и дам разъяснения по каждой неясной детали.

1
задан 27 April 2020 в 14:05
2 ответа

Зависит от версии SQL Server и версии Windows Server 2012.
Далее по ссылке, которую вы сами разместили.

Но, насколько я могу судить, все версии Windows Server 2012 поддерживают все версии SQL Server 2016.

Полный список по ссылке выше:

SQL Server Enterprise

Windows Server 2016 Datacenter

Windows Server 2016 Standard

Windows Server 2012 R2 Datacenter

Windows Server 2012 R2 Standard

Windows Server 2012 R2 Essentials

Windows Server 2012 R2 Foundation

Windows Server 2012 Datacenter

Windows Server 2012 Standard

Windows Server 2012 Essentials

Windows Server 2012 Foundation

SQL Server Standard

Windows Server 2016 Datacenter

Windows Server 2016 Standard

Windows Server 2012 R2 Datacenter

Windows Server 2012 R2 Standard

Windows Server 2012 R2 Essentials

Windows Server 2012 R2 Foundation

Windows Server 2012 Datacenter

Windows Server 2012 Standard

Windows Server 2012 Essentials

Windows Server 2012 Foundation

Windows 10 Home

Windows 10 Professional

Windows 10 Enterprise

Windows 8. 1

Windows 8.1 Pro

Windows 8. 1 Enterprise

Windows 8

Windows 8 Pro

Windows 8 Enterprise

SQL Server Web

Windows Server 2016 Datacenter

Windows Server 2016 Standard

Windows Server 2012 R2 Datacenter

Windows Server 2012 R2 Standard

Windows Server 2012 R2 Essentials

Windows Server 2012 R2 Foundation

Windows Server 2012 Datacenter

Windows Server 2012 Standard

Windows Server 2012 Essentials

Windows Server 2012 Foundation

. 121---438058-

Возможно, это не тот совет, которого вы ожидаете, но это решит вашу проблему ^^

Решение заключается в том, чтобы выполнять полное резервное копирование еженедельно, а не ежедневно.

Это один из первых уроков реального мира, когда человек начинает делать резервные копии (и проверять их :D). Большие ежедневные резервные копии просто не успевают завершиться за день. Короче говоря, резервное копирование ТБ в день нецелесообразно, потому что хосты, сеть и хранилище просто не успевают за передачей данных.

Стандартной практикой является резервное копирование, в крайнем случае, ежедневное раздельное и еженедельное полное. VmWare имеет встроенные способы обработки инкрементных снимков, которые зависят от того, за какую редакцию вы платите. Посмотрите в ESXi, что можно настроить.

VmWare также будет умнее в том, чтобы не копировать одно и то же содержимое по сети, я готов поспорить, что огромные vmdk почти не меняются день ото дня. Минимум для передачи больших файлов - использовать rsync вместо sftp/scp, rsync передает diff только для больших файлов.

1
ответ дан 7 May 2021 в 18:30

Мы используем veeam backup. Он показывает нам, где и какое процентное узкое место существует в нашей инфраструктуре резервного копирования: источник, сеть, цель. Источник - это место, где находятся данные, сеть - это чистое место, а цель - это место, где мы храним резервные копии.У меня была такая же проблема, и я нашел ее в скорости хранения, после чего узкое место изменилось на источник, и я добавил несколько прокси для резервного копирования, а после этого сеть, изменив MTU, мы решили эту проблему.Надеюсь, это поможет вам

1
ответ дан 7 May 2021 в 18:30

Теги

Похожие вопросы