Что является надежным инструментом стресс-тестирования для Dell R820 с VMware ESXi? [закрыто]

У нас есть Dell PowerEdge R820 под управлением VMware ESXi, в котором за последние два месяца было несколько ошибок ЦП. Первоначально он имел IERR на CPU1, а теперь показывает ошибки проверки CPU для CPU3. Я поменял местами CPU3 -> CPU2 и CPU1 -> CPU4, чтобы увидеть, будут ли ошибки следовать за процессорами вокруг. После замены сервер был включен примерно 72 часа, прежде чем я выполнил еще один DSET, и аппаратных ошибок больше не было. Я хочу запустить стресс-тест процессоров и памяти в течение примерно 24 часов, чтобы убедиться, что он сможет справиться с нагрузкой, когда мы перейдем в производство. Возможно, процессоры каким-то образом сместились во время доставки (незадолго до того, как мы начали получать первые ошибки).

Проблема в том, что я не знаю никаких инструментов стресс-тестирования для моей конкретной установки. Я пробовал использовать breakin , но он не загружается правильно. (Зависание при загрузке sb_edac). Есть ли инструмент, который вы можете порекомендовать использовать для стресс-тестирования R820 (Intel Xeon e5-4600) под управлением VMware ESXi?

1
задан 17 September 2013 в 17:55
1 ответ

In this case, you can just load a Linux live-CD or rescue CD containing the stress tool (I prefer the PLD Linux disc) and leave the server on a loop.

However, I would lean heavily on Dell support and replace the system board/CPUs and/or RAM. The server is not healthy! Debugging this type of thing may not be time-effective.

Did you capture the dump of the ESXi system? Support logs?

0
ответ дан 4 December 2019 в 09:01

Теги

Похожие вопросы