Сервер становится безразличным после нескольких дней

У меня есть выделенный сервер, который становится безразличным после нескольких дней времени выполнения. Иногда это - 1 день, и иногда это - 5 дней, но это всегда происходит, и я не могу ни достигнуть сервера через ssh, ни войти в супермикро панель управления.

Я должен выключиться и на сервере от панели управления моего поставщика для создания сервера доступным снова.

Сервер не выполняет что-то тяжелое, просто установка ЛАМПЫ.

Как я могу диагностировать это, чтобы видеть что случилось и устранить проблемы?

Единственная видная вещь, которую я нашел, находится в messages файл:

Aug 16 18:01:50 server1 kernel: sbridge: HANDLING MCE MEMORY ERROR
Aug 16 18:01:50 server1 kernel: CPU 0: Machine Check Exception: 0 Bank 7: 8c00004000010093
Aug 16 18:01:50 server1 kernel: TSC 0 ADDR 2804ab80 MISC 214042c286 PROCESSOR 0:306e4 TIME 1439766110 SOCKET 0 APIC 0
Aug 16 18:01:50 server1 kernel: EDAC MC0: CE row 6, channel 0, label "CPU_SrcID#0_Channel#3_DIMM#0": 1 Unknown error(s): memory read on FATAL area : cpu=0 Err=0001:0093 (ch=3), addr = 0x2804ab80 => socket=0, Channel=3(mask=8), rank=2
0
задан 19 August 2015 в 15:16
1 ответ

Аппарат сообщает об ошибке ОЗУ и даже сообщает, какой модуль поврежден. Рекомендация: замените этот модуль и посмотрите, исчезнет ли проблема.

0
ответ дан 5 December 2019 в 12:21

Теги

Похожие вопросы