Our server Supermicro SYS-6016T-U often crashes due to https://bugs.centos.org/view.php?id=10642 .
Since it's unable to write to disk, crash info isn't saved. I also cannot login using either IPMI
kvm console or ssh
to run dmesg.
How to configure it to save its errors to some network location? (actually, NetworkManager
crashes too, so the network card may lose its config) Or maybe the ipmi device has some buffer for that?
I made a mistake and reserved 100% disk space for software raid. Not sure I can use kdump now
Я думаю, вам следует настроить kdump . Он довольно хорош в том, что делает, поскольку он запускает новое ядро, чтобы фиксировать состояние старого. Я использовал его для сбора данных о сбоях ядра, которые позже использовались RH для исправления ошибки kenel.
Похоже, есть также способ обхода ошибки, с которой вы столкнулись - понизьте версию ядра до 3.10.0- 229.4.2