У нас возникают сбои на наших SSD VPS, все работают на KVM: сбои происходят по разным причинам; спешу восстановить службу, которую моя команда использует для перезагрузки предыдущего снимка машины и никогда не сохраняет журналы.
В любом случае, среди всех различных обстоятельств сбоев, повторяющимся фактом является повреждение данных в памяти
: наш провайдер VPS сообщил нам, что их оборудование работает нормально, но я не знаю, как читать предоставленный мне плохой журнал.
Что происходит при обнаружении «повреждения данных в памяти»? Может ли это быть из-за сломанной оперативной памяти или есть другие виды повреждения памяти?
Забавно: провайдер VPS, использующий VMware, никогда не доставлял нам проблем, тот, кто использует KVM, действительно сводит нас с ума из-за этих сбоев.
Edit 1 : Я ни в коем случае не требую, чтобы вы вывели решение из этого жалкого журнала. Я застрял в этой проблеме из-за отсутствия подходящего журнала, memtest
бесполезен, поскольку оборудование эмулируется, и поставщик VPS подтвердил, что его оборудование в порядке и ни один экземпляр KVM или QEMU не сломался. Обнаружено повреждение данных в памяти
преследует меня, и я могу ' Я не думаю о каком-либо продуктивном подходе к дальнейшему исследованию этого вопроса.
" Обнаружено повреждение данных в памяти " не обязательно означает, что аппаратная RAM плохой. Это также может указывать на то, что блок был прочитан или записан неправильно, хранилище немного перевернулось или произошел сбой, возможно, ошибки файловой системы и несколько других причин.
Возврат к моментальному снимку, вероятно, не решит проблему, если существует некоторое скрытое повреждение файловой системы; оно просто появится позже.
Вместо этого вы должны xfs_repair
файловую систему, но поскольку это корневая файловая система, вам необходимо загрузиться из установки носитель или среда восстановления, предоставленная вашим поставщиком VPS.
Если xfs_repair
не может восстановить файловую систему, вы можете запустить xfs_repair -L
, чтобы очистить журнал XFS ( который сам может быть поврежден), а затем попробуйте снова восстановить файловую систему.