Сегодня один из моих серверов начал отправлять мне предупреждения о неоптимальном состоянии RAID. Они были инициированы очень простым скриптом, запущенным кроном - если он обнаруживает, что не все диски сообщают об 'Оптимальном' состоянии, он отправляет предупреждение.
Теперь, проблема - то, что RAID, кажется, прекрасен, но megacli -LDInfo -Lall -aALL
команда, вызванная сценарием, приводит неоднократно отъезд к сбою загадочного сообщения об ошибке в системном журнале: megacli: Failed to alloc kernel SGL buffer for IOCTL
. Любопытная вещь состоит в том, что команда действительно иногда работает и действительно возвращает вывод, но большую часть времени это просто возвращает две пустых строки и код выхода:
# megacli -LDInfo -Lall -aALL Exit Code: 0x00
То же идет для megacli
с другими параметрами как megacli -AdpAllInfo -aAll
. Каждый раз, когда команда перестала работать, упомянутая ошибка появляется в системном журнале.
Этого никогда не происходило прежде, насколько я могу помнить. Никакие изменения не были недавно внесены в сервере. Адаптер является a PERC 6/i Integrated
и сервер работает под Хрипящим Debian.
Какова могла возможно быть проблема и где я начинаю разрешать это?
Править:
# megacli -v MegaCLI SAS RAID Management Tool Ver 5.00.12 May 08, 2009 (c)Copyright 2009, LSI Corporation, All Rights Reserved. Exit Code: 0x00
По крайней мере, эта команда работает каждый раз, не инициировав ошибку ;) Я только что понял, что это - старый выпуск megacli. Однако, это не должно иметь значения, так как та же самая установка работала пара дюжины месяцев без проблемы и теперь внезапно решила взбеситься.
Для этой проблемы есть отчет об ошибке в debian, см .:
https: // bugs .debian.org / cgi-bin / bugreport.cgi? bug = 703356
Похоже, что на данный момент исправления нет, и это также происходит с последними ядрами. Мой личный подозреваемый - Зен. Вы запускаете Xen на этом хосте?