сторожевой таймер: поведение файла и синхронизирующих опций?

Мы захотим немного детали здесь, но у меня есть хорошая идея того, какова Ваша проблема. Во-первых, я предположу, что Вы используете Linux (из-за ссылки на загрузку). Затем, я хотел бы знать, какую версию агентов HP Вы используете. Вы используете версию ранее, чем 8,60? Если это так, проблема происходит, вероятно, из-за, Покидает в спешке агенты Драйвера.

Короче говоря, Вы захотите остановить агенты управления HP с /etc/init.d/hp-snmp-agents stop. Отредактируйте exclude строка в /opt/hp/hp-snmp-agents/cma.conf от:

exclude
кому:
exclude cmasm2d cpqriisd cmarackd

Запустите свои агенты снова с /etc/init.d/hp-snmp-agents start

См.: http://h30499.www3.hp.com/t5/ProLiant-Servers-Netservers/Proliant-Support-Pack-8-20-gt-Load-always-at-1/td-p/1069560

Также ответьте своими деталями. Какая модель Proliant - это? Эти вопросы были решены в 8,60 вариантах агентов. Как обычно, будет также иметь смысл обновлять Ваше встроенное микропрограммное обеспечение и использовать новейшую версию агентов.

Встроенное микропрограммное обеспечение Proliant и программное обеспечение управления (моделью).

3
задан 19 February 2013 в 19:41
1 ответ

Что вы имеете в виду под «если синхронизация не удалась»? На странице руководства для sync (2) говорится о кодах возврата: «sync () всегда выполняется успешно». Таким образом, единственный способ "потерпеть неудачу" в вашем случае заключается в том, что он не возвращает управление сторожевому таймеру достаточно быстро (из-за большого количества блоков для записи, медленной записи, поломки или повреждения диска или файловой системы или уровня ввода-вывода ядра, ... )

И если он не вернет управление сторожевому таймеру достаточно быстро, он не сможет писать в / dev / watchdog достаточно скоро, и ваш аппаратный сторожевой таймер должен запускать аппаратную перезагрузку.

stat (2) может иметь проблемы с незаписываемым диском только в случае ошибки такого типа, чтобы предотвратить чтение (ошибка ядра, поврежденный уровень ввода-вывода). И да, он мог зависнуть, если там есть проблема. Кстати, вы должны использовать «file = / var / log / messages» в сочетании с «change =», чтобы сторожевой таймер инициировал перезагрузку, если файл менялся недостаточно часто.

Что касается сторожевого таймера, вы абсолютно уверены, что аппаратный сторожевой таймер работает? Правильно ли вы модпробировали аппаратный модуль перед запуском сторожевого таймера? Об этом говорит dmesg (8)? если вы «KILL -STOP» сторожевой таймер, машина должна перезагрузиться. Если это так, вы можете попробовать добавить опцию «nowayout» в свой аппаратный модуль, чтобы исключить возможность, например, убийства OOM сторожевого таймера и, таким образом, остановки аппаратного сторожевого таймера.

0
ответ дан 3 December 2019 в 08:20

Теги

Похожие вопросы