Добавьте сценарий RC или эквивалент. Имейте его, касаются файла нормального завершения работы. На запуске имейте его проверка на файл и пошлите электронное письмо, если файл не там. Например:
#!/bin/bash
SHUTDOWNFILE=/etc/normalshutdown
if [ ${1} = "stop" ] then touch "${SHUTDOWNFILE}"
elif [ ${1} = "start" ]
then
if [ ! -e "${SHUTDOWNFILE}" ]
then
mail -s "Power failure, recovered" admin@host.net
else
rm "${SHUTDOWNFILE}"
fi
fi
(Необходимо будет, вероятно, отладить его и обратить внимание на безопасность, чтобы не случайно предоставлять пользовательский доступ для создания файлов для конфликта с этим),
Просто добавьте что-то вроде этого к /etc/rc.local
:
echo "Subject: `/bin/hostname` has booted @ `date '+%Y/%m/%d %H:%M:%S'`"|/usr/lib/sendmail -i user@example.com
Это пошлет по электронной почте каждый раз, когда это загружается, не сразу после потерь мощности. Больше логики будет требоваться, если Вы только захотите электронные письма после потерь мощности. Лично, мне нравится знать каждый раз, когда одна из моей перезагрузки серверов - особенно, если это не была намеренная перезагрузка.
Вам нужен Внутренний IPMI на оборудовании системы (который может сообщить об отказах powerloss и отказа оборудования по электронной почте),
Во-вторых, и я думаю самое главное.. и внешняя система, которая проверяет состояние систем..
Nagios & Cacti оба предложения эти функции..
Кактусы, на самом деле являющиеся более простыми из двух (Nagios может быть вполне сложным для поддержания) Используя SNMP или простые ping.. (могут также быть другие сервисы),
В основном инструмент позволяет Вам опрашивать каждый (решительные) минуты.. для ответа.. После (определенных) отказов это посылает Вам электронное письмо..
Это - типичный набор системных администраторов инструментов для уведомлений..:D