Как я заставляю свои серверы HP посылать мне по электронной почте, когда диск перестал работать?

Не уверенный, если это было бы корректным способом сделать это, но Вы могли бы настроить свое приложение для исполнения роли учетной записи окон, которую Вы настроили только для приложения? Затем, когда пользователь запускает приложение, оно могло переключить контекст на тот вход в систему, когда оно должно соединиться с SQL Server.

11
задан 4 September 2019 в 15:14
4 ответа

This depends slightly on the operating systems you're running on the servers, but in general, it is possible to obtain alerts from HP ProLiant servers and Smart Array RAID controllers.

The full driver and software support listing for your DL380 G5 systems is listed here.

SNMP and a monitoring solution is the best approach... But you can augment that with some of HP's tools. HP offers the HP Systems Insight Manager, which is available for download and also comes with the servers. This is ideal for collections of servers. If you're looking for one-off alerts without building a management or monitoring infrastructure, you can simply install the HP Management Agents (aka ProLiant Support Pack).

For standalone Linux systems, I'll have the agents send traps via email. I'll usually configure the support pack with defaults or a custom bundle, then edit /opt/hp/hp-snmp-agents/cma.conf and change the trapemail line to point to the recipient address:

########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
#             trapemail /usr/bin/logger
#       will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' systems@1234.net

If you're running Linux and don't want to install the full HP management suite, you can develop a script around the cciss_vol_status utility to query controller/disk status. Also see: Installing HP Agents on OpenFiler

16
ответ дан 2 December 2019 в 21:44

Check out HP Insight Manager

https://www.hpe.com/us/en/product-catalog/detail/pip.489496.html#

I believe it should work with your Servers.

5
ответ дан 2 December 2019 в 21:44

установить smartmontools. Отправляет вам электронное письмо ДО выхода из строя диска.

1
ответ дан 2 December 2019 в 21:44

Я использовал облегченную программу, которую @ewwite упомянул в своем ответе: cciss_vol_status

Если вы следуете прилагаемым инструкциям INSTALL, сценарий помещается в / usr / local /bin/cciss_vol_status.

Вот сценарий оболочки, который я использую для grep вывода cciss_vol_status и отправки электронного письма, если какой-либо массив имеет статус FAILED.

#!/bin/bash
#
# Check status of RAID volumes on HP Smart Array controllers.  Send an email
# alert if any volumes have a FAILED status.
#
status=`/usr/local/bin/cciss_vol_status /dev/sd*`

# email lock file
lockfile=/tmp/raid.check.hp.smartarray.lock
# how often to send an email (minutes)
_notification_freq=59
_host=`hostname`
# To: email
_toemail=root

# create email lock file
[ ! -f ${lockfile} ] && /bin/touch ${lockfile}

if echo $status | grep -q FAILED
then
    # make sure we haven't sent a notification in the last X minutes
    if test `find ${lockfile} -mmin +${_notification_freq}`
    then
        echo -e "${status}" | /bin/mail -s "System Alert! RAID failure on ${_host}" ${_toemail}

        # update lock file mod time
        /bin/touch ${lockfile}
    fi
fi

Вызовите указанный выше сценарий в cron. Я запускаю проверку каждые две минуты:

*/2 * * * * /usr/local/bin/raid.check.hp.smartarray.sh

Мы действительно используем HP System Insight Manager , чтобы проверить, работают ли наши HP, но не более того. Я обнаружил, что агент Linux является для нас излишним, поскольку у нас есть другие решения для мониторинга, поэтому приведенный выше сценарий хорошо служит своей конкретной цели.

UPDATE

Просто совет по устранению неполадок на случай, если вы столкнетесь с этим. Этот сценарий оказался полезным сегодня утром, когда я получил электронное письмо о неисправном массиве со следующим сообщением:

Достигнут предел грязного кэша

Устройство перешло в режим только для чтения и не было видно в / proc / partitions . Я перезагрузил сервер и увидел следующие сообщения при загрузке:

Логические диски отключены из-за возможной потери данных. Выберите «F1», чтобы продолжить с отключенными логическими дисками. Выберите «F2», чтобы принять потерю данных и повторно включить логические диски

Я выбрал F2, и RAID был в порядке и смонтирован при загрузке.

3
ответ дан 2 December 2019 в 21:44

Теги

Похожие вопросы