Мониторинг производственного сервера [закрыто]

У нас есть 3 выделенных сервера, разделенных на несколько VPS с использованием openVZ. Мы используем munin для мониторинга VPS с производственными сайтами, и monit на одном из VPS, чтобы убедиться, что он перезапускает сервис при сбое.

Дело в том, что нам нужен лучший способ мониторинга всех наших серверов, так как у нас до 14 VPS, мы хотели бы иметь центр, где мы могли бы видеть не только данные, собранные munin, но и некоторые дополнительные статистические данные о сетях и производительности наших сервисов.

Некоторые из наших требований:
- SMS уведомление о сбое (возможность установки определенной пользовательской проверки)
- Анализатор логов для apache error_log и некоторых других.
- Должен быть централизованным (имеется в виду один сервер и несколько узлов, собирающих данные).
- Не обязательно должен быть простым в установке, но простым в обслуживании.
-

Мне указали на nagios и splunk, что вы думаете? Спасибо,

18
задан 18 September 2009 в 19:14
4 ответа

У меня есть подобная установка, кроме с Xen на месте. Я был очень доволен комбинацией:

  • Nagios для предупреждения (использующий PnP для некоторого облегченного построения графика и Nagviz для сервиса указывают панель инструментов),
  • Ганглии для исторического построения графика систем
  • OSSEC как HIDS и что не менее важно как коллектор для централизованного входа
    • заметка на полях: существует плагин Splunk для OSSEC, который интегрирует эти два инструмента очень хорошо, я ожидаю их для портирования его на Splunk v4 все же.
  • Splunk Наконец, после того как несколько плагинов Splunk перемещены, мы планируем использование Splunk с некоторой предварительной фильтрацией журналов (для удержаний от осмотра через бесплатное ограничение выпусков)

Я надеюсь, что совместное использование нашей контрольной установки выручит Вас :-)

Вот некоторые полезные ссылки:

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

обновление:

Я забыл упоминать, что мы используем расположение конфигурации Matt Simmons Nagios также, найденный здесь http://www.standalone-sysadmin.com/blog/2009/07/nagios-config/

Это расположение сделало нашу Конфигурацию Nagios нормальной и намного легче поддержать (Матовое Спасибо!)

17
ответ дан 2 December 2019 в 20:24
  • 1
    +1 для OSSEC + splunk. они работают очень хорошо вместе. –  sucuri 4 October 2009 в 03:18

Я имел большой успех с Zabbix, он удовлетворяет все Ваши точки в одном пакете.

alt text
(источник: zabbix.com)

Самая твердая часть будет получать апачский контроль журнала, но Zabbix расширяем, таким образом, можно использовать LogWatch или некоторый другой сценарий жемчуга для захвата данных для Вас.

5
ответ дан 2 December 2019 в 20:24

Мне нравятся OpManager и его свободное до определенного числа узлов. Делает все вышеупомянутое и довольно легок установить и поддержать.

2
ответ дан 2 December 2019 в 20:24

Nagios должен быть хорошим выбором. В первую очередь - это является модульным и удовлетворяет в значительной степени все Ваши ожидания. Кроме того, это получило некоторые хорошие премии.

Править: Не забывайте проверять этот ответ.

1
ответ дан 2 December 2019 в 20:24

Теги

Похожие вопросы