Высокая нагрузка на nagios сервер — Сколько сервисных проверок на nagios сервер - слишком многие?

Процент использования CPU на поток можно добраться с ps команда:

 ps -emo %cpu,pid,user,args

Путем это вычисляется, описан в ps manpage:

В настоящее время это - процессорное время, используемое разделенный к тому времени, когда процесс работал (cputime/realtime отношение), выразил как процент.

9
задан 28 January 2010 в 19:13
4 ответа

Необходимо выяснить, где узкое место...

Я выполняю монитор nagios, который проверяет 400 + хосты с http, ping и проверками ssh. (наряду с большим количеством других пассивных проверок и nscd)

Это идет 2xQuadCore сервер с 4 дисками SAS в RAID10.

Я подозреваю, что у Вас есть конкуренция IO, поскольку пишущий в большое количество rrds очень неэффективно.

Необходимо выяснить, какой процесс поднимает ресурсы. (кактусы, nagios или что-то еще)

Для проверки IO мне нравится iotop. Установите iotop (9,04 работ пакета над 8,04)

Но в других отношениях главный должен также помочь Вам найти своего пожирателя ресурсов загрузки.

Кактусы однажды минута довольно агрессивны. (Я выполняю мой в интервалах на 5 м),

Один подход, о котором я услышал для rrd, пишет, что конкуренция должна поместить Ваши хранилища rrd на ramdisk/tmpfs. (убедитесь rsync что время от времени к персистентному устройству хранения данных),

Удачи.

7
ответ дан 2 December 2019 в 22:26
  • 1
    Спасибо. I' ll изучают его. Это, вероятно - кактусы, генерирующие загрузку и I' ll видят, существует ли способ переместить rrds в tmpfs. Или просто добавьте больше RAM, таким образом, сервер может буферизовать rrds. Я боюсь, выполняю ли я кактусы каждые 5 минут могли бы быть скачки загрузки, которые длятся только 1 или 2 минуты, которые я полностью пропустил бы... –  Josh 28 January 2010 в 20:47

Если это не кактусы, генерирующие большую часть загрузки затем, необходимо смочь осуществить намного больше проверок, чем это на аппаратных средствах.

Я выполняю nagios на виртуальной машине FreeBSD, работающей на Microsoft Virtual Server на медленном собакой старом ПК (Pentium 3 1 ГГц с медленным диском PATA). Виртуальная машина имеет только 128 МБ RAM, и производительность страшна.

Однако среднее число загрузки - приблизительно 0,2, осуществляя 158 проверок через 42 хоста.

6
ответ дан 2 December 2019 в 22:26
  • 1
    Спасибо. Мне бы хотелось принять оба ответа! Ваш было очень полезно, это указывает мне, что кактусы являются, вероятно, преступником. –  Josh 28 January 2010 в 20:47

На старом PIII с 256 МБ RAM я активно контролирую приблизительно 230 различных сервисов. Та же машина также выполняет MRTG и HylaFAX для всех наших входящих факсимильных сообщений и делает так вполне удобно.

2
ответ дан 2 December 2019 в 22:26
  • 1
    Очень полезная информация. Это указывает мне, что кактусы являются, вероятно, преступником, не nagios.Спасибо! –  Josh 29 January 2010 в 01:51

Необходимо смочь работать, полная лодка nagios сверяется с теми аппаратными средствами. Мы выполняем подобную установку приблизительно с 70 проверками и Nagiosgraph - существенным различием является добавленная RAM (это дешево, таким образом, я увеличил бы поле к 2 ГБ).

Попробуйте рабочую вершину или PS-aux, чтобы видеть, перегружается ли ЦП, но я сомневаюсь относительно этого. Можно также хотеть проверить nagios документы распараллеливания, чтобы видеть, пытается ли установка осуществить слишком много проверок сразу вместо того, чтобы сериализировать их.

1
ответ дан 2 December 2019 в 22:26

Теги

Похожие вопросы