Процент использования CPU на поток можно добраться с ps
команда:
ps -emo %cpu,pid,user,args
Путем это вычисляется, описан в ps manpage
:
В настоящее время это - процессорное время, используемое разделенный к тому времени, когда процесс работал (cputime/realtime отношение), выразил как процент.
Необходимо выяснить, где узкое место...
Я выполняю монитор nagios, который проверяет 400 + хосты с http, ping и проверками ssh. (наряду с большим количеством других пассивных проверок и nscd)
Это идет 2xQuadCore сервер с 4 дисками SAS в RAID10.
Я подозреваю, что у Вас есть конкуренция IO, поскольку пишущий в большое количество rrds очень неэффективно.
Необходимо выяснить, какой процесс поднимает ресурсы. (кактусы, nagios или что-то еще)
Для проверки IO мне нравится iotop. Установите iotop (9,04 работ пакета над 8,04)
Но в других отношениях главный должен также помочь Вам найти своего пожирателя ресурсов загрузки.
Кактусы однажды минута довольно агрессивны. (Я выполняю мой в интервалах на 5 м),
Один подход, о котором я услышал для rrd, пишет, что конкуренция должна поместить Ваши хранилища rrd на ramdisk/tmpfs. (убедитесь rsync что время от времени к персистентному устройству хранения данных),
Удачи.
Если это не кактусы, генерирующие большую часть загрузки затем, необходимо смочь осуществить намного больше проверок, чем это на аппаратных средствах.
Я выполняю nagios на виртуальной машине FreeBSD, работающей на Microsoft Virtual Server на медленном собакой старом ПК (Pentium 3 1 ГГц с медленным диском PATA). Виртуальная машина имеет только 128 МБ RAM, и производительность страшна.
Однако среднее число загрузки - приблизительно 0,2, осуществляя 158 проверок через 42 хоста.
На старом PIII с 256 МБ RAM я активно контролирую приблизительно 230 различных сервисов. Та же машина также выполняет MRTG и HylaFAX для всех наших входящих факсимильных сообщений и делает так вполне удобно.
Необходимо смочь работать, полная лодка nagios сверяется с теми аппаратными средствами. Мы выполняем подобную установку приблизительно с 70 проверками и Nagiosgraph - существенным различием является добавленная RAM (это дешево, таким образом, я увеличил бы поле к 2 ГБ).
Попробуйте рабочую вершину или PS-aux, чтобы видеть, перегружается ли ЦП, но я сомневаюсь относительно этого. Можно также хотеть проверить nagios документы распараллеливания, чтобы видеть, пытается ли установка осуществить слишком много проверок сразу вместо того, чтобы сериализировать их.