Агент Zabbix - высокое использование ЦП

Я предполагаю, что Вы имеете в виду Аппаратные средства RAID с LVM на Вершине, по сравнению с LVM и программным обеспечением RAID сверху LVM. Если так, я всегда советую для выбора основанный на аппаратных средствах RAID сначала. Программное обеспечение RAID просто, что, в то время как наверху маленькие, аппаратные средства, производительность RAID будет лучше 9 из 10 раз. Конечно, методология будет очень зависеть от Вашей заключительной цели. Чего Вы пытаетесь достигнуть (производительность, защита, и т.д., и т.д.)

3
задан 9 April 2013 в 10:46
3 ответа

Я думаю, что узким местом является диск. Вот мои причины для этого:

У вас довольно загруженный веб-сервер. Zabbix работает медленно, я подозреваю, что он читает с диска (также может быть из сети).

Снова запустите strace и найдите дескриптор файла в Zabbix

Затем найдите, является ли дескриптор файла файлом или сокет:

ls -l /prod/<PID_of_straced_process>/fd/<FD_from_strace>

EDIT1 :
Вы не должны изменять таймауты TIME_WAIT. Проблема с небольшим HTTP keep-alive или без HTTP keep-alive заключается в том, что вы увеличиваете задержку и пропускную способность. Вместо этого вам следует немного увеличить время активности HTTP и установить / включить SPDY.

EDIT2 : Используйте dstat -ta 10 и сравните первую строку с остальными. Первая строка - это среднее значение с момента загрузки. Следующие строки - это среднее значение за 10 секунд (последний параметр).

EDIT3 : Проверьте, не теряются ли у вас пакеты, используйте что-то вроде дыма для мониторинга сервера и веб-сайта из-за пределов вашей сети. У вас есть значительное количество подключений в CLOSING, FIN_WAIT1, FIN_WAIT2, SYN_RECV, LAST_ACK. Я думаю, ваша сеть перегружена или у вас много недолговечных подключений (что подтверждается высоким соотношением TIME_WAIT / ESTABILISHED). См .: http://en.wikipedia.org/wiki/Transmission_Control_Protocol#Protocol_operation

0
ответ дан 3 December 2019 в 08:18

zabbix-agentd read /proc/net/tcp per net.tcp.listen. размер файла около 100K(строк) * 150байт = 15MB, если у вас много элементов монитора tcp.listen, то данная операция с файлом чтения потребляет много вычислительной мощности, так как размер данных 15MB*номер_item_number.

Для данной проблемы производительности рекомендуется использовать net.tcp.port вместо net.tcp.listen.

.
0
ответ дан 3 December 2019 в 08:18

поздний ответ (может быть полезным для некоторых парней):

Такое случается часто, в зависимости от того, что вы запрашиваете с Zabbix, и обычно это проблема третьей стороны или PEBKAC.

Отключите проверки (и перезапустите zabbix сервер после), чтобы увидеть, какой из них вызывает такую ​​большую нагрузку. Соответственно проанализируйте проблему.

т.е. У меня было несколько проблем с Database Monitor, когда проблема была вызвана ODBC

0
ответ дан 3 December 2019 в 08:18

Теги

Похожие вопросы