Мы расширяем нашу установку Nagios 3 и часто сталкиваемся с новыми NRPE или общими плагинами Nagios для тестирования нашей существующей инфраструктуры. Хотя это и мелочи - было бы полезно получить сводку плагинов, которые больше всего ценят пользователи Nagios.
Пожалуйста, укажите один плагин для каждого сообщения, желательно с кратким описанием того, почему он вам нравится, и ссылкой на MonitoringExchange или сайт разработчиков плагинов. Таким образом, люди могут голосовать за уже перечисленные плагины, и мы можем видеть их в приоритетном порядке.
По той же причине было бы лучше не перечислять плагины, которые уже упоминались другими. Если у вас есть что добавить в отношении плагина, который перечислил кто-то другой, оставьте комментарий к его ответу.
Спасибо!
С точки зрения гибкости Вы не можете победить snmp плагин. Именно позади почти каждой проверки я работаю, и если не, подключение TCP.
Я использовал два плагина.. нужно было обеспечить канал XML предупреждений и другого для отправки предупреждений через Твиттер. Оба были полезны (кроме регулярных плагинов). при подсчете NRPE как плагина то добавьте это также.
Это - вид обмана, потому что я сделал большую разработку на нем, и это на самом деле проверяет много разных вещей сразу, но самым полезным nagios 'плагином' для меня является Resmon. Это - агент, Вы работаете на самом сервере и подключениях nagios по http для выполнения проверок. Я предполагаю, что это подобно тому, что nrpe делает, но со многими различными проектными решениями.
check_multiprocs используется с check_nrpe текстом ссылки
Centreon definently для графиков и всех функций Nagios!
Тот, который проверяет фактическую задержку, чтобы потянуть веб-сайты и сканирует ее для 'status:ok' скрытый тег. Это поймало проблему с нашим кэшем сквида и проблему набора языка, которая только произошла один раз в несколько ночей в 3:00, когда кто-то поразил сайт браузером, который запросил, чтобы турецкий язык интернационализировал версию страницы.
Серьезно, настройте каждый тип контроля этого, Вы возможно можете. Странные ошибки и ошибки, которые можно зафиксировать в сложной среде с хорошим контролем, просто удивительны. Кроме того, зарегистрируйте свои данные о производительности к rrd базе данных и отобразите их в Кактусах.
Я согласился бы, что check_snmp является чрезвычайно ценным плагином; это может использоваться почти для любой цели, и все обнаруживается в SNMP вообще говоря. SNMP доступен в системах, столь же разнообразных как HP-UX, Tru64 и OpenVMS без дополнительных установок.
Другой (не совсем a) плагин, который очень полезен, является NagiosGrapher; у меня есть свой опыт в статье, которая объясняет больше, но также и так, чтобы другие могли использовать его без любых трудностей, которые я испытал.
Одно последнее: NSCA. Можно записать Perl или Ruby или ksh сценарий и подать вывод в NSCA.
Между flexibiities NSCA и SNMP, объединенным с созданием отчетов NagiosGrapher, это должно развернуть Ваш контроль очень хорошо.
Мне нравится, когда check_http проверяет, что мои веб-сайты все еще работают, я развернул его, чтобы проверить, что определенный текст может быть найден на нем после одного времени, моя хостинговая компания решила обслуживать пустые страницы, и мой nagios проверяет, что все передали, поскольку сервер все еще работал.
Это - что-то вроде бесстыдного разъема, но если Вы контролируете машины Windows с помощью NRPE, NagiosPluginsNT, кажется, работает вполне прилично.;-)
check_nt (говорящий с NSClient или чем-то подобным на предмете) позволяет Вам опросить WMI на поле Windows - если существует счетчик производительности для него, можно теперь контролировать его с Nagios.
PnP (pnp4nagios.org) - генерирует графики RRD-стиля для любой проверки Nagios те выходные данные перфекта. Удивительно полезный, особенно при попытке убедить devs, что та недавно-установленная-служба действительно является причиной всех тех пиков нагрузки ЦП...
Я нахожу, что check_nfsmount полезен на многих моих серверах.
Править: Я также голосовал бы check_snmp, если бы у меня был представитель, чтобы сделать это. Это используется на всех моих серверах плюс логика позади check_hpjd, который у меня есть работа всего моего HP Printers.
WebInject очень полезен для контроля веб-сайтов, если Вы хотите пойти вне check_http функциональности; это может обработать страницы входа в систему и выполнить несколько шагов в одной проверке Nagios.
Честно, тот, который делает большинство для меня, прост check_disk
. Ничто не заставляет меня чувствовать себя вполне настолько особенным, на той "остановке, съедая вставку" путь, как наличие сервера, который хорошо работал вчера аварийное завершение, обтекая как безумный и затем узнавая, что это - потому что я позволяю дискам заполниться. Никогда не имея необходимость сделать это снова в моей жизни стоит много мне.
(И не забывайте проверять inodes также дети, смотрящие дома.)
Наши самые полезные плагины являются тем, которые тестируют нашу более высокую функциональность приложения. Например, у нас есть тесты, которые пытаются войти в веб-сайт и тесты, которые пытаются послать электронное письмо, и проверка проверяют pop3 почтовый ящик, чтобы удостовериться, что это прибыло. Если какая-либо из тех вещей повреждается, то мы можем использовать более низкие проверки уровня для наблюдения что не так. Действительно ли pop3 мертв? MTA, MDA? Сервер базы данных? хранилище данных?
Один из самых важных плагинов является тем, который я записал сам: check_rdiff_backup. Я делаю резервные копии за границей, и Nagios говорит мне, если и когда что-то происходит с ними.
При поиске rdiff-резервного плагина существует тот, который можно найти на Google.
Самым полезным для меня является тот, который я записал для своих потребностей: nagios-check-webpage
Это загружает всю страницу js/css/images, мультипотоками и gzip (сохраните партию bandwith), как настоящие навигаторы.
Недавно я начал использовать check_multi плагин, использование исправленного / улучшило NRPE для крупносерийного производства (из-за HTML и информации о производительности).
Это - почти "один плагин для управления их всех"!;-)
Не совсем плагин, но получение twurl ( https://github.com/marcel/twurl ) для работы в качестве средства для включения предупреждений было абсолютной находкой. . Нет необходимости в SMS-оповещениях и просто удовлетворить все потребности.
Подробности о том, как это было сделано: Nagios предупреждает, используя твиттер (с twurl), но не запускается - извиняюсь за бессовестную саморекламу;)
Прочее ...
Check_diskio ( ] https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) был невероятно полезен в сочетании со стандартной проверкой загрузки ЦП и номера процесса при определении того, когда / если привязан ввод-вывод, и в Каким образом. Использование nagiosgraph ( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details ) делает это еще проще.
Ну, простые, простые и стандартные - check_disk, check_load, check_http подходят для большинства случаев (в основном мы хотим знать, работают ли серверы и веб-сайты, верно)
и кроме check_disk и check_swap, есть check_memory http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_memory/details что дает использование памяти ...