Если Вы перейдете к 4:05 в этом видео Google, "Поставляющего Contaier" дата-центр, то Вы будете видеть, что технический специалист носит защиту уха, подобную тому, что Вы нашли бы на диапазоне оружия или парнях, помогающих парковать самолеты. Я думаю, что это - хорошая идея, которая не причиняет боль.
Я использовал Nagios в прошлом с успехом. Это очень расширяемо (более чем 200 дополнений), относительно просто в использовании и много отчетов. Отрицание было бы начальной настройкой.
Я удивлен, что никто не упомянул logwatch, или logcheck для серверов Linux - сохраняет тонну журналов чтения времени!!
Для контроля статистики (использование памяти, загрузка, mysql действие, апачское действие, и т.д.) Я использую Munin. Из поля это уже отслеживает много вещей и строит графики для различных временных интервалов (продержитесь 24 часа, продержитесь 7 дней, в прошлом месяце, в прошлом году). Через плагины может контролироваться еще больше вещей. Это производится, страницы HTML с симпатичными графиками.
Munin имеет архитектуру ведущего устройства/узла: узлы собирают статистику по серверу, и ведущее устройство хранит данные и производит HTML и графики.
Я использую Monit, чтобы отслеживать выполнение процессов и перезапустить или предупредить меня, когда определенные configureable условия возникают (высокая загрузка ЦП, использование верхней памяти, никакой ответ HTTP, и т.д.), Monit может также контролировать более общие вещи о сервере, такие как загрузка ЦП, использование памяти, состояние жесткого диска или использование диска.
Monit должен быть настроен для каждого сервиса или аппаратных средств, которые Вы хотите контролировать и как ответить, когда что-то идет не так, как надо. Наиболее используемые опции ничего не состоят в том, чтобы сделать, послать аварийное электронное письмо или перезапустить сервис.
Monit является большим, когда он работает, но иногда ему не удается запуститься, остановите или перезапустите сервис и нет большой диагностической информации, доступной, чтобы сказать Вам, что пошло не так, как надо. Это означает, что Вы не знаете, была ли проблема с Вашим сервисом или с конфигурацией Monit, которая работает с подобной крону минимальной средой.
Оба инструмента доступны по умолчанию на большинстве дистрибутивов Linux.
Я - часть операционного контрольного проекта обновления. Мы сделали, чтобы различные поставщики приехали на месте для представления нескольких больших долларовых систем и смешанный в некоторых более дешевых альтернативах для сравнения.
Одним из которых является Hyperic, который также доступен как бесплатное решение с открытым исходным кодом. Я был впечатлен его обеспеченными возможностями и расширяемостью для пользовательских агентов.
Как человек Windows, МАМА. Мы надеемся обновлять до Системного центра Менеджера операций (SCOM), но не будем нуждаться к тому, пока мы не начинаем развертывать Windows 2008.
Монитор сети PRTG - не может сказать достаточно больших вещей об этом. Потрясающий веб-фронтэнд и особенно большой для контроля маршрутизаторов (пропускная способность и т.д.) и другие устройства через SNMP и измерение времени работы для SLA, и т.д.
www.paessler.com
Я использовал:
Nagios является большим, так как это свободно и существует много плагина для него. Однако UI и конфигурация являются очень трудными.
Это - полная противоположность в pro's/con's, который является также большим, Microsoft System Centre Operations Manager (SCOM), которая не свободна, имеет меньше плагина, но установка, и конфигурация являются блестящими и легкими.
Я должен признать, был ли я в, прежде всего, компания Microsoft, имел очень высокие требования уверенности (т.е. не могите позволить себе для контроля повредиться), или должен был думать о том, чтобы заставлять разработчиков работать с ним затем, SCOM будет моей рекомендацией по Nagios.
Ядро Zenoss несколько полезно, Мы используем его (приблизительно в течение года) для легкого контроля серверов, сетевых коммутаторов и UPSs.
Ядро Zenoss является отмеченным наградой контрольным продуктом IT с открытым исходным кодом, который эффективно управляет конфигурацией, здоровьем и производительностью сетей, серверов и приложений через единственный, интегрированный пакет программного обеспечения.
OpenNMS используется, где я работаю для контроля больше чем тысячи машин Linux. Мы контролируем аппаратные средства каждой машины и приложений, работающих на них.
Я делал развертывания Spiceworks в нашей компании, и мы находим, что это большой инструмент не только для контроля серверов, но и всего остального в сети.
Это делает вещи как автоматические материально-технические ресурсы и пользовательский контроль для отправки Вам электронных писем, когда существует проблема (EG: Принтер составляет до 10% чернил, или жесткий диск этого сервера имеет 20%).
Его оборотная сторона, вероятно, была бы, плотность информации на компьютер, не получайте его неправильно, это имеет МНОГО данных на машину, но для вещей как серверы, где Вы могли бы хотеть много статистики, Вы, возможно, должны были бы использовать другой инструмент.
Править: о, сделал я упоминаю, что его бизнес-модель базируется вокруг этого являющийся свободным навсегда.
Smokeping не только проверяет наличие различных серверов и сервисов, но также и отслеживает их задержку при обеспечении простой в использовании, симпатичный, и быстрый для отображения графиков.
Широкий спектр измерительных плагинов задержки доступен из поля. Если Вы знаете некоторый Perl, легко создать Ваши собственные для любых экзотических потребностей.
Большие установки извлекут выгоду из Основной/Ведомой Системы для распределенного измерения.
Высоконастраиваемая система предупреждения поможет Вам заметить проблемы, прежде чем они начнут влиять на пользователей или разовьются в главное отключение электричества.
Smokeping является бесплатным программным обеспечением и Программным обеспечением с открытым исходным кодом, записанным в Perl Tobi Oetiker, создателем MRTG и RRDtool
Zabbix. Это - открытый исходный код, и довольно простой установить и настроить. У нас есть много пользовательских контрольных сценариев, которые питаются в zabbix сервер, но он заботится о централизации тех данных, отображении его соответственно, уведомления (электронная почта, IM, SMS, Твиттер, и т.д.), и т.д.
Лично, я люблю Munin, который очень легок установить и записать плагины для того, поскольку он имеет очень простую архитектуру. Уже существует вполне много плагинов вокруг во всех целях, которые Вы могли вообразить, таким образом, Вы, вероятно, не должны будете даже писать плагины во-первых.
Это также обеспечивает красивые графики и опцию настроить (очень простые) предупреждения.
Кактусы являются очень хорошим веб-frontend к RRDTool, обеспечивая очень удобные графики и статистику. RRDTool является частью, которая собирает данные из нескольких систем и контролирует широкий спектр технических данных.
Мы используем это cacti/RRDTool решение контролировать системы Windows и Unix. Мы получаем много полезных метрик включая загрузку, ЦП/использование оперативной памяти, пространство HD, пользователи вошли в систему, сетевой трафик, выполнив процессы, и так далее.
Вы найдете больше информации о кактусах на, Что такое Кактусы? страница.
Я использую Pingdom для контроля моего сервера. Это отправляет мне SMS-сообщение, когда сервер недостижим.
Наш проект использует Ганглии для наших 100 + кластеры узла. Одна причина мы используем его, состоит в том, потому что это - контрольный инструмент, который идет со Скалами.
Для нас важно иметь очень низко наверху на каждом узле так, чтобы как можно больше ресурсов было доступно для вычисления. Ганглии дают нам хороший обзор кластера и позволяют нам выполнять развертку к отдельным узлам в случае необходимости. Кроме того, знают то, что продолжается прямо сейчас, мы можем получить довольно хороший взгляд на то, что произошло за прошлый час, день, неделю, месяц и год. Графики различной статистики являются основными и функциональными.
Мы записали наше собственное контрольное программное обеспечение. Наш код не почти так же сложен как коммерческий пакет, но нам не было нужно много функциональности. Было легче записать наше собственное, чем исследовать другие пакеты и изучить, как использовать их. Код делает, что мы хотим, и легко расшириться.
К сожалению, но я закончил тем, что использовал много пользовательских сценариев. В то время как далекий от идеала я сомневаюсь, что существует более общее решение.
Я использую комбинацию SolarWinds, вкладок производительности сервера VMware и пользовательских сценариев.
Solarwinds Orion Network Performance Monitor - то, что я использую с нашим Windows sys. администраторов на своих веб-серверах. Все еще получая некоторые полезные метрики приложения, работающие на нем, но он имеет хорошую информацию об основном материале уровня поля (диск, сеть, ЦП).
Для моих гостей VMware я люблю вкладки производительности.
Для моих серверов Sun, когда мне нужно что-то, что не доступно в SolarWinds (потому что наш администратор не добавил его или что), я пишу пользовательские сценарии (обычно в Perl) для контроля вещей как зеркальное здоровье, использование подкачки, и т.д.
Я хотел бы добраться больше на SolarWinds, но там похож только на 26 часов за день (или таким образом, мой босс верит), таким образом, я нахожу, что это может немного ограничивать...
Хоббит - это - более быстрая лучшая версия Старшего брата (который, кажется, является сигнализирующим образом коммерческим в эти дни).
Для тех, кому не нравится веб-интерфейс Nagios, существует NPC, плагин для Кактусов, который делает UI Nagios доступным из Кактусов, но с лучшими взглядами (ajax и т.д.).
Это читает из базы данных, обеспеченной NDO2DB, который является отличным способом иметь Вашу инфраструктуру в наличии из базы данных для использования в сценариях и других инструментах.
Мы используем (и как) WhatsUp от Ipswitch для нашей относительно маленькой сети Windows. Это легко установить, и относительно легкий справиться, и знает, как иметь дело с серверами Windows, а также стандартным материалом.
Для больших сетей, не-Windows ориентированных на сети или сети с большим количеством варьировавшегося материала, я сердечно рекомендую OpenNMS. Программное обеспечение OpenNMS, если свободный и компания более, чем радо продать услуги по поддержке и услуги по внедрению. Это также, оказывается, выполняется очень резким моим другом из колледжа!
В настоящее время мы используем PRTG от Paessler. Это превосходно. Никакие агенты требуемый, превосходный веб-интерфейс Ajax, исторический вход, построение графика, WMI, и т.д. и т.д. Существует 10 версий датчика, доступных бесплатно, но мы уронили несколько главные для версии для предприятия. Деньги хорошо потрачены.
Все это зависит, что Вы подразумеваете под "монитором"!
Мы используем OpsView, который работает сверху Nagios. webUI помогает нам развернуть новые определения монитора хоста, не имея необходимость предоставлять доступ SSH, обеспечивает общественное мнение и записывает исторические ценности. Это удобно для настройки и определения подходящих базовых линий.
Если Вы спешите и хотите, чтобы быстрый инструмент контролировал, Ваш сервер MS затем используют монитор производительности для окон, настраивают встречный журнал с пользовательским контрольным шаблоном и расписанием custome (например: соберите данные в течение 5 минут каждый час). Затем загрузите LogParser Microsoft и Анализ Производительности Codeplex Журналов (PAL) Инструмент (http://pal.codeplex.com/) для уплотнения встречного журнала. PAL генерирует большой зарегистрированный отчет со ссылками на возможные документы/инструменты решения проблемы.
Мы используем AlertFox с нескольких недель и очень счастливы это. Это не только проверяет наше время работы и производительность, но также и контролирует корзину, пользовательский вход в систему и другие критические части веб-сайта с помощью сценариев транзакции (iMacros базирующийся).
Для нашего внутреннего контроля (дисковое пространство и т.д.) мы используем Nagios.
Новый участник на сцене для проверки для конкуренции с Кактусами и RRDTool базировался, решения является Графитовым (http://graphite.wikidot.com/)
RRDTool заменяется запоминающим устройством под названием Шепот. Документы дают довольно хороший обзор того, почему он отличается, и мне действительно нравится CLI за специальное построение графика при исследовании чего-то.
Zabbix (http://www.zabbix.com) хорош также и легче установить, чем Nagios.