Какой инструмент Вы используете для контроля серверов?

Если Вы перейдете к 4:05 в этом видео Google, "Поставляющего Contaier" дата-центр, то Вы будете видеть, что технический специалист носит защиту уха, подобную тому, что Вы нашли бы на диапазоне оружия или парнях, помогающих парковать самолеты. Я думаю, что это - хорошая идея, которая не причиняет боль.

187
задан 19 February 2015 в 09:09
73 ответа

Я использовал Nagios в прошлом с успехом. Это очень расширяемо (более чем 200 дополнений), относительно просто в использовании и много отчетов. Отрицание было бы начальной настройкой.

136
ответ дан 16 December 2019 в 22:45
  • 1
    Nagios работает отлично для контроля всех типов хоста (Windows, Linux, Маршрутизаторы, Переключатели, и т.д.) Я рекомендую использовать инструмент конфигурирования как фруктовый, или Lilacto упрощают боль конфигурации. NSClient ++ на полях окон и nagios-statd на Linux наполняют для контроля рабочих процессов, использования диска, и т.д. –  TonyB 2 May 2009 в 02:27
  • 2
    К сожалению, Nagios требует агента на полях Windows - в прошлом I' ve нашел агент известно подверженным случайной смерти. –  PowerApp101 12 May 2009 в 16:04
  • 3
    Мы посмотрели и на Nagios и на Zabbix для нашего контроля. Zabbix победил после короткой оценки, главным образом из-за простоты развертывания и функциональности (например, Zabbix включает построение графика как базовую функцию, в то время как Nagios требует плагина). Я нашел конфигурирование Nagios, чтобы быть болью. –   27 May 2009 в 19:14
  • 4
    GroundWork OpenSource имеет контрольное устройство сети, которое использует Nagios в it' s ядро, и упрощает установку/управление –  Rog 1 June 2009 в 05:40
  • 5
    Существует новое nagios ветвление, названное icinga. Это еще нигде не, но их цели выглядит многообещающим. icinga.org –  cstamas 1 June 2009 в 20:34

Я удивлен, что никто не упомянул logwatch, или logcheck для серверов Linux - сохраняет тонну журналов чтения времени!!

8
ответ дан 16 December 2019 в 22:45
  • 1
    Те инструменты привычка действительно дают Вам метрики и долгосрочную удобочитаемость Ваших тенденций инфраструктуры. Они - хорошее дополнение, но я wouldn' t только полагаются на них. Afaik " logwatch" является несколько злым, как это только сообщит об ошибках, о которых Вы говорите это в противоположность " logcheck" где Вы говорите инструменту известный хороший материал, и он сообщит обо всем остальном. –  serverhorror 10 June 2009 в 08:09

Для контроля статистики (использование памяти, загрузка, mysql действие, апачское действие, и т.д.) Я использую Munin. Из поля это уже отслеживает много вещей и строит графики для различных временных интервалов (продержитесь 24 часа, продержитесь 7 дней, в прошлом месяце, в прошлом году). Через плагины может контролироваться еще больше вещей. Это производится, страницы HTML с симпатичными графиками.

Munin имеет архитектуру ведущего устройства/узла: узлы собирают статистику по серверу, и ведущее устройство хранит данные и производит HTML и графики.

Я использую Monit, чтобы отслеживать выполнение процессов и перезапустить или предупредить меня, когда определенные configureable условия возникают (высокая загрузка ЦП, использование верхней памяти, никакой ответ HTTP, и т.д.), Monit может также контролировать более общие вещи о сервере, такие как загрузка ЦП, использование памяти, состояние жесткого диска или использование диска.

Monit должен быть настроен для каждого сервиса или аппаратных средств, которые Вы хотите контролировать и как ответить, когда что-то идет не так, как надо. Наиболее используемые опции ничего не состоят в том, чтобы сделать, послать аварийное электронное письмо или перезапустить сервис.

Monit является большим, когда он работает, но иногда ему не удается запуститься, остановите или перезапустите сервис и нет большой диагностической информации, доступной, чтобы сказать Вам, что пошло не так, как надо. Это означает, что Вы не знаете, была ли проблема с Вашим сервисом или с конфигурацией Monit, которая работает с подобной крону минимальной средой.

Оба инструмента доступны по умолчанию на большинстве дистрибутивов Linux.

8
ответ дан 16 December 2019 в 22:45

Я - часть операционного контрольного проекта обновления. Мы сделали, чтобы различные поставщики приехали на месте для представления нескольких больших долларовых систем и смешанный в некоторых более дешевых альтернативах для сравнения.

Одним из которых является Hyperic, который также доступен как бесплатное решение с открытым исходным кодом. Я был впечатлен его обеспеченными возможностями и расширяемостью для пользовательских агентов.

8
ответ дан 16 December 2019 в 22:45
  • 1
    В то время как это не снисходительно относится к ресурсам, это, конечно - большой контрольный инструмент! –  Vincent De Baere 4 May 2009 в 17:02

Как человек Windows, МАМА. Мы надеемся обновлять до Системного центра Менеджера операций (SCOM), но не будем нуждаться к тому, пока мы не начинаем развертывать Windows 2008.

9
ответ дан 16 December 2019 в 22:45
  • 1
    Я использую МАМУ также. Я люблю его и ненавижу его одновременно. –  spoulson 30 April 2009 в 14:44

Монитор сети PRTG - не может сказать достаточно больших вещей об этом. Потрясающий веб-фронтэнд и особенно большой для контроля маршрутизаторов (пропускная способность и т.д.) и другие устройства через SNMP и измерение времени работы для SLA, и т.д.

www.paessler.com

10
ответ дан 16 December 2019 в 22:45

Я использовал:

  • Nagios - требует некоторой такой, как в старые добрые времена установки командной строки, не симпатичной, но крепкой и функциональной. Это было заменено:
  • Zenoss - требует, чтобы намного меньше активных действий настроило, имеет коммерческий вариант. Однажды выполнение, остальным управляют через браузер. Очень мощный, но требует некоторой работы MIB, если Вы используете бесплатную версию.
  • Межкартопостроитель - коммерческая программа, spendy, если у Вас есть много узлов для контроля. Кажется, записан в Java (что бы там ни было).
  • Spiceworks - не попробовали последнюю версию. Для более старых версий было нужно немного больше umph под капотом, чтобы заставить это отвечать, но иначе, он работает приятно. Бесплатная версия идет с рекламой ворчания.
12
ответ дан 16 December 2019 в 22:45
  • 1
    Мы используем Межкартопостроитель экстенсивно. –  sysadmin1138♦ 2 June 2009 в 07:49

Nagios является большим, так как это свободно и существует много плагина для него. Однако UI и конфигурация являются очень трудными.

Это - полная противоположность в pro's/con's, который является также большим, Microsoft System Centre Operations Manager (SCOM), которая не свободна, имеет меньше плагина, но установка, и конфигурация являются блестящими и легкими.

Я должен признать, был ли я в, прежде всего, компания Microsoft, имел очень высокие требования уверенности (т.е. не могите позволить себе для контроля повредиться), или должен был думать о том, чтобы заставлять разработчиков работать с ним затем, SCOM будет моей рекомендацией по Nagios.

12
ответ дан 16 December 2019 в 22:45

Ядро Zenoss несколько полезно, Мы используем его (приблизительно в течение года) для легкого контроля серверов, сетевых коммутаторов и UPSs.

Ядро Zenoss является отмеченным наградой контрольным продуктом IT с открытым исходным кодом, который эффективно управляет конфигурацией, здоровьем и производительностью сетей, серверов и приложений через единственный, интегрированный пакет программного обеспечения.

15
ответ дан 16 December 2019 в 22:45
  • 1
    Если Вы используете бесплатную версию Ядра Zenoss, готовы сделать много SNMP тонкая настройка MIB. Я также нашел, что это решительно отказалось собирать данные операционной системы по некоторым моим серверам и удивительно трудно настроить для простых задач как проверка содержания Веб-страницы. –  gareth_bowles 4 May 2009 в 22:58
  • 2
    Может сочувствовать проблемам MIB, но проверка веб-страницы может быть сделана с плагинами Nagios на Zenoss. –  gimel 5 May 2009 в 08:15

OpenNMS используется, где я работаю для контроля больше чем тысячи машин Linux. Мы контролируем аппаратные средства каждой машины и приложений, работающих на них.

15
ответ дан 16 December 2019 в 22:45
  • 1
    +1 для OpenNMS, мы также используем это на работе для контроля тысяч машин и интерфейсов. У нас есть многие другая операционная система, и мы можем контролировать всех их использование OpenNMS. –  Steve K 2 May 2009 в 22:48
  • 2
    не мой предпочтительный вариант, но очень полезный –   20 May 2009 в 12:03
  • 3
    как это с добавляющими МИБ для новых аппаратных средств? –  slovon 16 June 2009 в 12:47

Я делал развертывания Spiceworks в нашей компании, и мы находим, что это большой инструмент не только для контроля серверов, но и всего остального в сети.

Это делает вещи как автоматические материально-технические ресурсы и пользовательский контроль для отправки Вам электронных писем, когда существует проблема (EG: Принтер составляет до 10% чернил, или жесткий диск этого сервера имеет 20%).

Его оборотная сторона, вероятно, была бы, плотность информации на компьютер, не получайте его неправильно, это имеет МНОГО данных на машину, но для вещей как серверы, где Вы могли бы хотеть много статистики, Вы, возможно, должны были бы использовать другой инструмент.

Править: о, сделал я упоминаю, что его бизнес-модель базируется вокруг этого являющийся свободным навсегда.

29
ответ дан 16 December 2019 в 22:45
  • 1
    Spiceworks делает много потрясающего материала - и СВОБОДНЫЙ. –   30 April 2009 в 13:19
  • 2
    SpiceWorks имеет действительно многочисленное сообщество, которое накладывается с ServerFault вполне немного также. Попытка быть интересным видеть взаимодействие между сообществами. Я использую SpiceWorks также. Потрясающий инструмент. –  Scott Alan Miller 30 April 2009 в 22:31
  • 3
    Теперь использую это на основе Вашей рекомендации. Превосходный инструмент. –  Marko Carter 29 May 2009 в 19:07
  • 4
    Мы используем его на нашей работе. Это является довольно впечатляющим. Одни только материально-технические ресурсы из аппаратных средств, не говоря уже о программном обеспечении, стоят взгляда it' s собственный. –  Terry 30 May 2009 в 00:52
  • 5
    В прошлый раз я использовал Spiceworks (версия 3 что-то), это didn' t имеют любой способ добавить или изменить аппаратные компоненты, такие как мониторы, видеокарты, и т.д. Это обнаружило бы их, но часто неправильно. Таким образом I' m все еще с помощью GLPI + OCSNG, который я ненависть . –  Boden 17 June 2009 в 00:33

Smokeping не только проверяет наличие различных серверов и сервисов, но также и отслеживает их задержку при обеспечении простой в использовании, симпатичный, и быстрый для отображения графиков.

Широкий спектр измерительных плагинов задержки доступен из поля. Если Вы знаете некоторый Perl, легко создать Ваши собственные для любых экзотических потребностей.

Большие установки извлекут выгоду из Основной/Ведомой Системы для распределенного измерения.

Высоконастраиваемая система предупреждения поможет Вам заметить проблемы, прежде чем они начнут влиять на пользователей или разовьются в главное отключение электричества.

Smokeping является бесплатным программным обеспечением и Программным обеспечением с открытым исходным кодом, записанным в Perl Tobi Oetiker, создателем MRTG и RRDtool

18
ответ дан 16 December 2019 в 22:45

Zabbix. Это - открытый исходный код, и довольно простой установить и настроить. У нас есть много пользовательских контрольных сценариев, которые питаются в zabbix сервер, но он заботится о централизации тех данных, отображении его соответственно, уведомления (электронная почта, IM, SMS, Твиттер, и т.д.), и т.д.

34
ответ дан 16 December 2019 в 22:45
  • 1
    We' ре также с помощью Zabbix и находит, что это довольно мощно и настраивается. Мы протестировали и Zabbix и Nagios и выбрали Zabbix в конце потому что, в то время как Nagios, кажется, имеет хорошую репутацию, it' s что-то вроде боли для установки и большая функциональность прибывает из плагинов вместо того, чтобы показать в базовом приложении (построение графика является хорошим примером этого, Вы получаете его бесплатно с Zabbix). –   27 May 2009 в 19:12
  • 2
    Я предпочитаю Zabbix потому что это гибкость с точки зрения построения графика и отображения Вашей инфраструктуры (с точки зрения доступности), а также гибкий способ контролировать. –  Andrioid 5 July 2009 в 13:02

Лично, я люблю Munin, который очень легок установить и записать плагины для того, поскольку он имеет очень простую архитектуру. Уже существует вполне много плагинов вокруг во всех целях, которые Вы могли вообразить, таким образом, Вы, вероятно, не должны будете даже писать плагины во-первых.

Это также обеспечивает красивые графики и опцию настроить (очень простые) предупреждения.

57
ответ дан 16 December 2019 в 22:45
  • 1
    I' m большой поклонник Munin также. Это имеет поддержку интеграции с Nagios (таким образом, можно выполнить обоих), и поддерживайте для всех общих ароматов Unix. Я don' t думают there' s любая поддержка контроля узла Windows - однако it' s записанный в Perl, поэтому в то время как это может быть нетривиально, это должно, конечно, быть возможно . –  John Dalton 1 May 2009 в 09:35
  • 2
    @John. Узел Windows поддерживается или через munin-node-win32, который является собственным munin узлом, или через SNMP точно так же, как любой хост. –  Steve Schnepp 4 May 2009 в 17:09

Кактусы являются очень хорошим веб-frontend к RRDTool, обеспечивая очень удобные графики и статистику. RRDTool является частью, которая собирает данные из нескольких систем и контролирует широкий спектр технических данных.

Мы используем это cacti/RRDTool решение контролировать системы Windows и Unix. Мы получаем много полезных метрик включая загрузку, ЦП/использование оперативной памяти, пространство HD, пользователи вошли в систему, сетевой трафик, выполнив процессы, и так далее.

Вы найдете больше информации о кактусах на, Что такое Кактусы? страница.

70
ответ дан 16 December 2019 в 22:45
  • 1
    Кактусы являются забавным решением, которое выглядит большим и прибывает в большую (свободную) цену. Однако установка сетевых устройств является ЛАВАШЕМ и была плохо зарегистрирована. Это могло бы быть лучше теперь, но я wouldn' t соглашаются на него до you' ve, проведенный Ваше исследование. –  Chris Porter 5 May 2009 в 06:05

Я использую Pingdom для контроля моего сервера. Это отправляет мне SMS-сообщение, когда сервер недостижим.

7
ответ дан 16 December 2019 в 22:45

Наш проект использует Ганглии для наших 100 + кластеры узла. Одна причина мы используем его, состоит в том, потому что это - контрольный инструмент, который идет со Скалами.

Для нас важно иметь очень низко наверху на каждом узле так, чтобы как можно больше ресурсов было доступно для вычисления. Ганглии дают нам хороший обзор кластера и позволяют нам выполнять развертку к отдельным узлам в случае необходимости. Кроме того, знают то, что продолжается прямо сейчас, мы можем получить довольно хороший взгляд на то, что произошло за прошлый час, день, неделю, месяц и год. Графики различной статистики являются основными и функциональными.

7
ответ дан 16 December 2019 в 22:45

Мы записали наше собственное контрольное программное обеспечение. Наш код не почти так же сложен как коммерческий пакет, но нам не было нужно много функциональности. Было легче записать наше собственное, чем исследовать другие пакеты и изучить, как использовать их. Код делает, что мы хотим, и легко расшириться.

2
ответ дан 16 December 2019 в 22:45
  • 1
    Я думаю it' s важный для продумывания последствий решения как это. Для записи что-то с нуля не может быть так большой частью усилия - но обслуживание в будущем является переносом. –  Adam 30 April 2009 в 21:29
  • 2
    Я мог вообразить обслуживание, являющееся проблемой, но этим hasn' t для нас, даже при том, что we' ve выполняют эту систему в течение многих лет. Так как кодовая база является небольшой и знакомой, it' s легкий для нас для добавления новой функциональности по мере необходимости. Поддержание коммерческого решения могло также быть проблемой со временем, прививая на частях от новых поставщиков когда исходный продукт doesn' t делают все, в чем Вы нуждаетесь и т.д. –  John D. Cook 1 May 2009 в 05:32

К сожалению, но я закончил тем, что использовал много пользовательских сценариев. В то время как далекий от идеала я сомневаюсь, что существует более общее решение.

2
ответ дан 16 December 2019 в 22:45
  • 1
    Всегда будет потребность в пользовательских сценариях! –  Techboy 30 April 2009 в 14:58

Я использую комбинацию SolarWinds, вкладок производительности сервера VMware и пользовательских сценариев.

Solarwinds Orion Network Performance Monitor - то, что я использую с нашим Windows sys. администраторов на своих веб-серверах. Все еще получая некоторые полезные метрики приложения, работающие на нем, но он имеет хорошую информацию об основном материале уровня поля (диск, сеть, ЦП).

Для моих гостей VMware я люблю вкладки производительности.

Для моих серверов Sun, когда мне нужно что-то, что не доступно в SolarWinds (потому что наш администратор не добавил его или что), я пишу пользовательские сценарии (обычно в Perl) для контроля вещей как зеркальное здоровье, использование подкачки, и т.д.

Я хотел бы добраться больше на SolarWinds, но там похож только на 26 часов за день (или таким образом, мой босс верит), таким образом, я нахожу, что это может немного ограничивать...

3
ответ дан 16 December 2019 в 22:45

Хоббит - это - более быстрая лучшая версия Старшего брата (который, кажется, является сигнализирующим образом коммерческим в эти дни).

http://hobbitmon.sourceforge.net/

4
ответ дан 16 December 2019 в 22:45
  • 1
    Мы также используем Хоббита, it' s потрясающий, это обрабатывает 600 +, серверы с 10 + контролируют каждого, многих из них обновляющий каждую минуту –  MarkR 13 May 2009 в 00:37
  • 2
    Хоббита теперь называют Xymon. hswn.dk/hobbiton/2008/11/msg00123.html –  Clinton Blackmore 8 June 2009 в 19:49

Для тех, кому не нравится веб-интерфейс Nagios, существует NPC, плагин для Кактусов, который делает UI Nagios доступным из Кактусов, но с лучшими взглядами (ajax и т.д.).

Это читает из базы данных, обеспеченной NDO2DB, который является отличным способом иметь Вашу инфраструктуру в наличии из базы данных для использования в сценариях и других инструментах.

4
ответ дан 16 December 2019 в 22:45

Мы используем (и как) WhatsUp от Ipswitch для нашей относительно маленькой сети Windows. Это легко установить, и относительно легкий справиться, и знает, как иметь дело с серверами Windows, а также стандартным материалом.

Для больших сетей, не-Windows ориентированных на сети или сети с большим количеством варьировавшегося материала, я сердечно рекомендую OpenNMS. Программное обеспечение OpenNMS, если свободный и компания более, чем радо продать услуги по поддержке и услуги по внедрению. Это также, оказывается, выполняется очень резким моим другом из колледжа!

4
ответ дан 16 December 2019 в 22:45

В настоящее время мы используем PRTG от Paessler. Это превосходно. Никакие агенты требуемый, превосходный веб-интерфейс Ajax, исторический вход, построение графика, WMI, и т.д. и т.д. Существует 10 версий датчика, доступных бесплатно, но мы уронили несколько главные для версии для предприятия. Деньги хорошо потрачены.

4
ответ дан 16 December 2019 в 22:45

Все это зависит, что Вы подразумеваете под "монитором"!

  • Это (система или сервис) доступно? Мы используем nagios.
  • Что это делает? Мы используем munin для серверов Linux и кактусы для примерно всего остального, даже при том, что это - боль для конфигурирования иногда...
  • Что это сделало? Мы используем системный-журнал-ng, чтобы сконцентрировать системные журналы в одном месте и затем запустить специализированный logcheck скрипт ежедневно для отправки отчетов по электронной почте. Мы ищем что-то подобное для серверов Windows.
6
ответ дан 16 December 2019 в 22:45

Мы используем OpsView, который работает сверху Nagios. webUI помогает нам развернуть новые определения монитора хоста, не имея необходимость предоставлять доступ SSH, обеспечивает общественное мнение и записывает исторические ценности. Это удобно для настройки и определения подходящих базовых линий.

3
ответ дан 16 December 2019 в 22:45

Если Вы спешите и хотите, чтобы быстрый инструмент контролировал, Ваш сервер MS затем используют монитор производительности для окон, настраивают встречный журнал с пользовательским контрольным шаблоном и расписанием custome (например: соберите данные в течение 5 минут каждый час). Затем загрузите LogParser Microsoft и Анализ Производительности Codeplex Журналов (PAL) Инструмент (http://pal.codeplex.com/) для уплотнения встречного журнала. PAL генерирует большой зарегистрированный отчет со ссылками на возможные документы/инструменты решения проблемы.

4
ответ дан 16 December 2019 в 22:45

Мы используем AlertFox с нескольких недель и очень счастливы это. Это не только проверяет наше время работы и производительность, но также и контролирует корзину, пользовательский вход в систему и другие критические части веб-сайта с помощью сценариев транзакции (iMacros базирующийся).

Для нашего внутреннего контроля (дисковое пространство и т.д.) мы используем Nagios.

11
ответ дан 16 December 2019 в 22:45

Новый участник на сцене для проверки для конкуренции с Кактусами и RRDTool базировался, решения является Графитовым (http://graphite.wikidot.com/)

RRDTool заменяется запоминающим устройством под названием Шепот. Документы дают довольно хороший обзор того, почему он отличается, и мне действительно нравится CLI за специальное построение графика при исследовании чего-то.

5
ответ дан 16 December 2019 в 22:45

Zabbix (http://www.zabbix.com) хорош также и легче установить, чем Nagios.

3
ответ дан 16 December 2019 в 22:45

Теги

Похожие вопросы