Я - большой поклонник clusterssh. Это открывается окно терминала для каждого хоста, с которым Вы связываетесь, и другое меньшее окно. Текст, введенный в меньшем окне, переходит ко всем окнам терминала. Если необходимо ввести вход для некоторых хостов (например, отвечающий 'y' к "доверию этот ключевой" вопрос для новых хостов), можно просто ввести его в окне терминала.
Все упомянули Nagios - который является большим, но не может дать Вам все, в чем Вы нуждаетесь.
Более оптимальным вариантом для того, что Вы ищете, мог бы быть OpsView - который является просто оберткой вокруг nagios действительно, но добавляет графики сервисов со временем - таким образом, Вы видите то, что Ваши серверы делали за прошедший день, неделю, месяц или год.
И Nagios и OpsView занимают время для установки как бы то ни было.
Один очень полезный и чрезвычайно легкий к установке ответ является munin. Установка по умолчанию munin дает Вам простую веб-страницу с графиками всех видов метрик сервера низкого уровня, такой как, сколько из Вашей памяти используется для кэша или активно приложениями. Сколько inodes Ваша файловая система использует, диск i/o скорость, активность ЦП - поврежденный вниз типом - и т.д. Это будет даже контролировать апача или mysql для Вас - сколько процессов делает что в любой данный момент. Единственная вещь я не думаю, что она сделает, проверить фактическое время отклика Ваших веб-страниц - но даже который не было бы слишком трудно настроить.
Nagios является большим для малых и средних сетей.
OpenNMS, как предполагается, является золотым стандартом бесплатный контроль для большой инфраструктуры (тысячи хостов)
Один из наиболее распространенных инструментов раньше делал, это - Nagios, его открытый исходный код и имеет огромное количество контролирующих плагинов, и если Вам не нравится, когда какой-либо из них его способное запускает какой-либо скрипт удара, Вы могли бы любить и обработать ответ. Это отображает все данные через веб-интерфейс.
Конфигурация nagios может быть вполне сложной и требовать времени для привыкания, но однажды Ваш там это - фантастический инструмент. Существует также много инструментов для помощи в его конфигурации, такой как nagiosconfig.
Я обычно думаю о здоровье как вентиляторы, питание, температура, и т.д. Если Вы используете серверы Dell, открытый справляются, может помочь с этим. Nagios позволяет Вам писать свои собственные плагины на любом языке, он просто использует статус выхода сценария. Возможно связать открытый, справляются в с Nagios также.
Nagios действительно имеет веб-интерфейс, и существуют веб-интерфейсы, которые позволяют Вам настраивать Nagios. Но настроенный Nagios не является всем этим легким в целом.
Я выполняю Nagios & Cacti, и опрашивающую через SNMP, и должно все же быть что-либо, что я не могу контролировать, иногда я должен записать свой собственный php/perl модуль, чтобы сделать это, но ничто не было "unmonitorable".
Даже с PHP+CURL я смог контролировать вход в систему портала нашего Exchange Server OWA, проверить, что на самом деле вошел в систему и может просмотреть ящик входящих сообщений, и если существует отказ где-нибудь в пути, уведомьте инженера.
Как отмечалось ранее, мне нравятся Nagios, Cacti и Munin. Еще один для рассмотрения, который не был упомянут, Monit