Мы используем Nagios для контроля нескольких сотен серверов для обычно приблизительно полудюжины сервисов на машину (время, использование диска, SSH/SMTP/HTTP поздравления, некоторое содержание HTTP, ping), включая со списками эскалации, единственное место для изменения адресов электронной почты и сервисных зависимостей (если сервер не отвечает на ping, не отправляйте уведомления за каждым сервисом, который снижается). Мы имеем центральный сервер Nagios и используем внешний контрольный сервис для предупреждения нас, если наш восходящий поток имеет проблемы.
Я очень доволен нашей контрольной установкой.
Для планирования мощностей мы используем munin, который очень легко настроить. Мы выполняем это на большинстве наших серверов, установленных локально.
Sean
Проверьте, является ли DBS в режиме Full Recovery. Если они, Вы заставили задания, работающие на самом деле создавать резервную копию журналов транзакций, работающих на достаточно частом расписании для хранения их к управляемому размеру?
Править:
Когда файл будет полон из-за ограниченного роста, Ваш DB прекратит обрабатывать транзакции, поскольку он нигде не должен регистрировать их. Необходимо разобраться в причине файла, растущего так вместо того, чтобы ограничить файл.
Если это - чрезвычайно занятое (и чрезвычайно огромный) база данных, 100 ГБ журналов в неделю не могут быть возмутительными. Без большей информации о размере базы данных, объеме сделки, рекордных размерах, и т.д., который является трудным для нас судить.
Более важный вопрос: если эта база данных сохраняется каждую ночь, почему журналы не сокращают? Обычно, не нужно волноваться об объеме журнала транзакций в неделю.
Справочная информация:
Так, вот больший вопрос: как этот SQL-сервер сохраняет, и журналы транзакций сокращают во время каждого резервного копирования? Был ли ночной процесс резервного копирования, который внезапно прекратил работать?
Если предыдущий администратор был слишком ленив для использования надлежащих сервисных учетных записей - и это весьма распространено - много вещей, включая резервные копии, возможно, прекратило работать, когда его учетная запись была отключена, и встроенный пароль учетной записи администратора домена был изменен.
Как сказанный Chris, когда Ваш DB установлен на полный режим восстановления, (который это почти определенно) необходимо выполнить своего рода резервное копирование для усечения журнала транзакций. Если не Вы будете видеть, что он постоянно растет. Если у Вас нет заботы об окне восстановления того, что DB затем можно просто задержать режим восстановления к Основному.
Я изменился бы на модель восстановления на образцовой базе данных от ПОЛНОГО до ПРОСТОГО.
В нашей организации ПОЛНАЯ модель восстановления является преднамеренным решением, которое мы планируем. Установка ПРОСТОГО на образцовой базе данных устраняет возможность файла журнала, заполняющего диск, потому что это не имело регулярных резервных копий.
Какая версия MSSQL? SQL Server 2008 удалил способность усечь файлы журнала (и у них есть очень хорошие, допустимые причины того, чтобы сделать так), поэтому если Ваш файл журнала не контролируется, необходимо запустить его снова и заставить надлежащие планы технического обслуживания на месте гарантировать, что этого не происходит снова.
Тем не менее, если Вы не используете:
Затем нет никакой настоящей причины для Вас, чтобы быть в полном режиме восстановления. При переключении его на Простой, это помешает файлу журнала становиться дальнейшим.