Со вторым контрольным сервером, конечно. Второй может быть намного более простым, так как все, что он должен сделать, контролировать первое. И это должно контролироваться основной системой контроля в свою очередь, конечно.
Если Ваша группа является частью более крупной организации с отдельными инфраструктурами ИТ, Вы можете принимать меры, чтобы контрольный сервис другой группы наблюдал за Вашей.
Вы могли также удостовериться, что сервер отправляет, "это - хорошо" сообщение каждый день, и привыкните искать его. (Это только эффективно, если Вы не уже переполнены стандартными сообщениями, конечно.)
Невозможно очистить текущий счетчик ожидающих секторов. Как правило, несколько секторов могут быть помечены как поврежденные еще до того, как диск покинет завод, но это не является проблемой. Пока количество перераспределенных и / или ожидающих подсчета секторов не / перемещается /, с диском все в порядке, даже с несколькими испорченными секторами. Когда счетчики начинают расти, следует считать, что диск находится в опасности.
Кроме того, в целом, многие диски не терпят неудачу в своих проверках SMART до тех пор, пока не будут повреждены десятками тысяч битых секторов и очень сильно много жареного.
Короче: чем ты занимаешься? Смотрите и ждите.
У меня такая же проблема, и я вижу ошибку с "smartctl -l xerror / dev / sdb", но она не появляется в самотестировании, и dd, кажется, читает блок нормально. В настоящее время я пытаюсь перезаписать его рейд, но я не могу просто обнулить блок.