Мы используем основанных на переключателе/подсистеме балансировки нагрузки VIP что циклический алгоритм на основе теста сервисной доступности, такого как httpget или подобный. Это устраняет загрузку и ответственность от сервера - каждый из них думает, что они - единственный ответ. Затем для наших фактических кластеров (Oracle, WebLogic, ZXTM и т.д.) та же модель верна, но само кластеризирующееся приложение гарантирует, что серверы находятся в контакте друг с другом, но стоящий с клиентом дюйм/с все еще остается 'регулярными'. По существу мы никогда не находили причину ничего кроме 'регулярного' дюйм/с, но мне было бы интересно знать Ваш запланированный вариант использования. О, и мы можем затем использовать переключатель/LB для определения, в/не работающ котором находятся серверы.
Не паникуйте, это распространенная ошибка, которую можно исправить. Ваша хостинговая компания установила резервный массив с двумя дисками для защиты данных в случае выхода из строя одного из дисков. Теперь произошел сбой. Выходные данные показывают, что sda1 вышел из строя и что массив RAID1 работает, но его производительность ухудшилась.
Но сейчас у вас время в займе. Если второй диск выйдет из строя, эти данные исчезнут, и вам придется восстановить их из резервной копии. Попросите вашу хостинговую компанию немедленно заменить неисправный диск и связаться с вами, когда это будет сделано!
Также хорошая идея - убедиться, что с резервными копиями все в порядке, прежде чем что-то испортить или кого-то испортить из-за деградированного рейда. К сожалению, случаются каскадные сбои, а также ошибки со стороны персонала хоста (тройная проверка, что вы и сотрудники хостинговой компании находитесь на одной странице относительно того, что делать с каким диском).
AFAIK, если устройство работает называется / dev / mdX, это всегда linux softraid, поэтому не задействуется никакой аппаратный контроллер хранилища, кроме прямого хост-адаптера SATA или SAS.
В Linux есть способы сообщить ему, что диск является должны быть логически удалены или добавлены, однако они должны когда-либо быть необходимы только в случае горячего подключения напрямую подключенных устройств PATA или параллельных SCSI (что в любом случае следует считать запрещенным на оборудовании, которое явно не поддерживает его).
smartctl (из пакета smartmontools; не запускайте его, если задействован ssd И провайдер не установил на сервере демон smartmontools или скрипт cron; есть версии умных утилит, которые, как известно, могут повредить определенные ssd) может расскажет вам много о том, ЧТО не так с диском, особенно если он подключен напрямую, как здесь, так же как и вызов dmesg. Значения spinup_count и power_on_hours, которые вы получаете на заменяемых дисках, вы иногда получаете для интересных тем для обсуждения с хостерами;)