Сообщение об ошибке жесткого диска в Сервере Виртуального корневого каталога

После замечающий высокую нагрузку на наш сервер виртуального корневого каталога (подмножество RAID 1 2 x 1 ТБ) я нашел эти сообщения в/var/log/messages (CentOS):

kernel: ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
kernel: ata3.00: failed command: WRITE DMA
kernel: ata3.00: cmd ca/00:10:e0:1b:01/00:00:00:00:00/e1 tag 18 dma 8192 out
kernel:         res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
kernel: ata3.00: status: { DRDY }
kernel: ata3: hard resetting link
kernel: Clocksource tsc unstable (delta = -25761696872 ns)
kernel: ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
kernel: ata3.00: configured for UDMA/100
kernel: ata3.00: device reported invalid CHS sector 0
kernel: ata3: EH complete

Мог нравиться, что кто-то приносит некоторый свет в нем? Действительно ли это - серьезная проблема HDD или что-то еще? Как я могу проверить состояние виртуального HDD (без УМНОЙ возможности)?

1
задан 28 August 2014 в 16:44
1 ответ

Диск не успел вовремя отреагировать и был сброшен операционной системой, это может означать многое, но самыми распространенными являются:

  1. Ошибка носителя -- некоторые местоположения на диске не могут быть прочитаны или записаны на
  2. Ошибки соединения -- Плохой кабель

Эта конкретная ошибка, не имеющая предыдущих ошибок на других ошибках или повышенной задержки, может указывать на ошибку носителя. Однако вы можете использовать функцию smartctl для проверки наличия CRC-ошибок в интеллектуальных счетчиках.

Если это ошибка носителя, то диск испытывает проблемы, так как команда, которая не прошла, является ошибкой при записи. Обычно при записи ошибка носителя не возникает, и это происходит при последующих чтениях. Возможно, предыдущее чтение заняло слишком много времени, и запись стала жертвой тайм-аута. Я тоже видел, как это происходило.

Вы также должны заметить, что ссылка была перезаключена на 1.5 Гбит/с, если это первая проблема с ссылкой, если это третья или более проблема такого рода, то это указывает на плохое поведение, которое я видел в Linux, который пытается облегчить сбрасывание с пониженной скоростью, даже если проблема не с ссылкой, а с медиа-ошибкой.

Элементы действия:

  • Проверка smart на наличие CRC-ошибок
  • Проверьте, сколько ошибок у вас было в прошлом
  • Если вы хотите восстановить скорость 3 Гбит/с, перезагрузитесь
  • Проверьте, нет ли в логах сообщения "NCQ отключен из-за чрезмерных ошибок", это может объяснить замедление работы диска, но не саму проблему диска
  • Убедитесь, что у вас есть резервная копия, так как вполне возможно, что ваш диск отказывает
2
ответ дан 3 December 2019 в 21:13

Теги

Похожие вопросы