После замечающий высокую нагрузку на наш сервер виртуального корневого каталога (подмножество RAID 1 2 x 1 ТБ) я нашел эти сообщения в/var/log/messages (CentOS):
kernel: ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
kernel: ata3.00: failed command: WRITE DMA
kernel: ata3.00: cmd ca/00:10:e0:1b:01/00:00:00:00:00/e1 tag 18 dma 8192 out
kernel: res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
kernel: ata3.00: status: { DRDY }
kernel: ata3: hard resetting link
kernel: Clocksource tsc unstable (delta = -25761696872 ns)
kernel: ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
kernel: ata3.00: configured for UDMA/100
kernel: ata3.00: device reported invalid CHS sector 0
kernel: ata3: EH complete
Мог нравиться, что кто-то приносит некоторый свет в нем? Действительно ли это - серьезная проблема HDD или что-то еще? Как я могу проверить состояние виртуального HDD (без УМНОЙ возможности)?
Диск не успел вовремя отреагировать и был сброшен операционной системой, это может означать многое, но самыми распространенными являются:
Эта конкретная ошибка, не имеющая предыдущих ошибок на других ошибках или повышенной задержки, может указывать на ошибку носителя. Однако вы можете использовать функцию smartctl для проверки наличия CRC-ошибок в интеллектуальных счетчиках.
Если это ошибка носителя, то диск испытывает проблемы, так как команда, которая не прошла, является ошибкой при записи. Обычно при записи ошибка носителя не возникает, и это происходит при последующих чтениях. Возможно, предыдущее чтение заняло слишком много времени, и запись стала жертвой тайм-аута. Я тоже видел, как это происходило.
Вы также должны заметить, что ссылка была перезаключена на 1.5 Гбит/с, если это первая проблема с ссылкой, если это третья или более проблема такого рода, то это указывает на плохое поведение, которое я видел в Linux, который пытается облегчить сбрасывание с пониженной скоростью, даже если проблема не с ссылкой, а с медиа-ошибкой.
Элементы действия: