Таким образом, последняя конфигурация наших вычислительных узлов Nova использует необработанные устройства / dev / sdX (без меток и разделов) в качестве компонентов для массива md0
(raid0), в котором они размещают файловую систему XFS. . Когда один из основных жестких дисков выходит из строя, рейд остается в блаженном неведении об этом.
Это подтверждается другими случаями, например, mdadm не обнаружил сбойный диск в raid0
Тогда возникает вопрос. После замены вышедшего из строя жесткого диска, как нам повторно собрать этот массив, не выполняя принудительное выполнение нового mkfs
? Или было бы достаточно fsck
файловой системы и заново обнаружить (уже не «плохие» блоки)? Это вообще вещь? (Если ОС пытается использовать блоки на неисправном устройстве, я предполагаю, что драйверы должны просто возвращать «плохие блоки» для всего диапазона. Традиционно в файловых системах Unix резервные блоки вечны ... вы никогда не пытаетесь их вернуть. Есть ли переключение на xfs_repair
, чтобы заставить его повторно оценивать плохие блоки?
Я неправильно понимаю основную механику здесь?
Вы не можете. Как вы уже сказали, raid0 не обеспечивает избыточности, независимо от того, чередуется он или последовательно. Один диск в raid0 все еще функционирует, хотя это не то же самое, это в основном то же самое, когда вы стерли [вторую] половину диска не-raid0: вы все еще можете читать и, вероятно, записывать некоторые из секторов, потому что они все еще содержат форматирование и действительные данные, но как только вы захотите что-то сделать с другими, ОС выйдет из строя.
Итак, если вы настаиваете на продолжении использования недокументированных обратных сторон сбоя raid0, представляя их как преимущества дизайна, у вас есть два варианта: написать дополнительное программное обеспечение [слои] самостоятельно или встретить свою гибель, потому что нет готовых к использованию методов.