MEGARAID RAID 1 SSD С ДОСТУПНЫМ ГОРЯЧИМ ЗАПАСОМ

Я не знаю, требует ли это немедленных действий или нет. Сервер W2012R2 с двумя твердотельными накопителями емкостью 500 ГБ плюс один идентичный Hot Global Spare. RAID - это Мегараид. Скриншоты из утилиты RAID прилагаются ниже. Это бизнес в маленьком городке, где у нас нет простого доступа к профессионалам в области оборудования. Я разработчик программного обеспечения, так что я все, что у нас есть.

В конфигурации есть отдельный диск емкостью 1 ТБ, который используется для «временного» хранилища и не требует зеркалирования или резервного копирования. Затем три твердотельных накопителя Samsung емкостью 500 ГБ, два зеркальных и один настроенный как глобальный горячий резерв.

Мы начали видеть, что кажется ошибками диска в журнале, показанном ниже. Моя цель состояла в том, чтобы определить, какой из дисков вышел из строя, и заменить его на Hot Spare, который изначально был установлен для такого типа ситуаций.

Эти диски работают без происшествий около 3,5 лет в режиме 24/7.

Итак, у меня следующие вопросы:

  1. Учитывая, что это первое свидетельство какой-либо проблемы с диском, и тот факт, что программное обеспечение указывает статус как «оптимальный», нужно ли мне немедленно заменить? Это SSD, ожидаю ли я, что он выйдет из строя, как вращающийся диск, то есть быстро станет хуже? Или как твердотельный накопитель - это возможный выход из строя?

  2. Учитывая, что я должен заменить его сейчас, я не знаю, как подойти к этому с помощью этого программного обеспечения наиболее простым способом. Интуитивно я могу определить, какой из дисков выходит из строя, но сообщение, похоже, не передает никакой информации такого рода. Затем добавьте в массив Hot Spare и удалите неисправный диск.

3 (а). Как определить, какой из существующих дисков является проблемным?

3 (b). Как удалить неисправный диск из массива и заменить его на «горячий» резерв для восстановления?

3 (c). Можно ли все это сделать из утилиты Windows или нужно сделать это с экрана настроек RAID при загрузке? Эта утилита ВИДИТ для поддержки этих операций.

Я буду глубоко признателен за любой вклад по этой проблеме. Я пытаюсь разобраться с этим до того, как мы начнем терять данные или иметь простои, но я обнаружил, что первоначальная установка массива несколько лет назад была более простой проблемой, чем замена потенциально неисправного диска.

Заранее спасибо.

Megaraid Screen 1 Megaraid Screen 2 Megaraid Screen 3

2
задан 1 June 2019 в 20:14
1 ответ

Что в деталях SMART говорится о поврежденных секторах и ошибках чтения? А как насчет оставшегося срока службы в%? В общем, если диски по-прежнему отображаются как оптимальные, вы можете безопасно продолжать их использовать (я даже все еще использую один на ежедневной основе, который два года назад показывался как "ПЛОХОЕ состояние" без проблем, хотя я бы не рекомендовал его для важных данных и, конечно, не в бизнес-среде), хотя это зависит от диска к диску.

Поскольку у вас есть диск с горячим резервом (то есть, если он действительно настроен как горячий резерв!), он автоматически заменит неисправный диск ( поэтому он называется Горячий запасной), как только это необходимо. Обычно здесь не нужно вмешиваться вручную. Убедитесь, что ваши резервные копии в порядке: недавние, достаточно длинная история и проверены на наличие повреждений.

Некоторые другие мысли:

Какой у вас бюджет? Если у вас есть бюджет, купите дополнительный диск на всякий случай. Для большей надежности убедитесь, что это та же модель. Если вы это сделаете, проверьте свою гарантию на текущую, которая показывает ошибки, и замените ее. Если это достойная марка и модель SSD, у вас, вероятно, есть как минимум 5-летняя гарантия (если не превышен максимальный TBW). Если у вас достаточно бюджета, купите больше одного.

Насколько важно время безотказной работы? Если простои абсолютно неприемлемы, вам следует инвестировать в высокую доступность вашего хранилища, то есть в запасную систему хранения на случай, если у вас упадет ток. Облачное хранилище резервных копий - это один из вариантов, но для этого вам понадобится хорошее подключение к Интернету. Другой вариант - дополнительный NAS. Если бюджет ограничен, подержанная система также является достойным вариантом в качестве резервного плана для сокращения времени простоя.

Что касается технической поддержки оборудования, есть также удаленные варианты. Не пытайтесь делать что-то слишком быстро самостоятельно, потому что есть шанс, что вы все испортите и вызовете простои компании.

Я не знаком с Megaraid, но программного обеспечения вашего рейд-контроллера должно быть достаточно, чтобы замените неисправный диск или измените настройки рейда.

0
ответ дан 3 December 2019 в 13:41

Теги

Похожие вопросы