Как восстановиться со сбоя диска в конфигурации RAID 5?

Я работал в среде, которая была в процессе миграции на операционную модель TDD. Для некоторых вещей как контролирующие сценарии это работало очень хорошо. Мы использовали buildbot, чтобы установить тестовую среду и запустить тесты. В этом случае Вы приближаетесь к TDD с точки зрения "Унаследованного кода". В TDD "Унаследованный код" существующий код, который не имеет никаких тестов. Таким образом, первые тесты не перестали работать, они определяют корректный (или ожидаемый) операция.

Для многих заданий конфигурации первый шаг должен протестировать, может ли конфигурация быть проанализирована сервисом. Многие сервисы предоставляют некоторые услуги, чтобы сделать просто это. Nagios имеет режим перед полетом, cfagent не имеет никакого действия, апачи, sudo, связывают, и у многих других есть подобные средства. Это - в основном линт, выполненный для конфигураций.

Пример был бы то, при использовании апача и отдельных файлов конфигурации для отличающихся частей можно протестировать части, также просто используют другой httpd.conf файл для обертывания их для работы тестовой машины. Затем можно протестировать это, веб-сервер на тестовой машине дает корректные результаты там.

Каждый шаг по пути Вы следуете за тем же основным шаблоном. Запишите тест, сделайте тестовую передачу, осуществите рефакторинг работу, которую Вы сделали. Как упомянуто выше, при следовании за этим путем, тесты не могут всегда перестать работать принятым способом TDD.

Rik

15
задан 30 March 2010 в 17:57
6 ответов

Система работает очень медленно, потому что она должна восстановить недостающие данные, которые включают дополнительный ЦП и ввод-вывод.

Если у Вас есть отсутствующий диск в конфигурации RAID-5, у Вас нет стратегии восстановления. Если другой диск понизится, то Вы потеряете свои данные. Выполненный, не идите ближайшему поставщику, от которого можно было покрыть совместимую часть гарантией производителя, поставленной на тот-же-день срочный курьер. Если поставщик, у которого Вы купили массив, уже находится в процессе получения части, получите обе части и спрячьте другую как запчасть.

Если у Вас есть RAID-5, используемый для производственной системы, необходимо рассмотреть отъезд резервного диска в массиве как горячее резервирование.

Добавленный - Если Ваши журналы не находятся на отдельном объеме (физически отдельные диски), перемещают их в отдельный набор дисков, даже просто единственная зеркальная пара. Это также будет победой производительности, если Ваша база данных будет иметь какую-либо значительную загрузку, поскольку конкуренция на объемах журнала имеет непропорционально плохой эффект на производительность.

Если это возможно, можно также сделать базу данных более устойчивой путем выполнения следующего:

  1. Закройте базу данных.
  2. Скопируйте базу данных.
  3. Переместитесь журналы к физически отдельному набору дисков (удостоверьтесь, что Вы реконфигурировали базу данных, таким образом, она знает, куда журналы были перемещены в).
  4. Перезапустите базу данных и приложение.

Если у Вас есть вход в систему отдельный объем, можно восстановить и продвинуться вперед от резервного копирования, если и только если отказ диска не ставит под угрозу журналы. Журналы транзакций базы данных должны быть на объеме отдельного диска для (среди других) следующие причины:

  • Шаблоны использования журналов преимущественно последовательны, добавляя записи в журнале на конец файла (файл является в действительности кольцевым буфером). Это означает, что большое количество записей в журнале может быть выписано быстро, поскольку существует мало головки диска, ищут действие.

  • Если они совместно используют физические диски с рабочей нагрузкой в большой степени произвольного доступа (например, транзакционные таблицы и индексы), то они будут замедлены непропорционально, поскольку глава ищет, действие разрушает последовательные записи.

  • Наличие входа в систему, отдельный объем является почти всегда победой производительности и только нуждается в единственной зеркальной паре для журналов для поддержки вполне тяжелой рабочей нагрузки. Это означает, что аппаратные средства, чтобы сделать это являются довольно дешевыми, таким образом, существует маленькая стоимость для большой производительности и победы надежности.

  • Если Ваш массив данных понижается, журналы не потеряны. Если у Вас есть надлежащая стратегия резервного копирования, можно восстановить от резервного копирования и прокрутить foward от журналов. Это означает, что целый массив может понизиться на сервере, не будучи единой точкой отказа. И журнал и массивы данных одновременно не должны вызывать потерю данных.

15
ответ дан 2 December 2019 в 20:49
  • 1
    Спасибо за ответ, особенно объясняя, почему система работает медленно. –  Philip Fourie 25 September 2008 в 11:33
  • 2
    Пятно на. Я даже предложил бы завершить работу его, пока Вы не получаете тот заменяющий диск на месте. Как Nigel говорит, у Вас нет стратегии восстановления. Потеря другой диск, освободите все это. –  Stu Thompson 25 September 2008 в 12:04
  • 3
    Привет Nigel, благодарит занять время и совместно использовать Ваши экспертные знания. Это - действительно большой совет. I' ll сообщают позже результат восстановления. –  Philip Fourie 25 September 2008 в 12:32

1) Резервное копирование.

Прямо сейчас никакие данные не были потеряны. Если Ваши резервные копии не являются актуальным резервным копированием теперь.

2) Прочитайте руководство, позвоните поставщику и т.д.

Различные системы RAID имеют различные шаги для замены диска, и сделанный неправильно Вы рискуете уничтожать целый массив. Не зная, какие аппаратные средства/программное обеспечение RAID Вы имеете, мы можем только предположить необходимые шаги.

Кроме того, медленная производительность состоит в том потому что RAID 5 в ухудшенном состоянии (т.е.: один мертвый диск), имеет ужасную производительность чтения. То, как ужасный зависит от того, как четность хранится и какой диск умер, но "хорошие" новости являются медленной производительностью с одним диском, который уводят, является известной проблемой, и не вызывают для паники.

5
ответ дан 2 December 2019 в 20:49

Сначала я прочитал бы руководство для аппаратных средств/программного обеспечения, которые Вы используете - раздел для восстановления после отказа :)

Должен быть простой вопрос замены диска и восстановления массива все же.

Наиболее важный момент в таких случаях - то, что диск должен быть заменен как можно скорее, с тех пор, если другой диск перестал работать, Вы, вероятно, потеряете данные. Также необходимо ли обратиться к причине отказа - было это, потому что диск становился старым? Необходимо ли заменить другие также? Или это было из-за скачка напряжения, тепла или вибрации?

4
ответ дан 2 December 2019 в 20:49
  • 1
    вероятно, потеряйте данные? Совершенно определенно потеряйте все данные по массиву! Попадите в тюрьму, не передавайте, Идут. (резервные копии в стороне, конечно.) –  Stu Thompson 25 September 2008 в 12:06

Полностью системно-зависимый. Что говорят руководства? Ваши аппаратные средства полностью поддерживают заменяющие в горячем режиме новые диски от контроллера до отсека для накопителей? У Вас есть недавние резервные копии?

0
ответ дан 2 December 2019 в 20:49

Сообщение NXC подводит итог его приятно. На всякий случай Вы не заменяете неисправный диск перед вторыми сбоями, существует все еще хороший шанс наличия почти всего (иногда все) восстановлен специализированным сервисом восстановления. Данные находятся все еще там на дисках, и неисправный диск может обычно приводиться в чувство в специализированной лаборатории с надлежащим оборудованием. Однако цена для этого сервиса довольно высока. Наличие резервного диска и надлежащих резервных копий (согласно предложению NXC) является определенно способом войти в будущее.

0
ответ дан 2 December 2019 в 20:49

Насколько я понимаю RAID5, когда Ваша замена сбойный диск, он автоматически восстановлен от информации, хранившей на других двух. Можно ли 'заменить новый диск в горячем режиме' в место, действительно зависит от Вас система - Вам, вероятно, придется выключиться сначала. Так или иначе, считая относительно низкую стоимость дисков и важность Ваших данных (Отраженными Вашим решением использовать RAID5 во-первых), у Вас действительно должен быть резервный диск, находился в секции, готовой к такой возможности.

Я недавно создал новую разработку ПК для меня и устанавливаю основные диски данных под RAID5. Я заказал еще один диск, чем необходимый, так, чтобы у меня была запчасть, готовая в течение того чрезвычайного момента (Что я надеюсь, не произойдет),

Теперь Вы задали вопрос, я предполагаю, что должен считать на предмете еще немного.

1
ответ дан 2 December 2019 в 20:49
  • 1
    Для небольших объемов данных зеркальная пара лучше, поскольку она обычно имеет лучшую с последовательным доступом скорость, чем маленький RAID-5. Если Вы хотите замену в горячем режиме, смотрите на некоторые системы отсека замены в горячем режиме на где-нибудь как scsi4me.com –  ConcernedOfTunbridgeWells 26 September 2008 в 11:21

Теги

Похожие вопросы