Что различными являются широко используемые уровни RAID и когда я должен рассмотреть их?

telnet <hostname> 5222
182
задан 17 March 2017 в 12:13
2 ответа

RAID: почему и когда

RAID означает избыточный массив независимых дисков (некоторые из них учат «Недорого», чтобы указать, что они «нормальные» диски; исторически существовали диски с внутренним резервированием, которые были очень дорогими; так как они больше не доступны, аббревиатура адаптирована).

На самом общем уровне RAID - это группа дисков, которые выполняют одни и те же операции чтения и записи. Ввод-вывод SCSI выполняется на томе («LUN»), и они распределяются по базовым дискам таким образом, чтобы повысить производительность и / или увеличить избыточность. Повышение производительности является функцией чередования: данные распределяются по нескольким дискам, чтобы позволить чтения и записи использовать все очереди ввода-вывода дисков одновременно. Избыточность - это функция зеркалирования. Целые диски можно хранить как копии, или отдельные полосы могут быть написаны несколько раз. В качестве альтернативы, в некоторых типах рейдов, вместо копирования битов данных в бит, избыточность достигается за счет создания специальных полос, содержащих информацию о четности, которую можно использовать для воссоздания любых потерянных данных в случае аппаратного сбоя.

несколько конфигураций, которые обеспечивают разные уровни этих преимуществ, которые описаны здесь, и каждая из них имеет тенденцию к производительности или избыточности.

Важный аспект при оценке того, какой уровень RAID будет работать для вас, зависит от его преимуществ и требований к оборудованию ( Например: количество дисков).

Еще одним важным аспектом большинства этих типов RAID (0,1,5) является то, что они не обеспечивают целостность ваших данных , потому что они абстрагируются от фактических хранимых данных. Таким образом, RAID не защищает от поврежденных файлов. Если файл поврежден любыми средствами, повреждение будет зеркально отражено или парировано и сохранено на диск в любом случае. Однако RAID-Z утверждает, что обеспечивает целостность ваших данных на уровне файлов .


RAID с прямым подключением: программное и аппаратное обеспечение

Существует два уровня, на которых RAID может быть реализован в системе хранения с прямым подключением : железо и софт. В настоящих аппаратных решениях RAID есть выделенный аппаратный контроллер с процессором, предназначенным для вычислений и обработки RAID. Он также обычно имеет кэш-модуль с резервным питанием от батареи, так что данные могут быть записаны на диск даже после сбоя питания. Это помогает устранить несоответствия, когда системы не выключаются должным образом. Вообще говоря, хорошие аппаратные контроллеры работают лучше, чем их программные аналоги, но они также имеют значительную стоимость и увеличивают сложность.

Программный RAID обычно не требует контроллера, поскольку он не использует выделенный процессор RAID или отдельный кэш. Обычно эти операции выполняются непосредственно ЦП. В современных системах эти вычисления потребляют минимальные ресурсы, хотя при этом возникает некоторая минимальная задержка. RAID обрабатывается либо непосредственно ОС, либо поддельным контроллером в случае FakeRAID .

Вообще говоря, если кто-то собирается выбрать программный RAID, он должен избегать FakeRAID и использовать для своей системы собственный пакет ОС, такой как динамические диски в Windows, mdadm / LVM в Linux или ZFS в Solaris, FreeBSD и другие связанные дистрибутивы. FakeRAID использует комбинацию аппаратного и программного обеспечения, которая приводит к первоначальному виду аппаратного RAID, но фактической производительности программного RAID. Кроме того, обычно чрезвычайно сложно переместить массив на другой адаптер (если исходный адаптер выйдет из строя).


Централизованное хранилище

Другое место, где RAID обычно используется, - это централизованные устройства хранения, обычно называемые SAN (Storage Area Network) или NAS (сетевое хранилище). Эти устройства управляют своим собственным хранилищем и позволяют подключенным серверам получать доступ к хранилищу различными способами. Поскольку несколько рабочих нагрузок содержатся на одних и тех же нескольких дисках, обычно желателен высокий уровень избыточности.

Основное различие между NAS и SAN заключается в экспорте на уровне блоков и файловой системы. SAN экспортирует целое «блочное устройство» например, раздел или логический том (включая те, которые построены поверх массива RAID). Примеры SAN включают Fibre Channel и iSCSI. NAS экспортирует «файловую систему», например файл или папку. Примеры NAS включают CIFS / SMB (общий доступ к файлам в Windows) и NFS.


RAID 0

Хорошо, когда: Скорость любой ценой!

Плохо, когда: Вы заботитесь о своих данных

RAID0 (также известный как чередование) иногда называют «объемом данных, который у вас останется при выходе из строя диска». Это действительно противоречит структуре «RAID», где «R» означает «избыточный».

RAID0 берет ваш блок данных, разбивает его на столько частей, сколько у вас дисков (2 диска → 2 части, 3 диска → 3 штуки), а затем записывает каждую часть данных на отдельный диск.

Это означает, что сбой одного диска разрушает весь массив (потому что у вас есть Часть 1 и Часть 2, но нет Часть 3), но это обеспечивает очень быстрый доступ к диску.

Это не часто используется в производственных средах, но его можно использовать в ситуации, когда у вас есть строго временные данные, которые могут быть потеряны без каких-либо последствий. Он довольно часто используется для кэширования устройств (таких как устройство L2Arc).

Общее используемое дисковое пространство - это сумма всех дисков в массиве, сложенных вместе (например, 3 диска по 1 ТБ = 3 ТБ пространства).

RAID 1


RAID 1

Хорошо, когда: у вас ограниченное количество дисков, но требуется избыточность

Плохо, когда: вам нужно много места для хранения

RAID 1 (также известный как зеркалирование) берет ваши данные и дублирует их идентично на двух или более диски (хотя обычно всего 2 диска). Если используется более двух дисков, одна и та же информация сохраняется на каждом диске (все они идентичны). Это единственный способ обеспечить избыточность данных, когда у вас меньше трех дисков.

RAID 1 иногда улучшает производительность чтения. Некоторые реализации RAID 1 будут читать с обоих дисков, чтобы удвоить скорость чтения. Некоторые будут читать только с одного из дисков, что не дает дополнительных преимуществ в скорости. Другие будут читать одни и те же данные с обоих дисков, обеспечивая целостность массива при каждом чтении, но это приведет к той же скорости чтения, что и отдельный диск.

Обычно он используется на небольших серверах, которые имеют очень небольшое расширение диска, например как серверы 1RU, на которых может быть место только для двух дисков, или на рабочих станциях, требующих резервирования. Из-за больших накладных расходов на "потерянное" пространство, это может быть непомерно дорого с небольшими, высокоскоростными (и дорогими) дисками, так как вам нужно потратить вдвое больше денег, чтобы получить такой же уровень полезной памяти.

Общее используемое дисковое пространство - это размер самого маленького диска в массиве (например, 2 диска по 1 ТБ = 1 ТБ пространства).

RAID 1


RAID 1E

Уровень RAID 1E аналогичен RAID 1 в том, что данные всегда записываются в (при минимум) два диска. Но в отличие от RAID1, он позволяет использовать нечетное количество дисков путем простого чередования блоков данных между несколькими дисками.

Характеристики производительности аналогичны RAID1, отказоустойчивость аналогична RAID 10. Эта схема может быть расширена до нечетного количества дисков. более трех (возможно, называется RAID 10E, но редко).

RAID 1E


RAID 10

Хорошо, когда: Вам нужна скорость и избыточность

Плохо, когда: Можно ' t позволить потерять половину дискового пространства

RAID 10 представляет собой комбинацию RAID 1 и RAID 0. Порядок 1 и 0 очень важен. Скажем, у вас есть 8 дисков, он создаст 4 массива RAID 1, а затем применит массив RAID 0 поверх 4 массивов RAID 1. Для этого требуется как минимум 4 диска, и дополнительные диски нужно добавлять попарно.

Это означает, что один диск из каждой пары может выйти из строя. Итак, если у вас есть наборы A, B, C и D с дисками A1, A2, B1, B2, C1, C2, D1, D2, вы можете потерять по одному диску из каждого набора (A, B, C или D) и все еще иметь функционирующий массив.

Однако, если вы потеряете два диска из одного набора, то массив будет полностью потерян. Вы можете потерять до (но не гарантируется) 50% дисков.

Вам гарантируется высокая скорость и высокая доступность в RAID 10.

RAID 10 - очень распространенный уровень RAID, особенно с дисками большой емкости, где отказ одного диска увеличивает вероятность отказа второго диска до того, как RAID-массив будет восстановлен. Во время восстановления снижение производительности намного ниже, чем у его аналога RAID 5, поскольку для восстановления данных требуется только чтение с одного диска.

Доступное дисковое пространство составляет 50% от суммы общего пространства. (например, 8 дисков по 1 ТБ = 4 ТБ полезного пространства). Если вы используете разные размеры, для каждого диска будет использоваться только наименьший размер.

Стоит отметить, что программный raid-драйвер ядра Linux, называемый md , допускает конфигурации RAID 10 с нечетным количеством дисков , т. Е. 3 или 5 дисковых RAID 10.

RAID 10


RAID 01

Хорошо, когда: никогда

Плохо, когда: всегда

Это противоположно RAID 10. Это создает два массива RAID 0, а затем помещает RAID 1 поверх. Это означает, что вы можете потерять по одному диску из каждого набора (A1, A2, A3, A4 или B1, B2, B3, B4). Это очень редко можно увидеть в коммерческих приложениях, но это возможно с помощью программного RAID.

Для полной ясности:

  • Если у вас есть массив RAID10 с 8 дисками и одним кристаллом (назовем его A1), тогда у вас будет 6 резервных дисков и 1 без избыточности. Если другой диск умирает, есть вероятность 85% , что ваш массив все еще работает.
  • Если у вас есть массив RAID01 с 8 дисками и один умирает (мы назовем его A1), то у вас будет 3 резервные диски и 4 без резервирования. Если другой диск выходит из строя, существует 43% шанс, что ваш массив все еще работает.

Он не обеспечивает дополнительной скорости по сравнению с RAID 10, но обеспечивает значительно меньшую избыточность, и его следует избегать любой ценой.


RAID 5

Хорошо, когда: вам нужен баланс избыточности и дискового пространства или рабочая нагрузка в основном случайное чтение

Плохо, когда: у вас высокая рабочая нагрузка произвольной записи или большие диски

RAID 5 был наиболее часто используемый уровень RAID на протяжении десятилетий. Он обеспечивает системную производительность всех дисков в массиве (за исключением небольших случайных записей, которые влекут за собой небольшие накладные расходы). Он использует простую операцию XOR для вычисления четности. В случае отказа одного диска информация может быть восстановлена ​​с оставшихся дисков с помощью операции XOR с известными данными.

К сожалению, в случае сбоя диска процесс восстановления требует очень больших затрат ввода-вывода. Чем больше диски в RAID, тем больше времени потребуется на восстановление и тем выше вероятность отказа второго диска. Поскольку большие медленные диски имеют гораздо больше данных для восстановления и намного меньшую производительность, чтобы сделать это, обычно не рекомендуется использовать RAID 5 со скоростью 7200 об / мин или ниже.

Возможно, самая критическая проблема с массивами RAID 5 при использовании в потребительских приложениях почти гарантированно выходят из строя, когда общая емкость превышает 12 ТБ. Это связано с тем, что частота неисправимой ошибки чтения (URE) потребительских дисков SATA составляет один на каждые 10 14 бит, или ~ 12,5 ТБ.

Если мы возьмем пример с Массив RAID 5 с семью дисками по 2 ТБ: при выходе из строя диска остается шесть дисков. Чтобы восстановить массив, контроллеру необходимо прочитать шесть дисков по 2 ТБ каждый. Глядя на рисунок выше, можно почти наверняка, что еще до завершения перестройки произойдет еще одно URE. Как только это произойдет, массив и все данные на нем будут потеряны.

Однако URE / потеря данных Отказ / array с проблемой RAID 5 на потребительских дисках был несколько смягчен тем фактом, что большинство производителей жестких дисков повысили рейтинг URE своих новых дисков до 1 из 10 15 бит. Как всегда, проверьте спецификацию перед покупкой!

Также обязательно, чтобы RAID 5 был оставлен позади надежный (с батарейным питанием) кэш записи. Это позволяет избежать накладных расходов на небольшие записи, а также нестабильного поведения, которое может возникнуть при сбое в середине записи.

RAID 5 является наиболее экономичным решением для добавления избыточного хранилища в массив, поскольку для этого требуется потеря только 1 диска (например, 12 дисков по 146 ГБ = 1606 ГБ полезного пространства). Требуется минимум 3 диска.

RAID 5


RAID 6

Хорошо, когда: Вы хотите использовать RAID 5, но ваши диски слишком большие или медленные

Плохо, когда: У вас высокая рабочая нагрузка произвольной записи

RAID 6 похож на RAID 5, но он использует два диска четности вместо одного (первый - XOR, второй - LSFR), поэтому вы можете потерять два диска из массива без потери данных. Штраф за запись выше, чем у RAID 5, и у вас на один диск меньше места.

Стоит учесть, что в конечном итоге массив RAID 6 столкнется с проблемами, аналогичными RAID 5. Диски большего размера вызывают большее время восстановления и больше скрытых ошибок, в конечном итоге приводит к отказу всего массива и потере всех данных до завершения перестройки.

199
ответ дан 16 December 2019 в 22:45

Также RAID ОДИН МИЛЛИОН !!!!

128 дисков, поэтому чтение будет быстрым, запись ужасная, но очень надежная, я полагаю, о, и вы получите 1/128 доступную пространство, поэтому не очень хорошее с точки зрения бюджета. Не делайте этого с флешками, я пробовал поджечь атмосферу ...

enter image description here

58
ответ дан 16 December 2019 в 22:45

Теги

Похожие вопросы