Альтернативы Windows DFS (распределенная файловая система)

Некоторые домашние истины об устройстве хранения данных, или почему хранение ресурсов предприятия так дорогой f-луг?

Потребительские жесткие диски предлагают большие объемы пространства так, чтобы даже самый проницательный пользователь *кашель* потоковые медиа *кашель* мог купить достаточно для хранения набора нескольких терабайт. На самом деле емкость диска становилась быстрее, чем транзистор рассчитывает на кремний в течение нескольких десятилетий теперь.

Устройство хранения данных 'Предприятия' является несколько более сложным вопросом, поскольку данные имеют производительность и требования целостности, которые диктуют несколько больше тяжелого подхода. Данные должны иметь некоторую гарантию доступности в случае отказов оборудования, и это, вероятно, придется совместно использовать с большим количеством пользователей, которые генерируют намного больше запросов чтения-записи, чем отдельный пользователь.

Технические решения этой проблемы могут быть многими, много раз более дорогими на гигабайт, чем потребительские решения для устройства хранения данных. Они также требуют физического обслуживания; резервные копии должны быть взяты и часто храниться удаленные так, чтобы огонь не уничтожал данные. Этот процесс добавляет продолжающиеся затраты.

Производительность

На Вашем потребителе на 1 ТБ или даже диске почти строки предприятия у Вас всего одна голова. Диск вращается на уровне 7 200 об/мин, или 120 оборотов в секунду. Это означает, что можно получить самое большее 120 произвольного доступа операции в секунду ввода-вывода в теории* и несколько менее на практике. Таким образом копирование большого файла на единственном объеме на 1 ТБ является относительно медленным.

На дисковом массиве с 14x диски на 72 ГБ, у Вас 14 голов по дискам, идущим в (говорят) что 15 000 об/мин или приблизительно 250 оборотов в секунду. Это дает Вам теоретический максимум 3 500 случайных операций в секунду ввода-вывода* (снова, несколько менее на практике). При прочих равных условиях копия файла будет многими, много раз быстрее.

* Вы могли получить больше чем один произвольный доступ на оборот диска, если бы геометрия чтений позволила диску двигать головами и считать сектор, который, оказалось, был доступен в одном обороте диска. Если доступы к диску были широко рассеяны, Вы, вероятно, насчитаете меньше чем один. Где дисковый массив отформатировал в чередуемом (см. ниже), расположение Вы получите максимум одного чтения дорожки на оборот диска при большинстве обстоятельств и (в зависимости от RAID-контроллера) возможно меньше чем один в среднем.

Диск на 7 200 об/мин 1 ТБ, вероятно, будет довольно быстр на последовательном вводе-выводе. Дисковые массивы, отформатированные в чередуемой схеме (RAID 0, RAID-5, RAID-10 и т.д.), могут обычно читать самое большее одну дорожку на оборот диска. С дорожкой 64K мы можем читать 64Kx250 = приблизительно 16 МБ данных в секунду от диска на 15 000 об/мин. Это дает последовательную пропускную способность приблизительно 220 МБ в секунду на массиве 14 дисков, который не является что намного быстрее на бумаге, чем 150MB/sec или так заключен в кавычки для современного диска SATA на 1 ТБ.

Для потоковой передачи видео (например), массив 4 дисков SATA в RAID 0 с большим размером дорожки (некоторые RAID-контроллеры будут поддерживать размеры дорожки до 1 МБ) имеет довольно большую последовательную пропускную способность. Этот пример мог теоретически передать потоком о 480MB/sec, который является достаточно удобно, чтобы сделать несжатое редактирование HD-видео в реальном времени. Таким образом владельцы Профессионалов Mac и подобных аппаратных средств могут сделать задачи составления композита HD-видео, которые потребовали бы, чтобы машина с волокном прямого присоединения выстроила всего несколько лет назад.

Реальная выгода дискового массива находится на работе базы данных, которая характеризуется большими количествами маленьких, рассеянных запросов ввода-вывода. На этом типе рабочей нагрузки производительность ограничивается физической задержкой битов металла в диске, идущем со всех сторон и назад и вперед. Эта метрика известна как IOPS (операции в секунду ввода-вывода). Чем больше физических дисков Вы имеете - независимо от способности - тем больше IOPS можно теоретически сделать. Больше IOPS означает больше транзакций в секунду.

Целостность данных

Дополнительно большинство конфигураций RAID дает Вам некоторую избыточность данных - который требует больше чем одного физического диска по определению. Комбинация схемы устройства хранения данных с таким дублированием и большим числом дисков дает системе способность надежно служить большой рабочей нагрузке транзакций.

Инфраструктура для дисковых массивов (и SAN в более крайнем случае) не является точно объектом массового рынка. Кроме того, это - один из битов, которые действительно, действительно не может привести к сбою. Эта комбинация стандарта сборки и меньших объемов рынка не обходится дешево.

Совокупные затраты на хранение включая резервное копирование

На практике самая большая стоимость для поддержания 1 ТБ данных, вероятно, будет резервным копированием и восстановлением. Ленточный накопитель и 34 набора SDLT или лент ultrium для полного цикла дедушки резервного копирования и восстановления будут, вероятно, стоить больше чем дискового массива на 1 ТБ, сделал. Добавьте затраты на удаленное устройство хранения данных и зарплату даже единственной обезьяны ленты, и внезапно Ваш 1 ТБ данных не является вполне настолько дешевым.

Стоимость дисков часто является справедливым путем вниз иерархия доминирующих затрат на хранение. В одном банке у меня был случай для работы на устройство хранения данных SAN, стоился на уровне £900/ГБ за систему разработки и £5,000/ГБ для диска на рабочем сервере. Даже по ценам поставщика предприятия физическая стоимость дисков была только крошечной частью этого. Другой пример, о котором я знаю, имеет (относительно) скромно настроенный IBM Shark SAN, которые стоят им где-нибудь сверх £1 миллиона. Просто физическое устройство хранения данных на этом заряжено на уровне приблизительно £9/гигабайтов или приблизительно 9 000£ для пространства, эквивалентного Вашему потребителю на 1 ТБ жесткий диск.

3
задан 7 May 2009 в 13:50
1 ответ

Попробуйте OpenAFS.

1
ответ дан 3 December 2019 в 07:46

Теги

Похожие вопросы