Как делают устройство хранения данных, которое IOPS изменяют в ответ на емкость диска?

При прочих равных условиях, как производительность массива хранения данных IOPS изменилась бы, если бы один использовал большие диски.

Например, возьмите массив с дисками на 10 X 100 ГБ.

Измерьте IOPS для последовательных записей блока 256 КБ (или любая метрика IOPS)

Давайте предположим, что получающееся имело размеры, IOPS является 1000 IOPS.

Измените массив для одного с дисками на 10 X 200 ГБ. Формат с той же конфигурацией RAID, тем же размером блока, и т.д.

Можно было бы ожидать, что IOPS останется тем же, увеличением или уменьшением? Изменение было бы примерно линейно? т.е. увеличение 2X или уменьшение 2X (поскольку я увеличил емкость диска 2X),

Повторите эти вопросы с дисками на 10 X 50 ГБ.

Править: Больше контекста

Этот вопрос закончился как разговор среди моей команды Системного администратора, которая не является хорошо сведущей во всех вещах устройство хранения данных. (Довольный многими аспектами устройства хранения данных, но не деталями управления SAN или безотносительно). Мы получаем большую груду новых лотков NetApp, которые имеют более высокую емкость диска на диск - двойную способность - чем наши существующие лотки. Комментарий подошел, что IOPS новых лотков будет ниже просто, потому что диски были больше. Затем автомобильная аналогия подошла для объяснения этого. Никакой комментарий не устроил меня так, я хотел выполнить его Команде, т.е. Земле Exchange стека.

Автомобильная аналогия была чем-то приблизительно два автомобиля, с другим ускорением, той же максимальной скоростью и выполнением мили четверти. Затем измените расстояние до половины мили. На самом деле я не могу помнить точную аналогию, но так как я нашел другой на interwebz, который был подобен, я полагал, что это была, вероятно, общая аналогия IOPS.

До некоторой степени фактический ответ на вопрос не имеет значения так очень для меня, поскольку мы не используем эту информацию для оценки покупки. Но мы действительно должны оценить лучший способ присоединить лотки к существующей голове, и лучший способ вырезать агрегируется и объемы.

12
задан 2 July 2014 в 16:18
7 ответов

Чтобы ответить на Ваш вопрос напрямую - все остальное равно = никаких изменений при изменении ГБ.

Вы не измеряете IOPS с ГБ. Вы используете время поиска и латентность.

Я мог бы переписать все это здесь, но приведенные ниже примеры уже делают все это, и я бы просто повторил:

https://ryanfrantz.com/posts/calculating-disk-iops.html

http://www.big-data-storage.co.uk/how-to-calculate-iops/

http://www.wmarow.com/strcalc/

http://www.thecloudcalculator.com/calcululator/disk-raid-and-iops.html

8
ответ дан 2 December 2019 в 21:29

Я знаю, что это, вероятно, гипотетический вопрос... Но мир информационных технологий на самом деле так не работает. Существуют реальные ограничения, которые следует учитывать, плюс другие вещи, которые могут влиять на IOPS...

  • 50 ГБ и 100 ГБ дисков на самом деле больше не существует. Подумайте больше: 72, 146, 300, 450, 600, 900, 1200 ГБ в корпоративных дисках и 500, 1000, 2000, 3000, 4000, 6000 ГБ в средах с объемными носителями ближнего/среднего действия.

  • В современных системах хранения данных так много абстракции; кэширование дисков, кэширование контроллеров, выгрузка SSD и т.д., что любые различия будет трудно обнаружить.

  • У вас есть различные форм-факторы дисков, интерфейсы и скорости вращения, которые необходимо учитывать. Диски SATA имеют иной профиль производительности, чем SAS или nearline SAS. Диски со скоростью вращения 7 200 об/мин ведут себя не так, как 10 000 об/мин или 15 000 об/мин. А доступность различных скоростей вращения ограничивается определённой ёмкостью.

  • Физическая компоновка контроллера. Расширители SAS, RAID/SAS контроллеры могут влиять на IOPS, в зависимости от компоновки дисков, скорости переподписки, независимо от того, является ли соединение внутренним для сервера или находится во внешнем корпусе. Большое количество дисков SATA плохо работают на экспансерах и в условиях ошибок диска.

  • На это может повлиять фрагментация, используемая емкость дискового массива.

  • Слышали ли вы когда-нибудь о коротком штрихе ?

  • Программное обеспечение против аппаратного RAID, предварительная выборка, адаптивное профилирование...

Что заставляет вас думать, что емкость может повлиять на производительность в первую очередь на ? Можете ли вы предоставить больше контекста?

Правка:

Если тип диска, форм-фактор, интерфейс и используемая емкость одинаковы, то существенной разницы в IOPS не должно быть. Допустим, вы перешли с 300 ГБ на 600 ГБ корпоративных дисков SAS 10k. При том же количестве шпинделей не должно быть заметной разницы в производительности...

Однако, если на дисковых полках NetApp, о которых вы упоминаете, используются объединительные платы SAS 6 Гбит/с или 12 Гбит/с по сравнению с традиционными 3 Гбит/с, вы можете заметить разницу в пропускной способности при переходе на новое оборудование

.
11
ответ дан 2 December 2019 в 21:29

Одно из мест, где находится прямая зависимость между размером диска и IOPS, находится в Amazon AWS Cloud и других "облачных сервисах". Два типа услуг AWS (Elastic Block Store и Relational Database Service ) обеспечивают более высокую IOPS для дисков больших размеров.

Обратите внимание, что это искусственное ограничение , накладываемое компанией Amazon на свои услуги. Для этого нет никаких аппаратных причин. Тем не менее, я видел devops типов, которые незнакомы с невиртуализированным оборудованием, считая это ограничение подходящим и для настольных систем и тому подобное. Размер диска / IOPS является ограничением облачного маркетинга, а не аппаратным ограничением.

9
ответ дан 2 December 2019 в 21:29

Я должен отметить, что IOPS не является отличным измерением скорости при последовательной записи, но давайте просто согласимся с этим.

Я подозреваю, что время поиска и записи головок дисков довольно стабильно, несмотря на размер дисков. 20 лет назад мы все использовали диски емкостью 60 ГБ с (примерно - конечно, не линейно) одинаковыми скоростями чтения/записи

Я делаю обоснованное предположение, но я не думаю, что плотность диска линейно связана с производительностью диска.

Например, возьмем массив с 10 дисками X 100 ГБ.

Измеряем IOPS для последовательной записи блоков по 256 кБ (или любой метрики IOPS)

Предположим, что результирующая измеренная IOPS равна 1000 IOPS.

OK

Измените массив на массив с 10 дисками X 200 ГБ. Форматировать с одним RAID-массивом Можно ли ожидать, что IOPS останется прежней, увеличится или уменьшится? Наверное, останутся примерно эквивалентными друг другу.

Будет ли изменение примерно линейным?

История вращающихся носителей говорит мне, что, вероятно, нет никакой связи.

Повторите эти вопросы с 10 дисками X 50GB

Снова, примерно эквивалентно.

Ваша скорость, во всех этих случаях, исходит из того, что RAID работает как один диск с десятью головками записи, так что вы можете послать 1/10 часть работы параллельно каждому диску.

Хотя у меня нет жестких цифр, которые можно было бы вам показать, мой прошлый опыт подсказывает мне, что увеличить производительность ваших дисков не так просто, как получить большую емкость.

Несмотря на то, что маркетологи говорят вам, что это инновация, до начала выпуска дешевых(э) твердотельных дисков, за последние 20 лет производительность вращающихся носителей практически не развивалась, предположительно, только так так много можно получить из ржавчины и только так быстро мы можем запустить наши нынешние модели дисковых головок.

4
ответ дан 2 December 2019 в 21:29

Производительность добавляется к шкалам хранения с добавлением каждого шпинделя. Скорость вращения диска является самым большим фактором, поэтому добавление диска со скоростью вращения 10 кОм в минуту даст больше производительности (с точки зрения ввода-вывода в секунду при случайном вводе-выводе или МБ/с при потоковом вводе-выводе), чем диск со скоростью вращения 7,2 кОм в минуту. Размер диска практически не влияет на его производительность.

Говорят, что небольшие диски работают быстрее просто потому, что на один используемый ТБ требуется больше шпинделей. Увеличение размера этих шпинделей не приведет к снижению производительности, но позволит разместить на дисках больше данных, что может привести к увеличению нагрузки

.
3
ответ дан 2 December 2019 в 21:29

Если предположить, что все остальное равно, то характеристики дисков большей емкости не сильно меняются. Диск FC со скоростью вращения шпинделя 10 000 об/мин обладает очень похожими характеристиками независимо от того, 300 ГБ или 3 ТБ. Тарелки вращаются с одинаковой скоростью, а головки ищут с одинаковой скоростью.

Постоянная пропускная способность также - не большая разница. Это корень многих проблем с производительностью, хотя, как и во многих случаях, люди покупают терабайты, они не покупают IOPs или MB/sec.

И восстановление/копирование диска емкостью 3 ТБ займет в 10 раз больше времени, чем копирование диска емкостью 300 ГБ.

В результате нам пришлось столкнуться со значительной избыточной емкостью для проектов по хранению данных - размеры накопителей продолжают расти, но их производительность невелика. Поэтому, по крайней мере, в одном случае мы купили хранилище емкостью около 400 ТБ, чтобы заполнить потребность в 100 ТБ, потому что нам нужны шпиндели.

2
ответ дан 2 December 2019 в 21:29

Если вы вращаете диски (не SSD), то при прочих равных условиях скорость передачи выше, если вы используете внешние дорожки диска. Это произойдет автоматически, если вы используете диск, который заполнен только частично. В то же время, если диск заполнен только частично, ваше среднее движение головы будет меньше, и количество движений головы будет меньше, потому что на одной дорожке больше данных.

Это верно независимо от того, используете ли вы один диск или RAID-диск.

Теперь, если вы сравниваете 100 ГБ и 2000 ГБ диски, вы можете быть уверены, что все остальное не равно . Но если тот же производитель предлагает диски емкостью 500 ГБ, 1 ТБ, 1,5 ТБ и 2 ТБ с одной, двумя, тремя и четырьмя пластинами, то, скорее всего, все остальное будет равно, а 10 x 500 ГБ будет медленнее, чем 10 x 2 ТБ для хранения 4 ТБ данных (никакой разницы не будет, если вы будете хранить только 100 ГБ, потому что 500 ГБ дисков также будут почти пустыми).

Но для RAID-массивов вы будете ограничены не столько скоростью передачи данных, сколько задержкой вращения. Поэтому более высокие обороты будут более важными. И вы часто найдете более высокие обороты в минуту вместе с меньшей емкостью. С другой стороны, если вы используете высокую скорость вращения/низкую емкость, то вы также можете посмотреть на SSD-накопители.

0
ответ дан 2 December 2019 в 21:29

Теги

Похожие вопросы