Как скорость диска измеряется и что быстро? Сколько времени должен копия взятия на 1 500 ГБ?

Независимый, из которого домена Вы выбираете - имеют в виду для последствия с ним. Индексация от поисковых систем затронута Вашим выбором.

т.е. Google: http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=44231

11
задан 26 November 2010 в 21:08
3 ответа

Скорости диска обычно измеряются в;

  • Скорость вращения в оборотах в минуту (самый низкий на уровне 4200 об/мин, затем 5400, 7200, 10k и 15k - это не применимо к SSD или флэш-памяти).
  • Интерфейсная скорость является самой быстрой, дисковая электроника может попытаться отправить данные на дисковый контроллер (они колеблются от 100 Мбит/с ATA до 150/300/600 Мбит/с SATA, 2/4/8/16 Гбит/с Fibre Channel и даже к скоростям PCIe для основанного на флэш-памяти устройства хранения данных, таким как FusionIO).
  • Время поиска является просто временем, которое требуется, чтобы начать читать или писать конкретный сектор диска - они могут расположиться от 3-15ms для дисков к небольшой части этого для дисков SSD/флэш-памяти.
  • Затем мы добираемся до действительной скорости, которую можно ожидать, существует четыре скорости, о которых необходимо заботиться; последовательное чтение (читающий очень большой блок данных), последовательная запись (то же, но пишущий), случайное чтение (получение данных со всех концов диска) и случайная запись. Они варьируются чрезвычайно, но для вращающих дисков можно ожидать что-либо от 25MBps-to-150MBps для последовательного чтения и записать и что-либо из 3MBps-to-50Mps для случайного чтения и записи. SSD обычно находятся в диапазоне на 200 Мбит/с для последовательного и обычно немного меньше для случайных операций. FusionIO могут легко поразить 1 Гбит/с для всех, но являются обычно небольшими и дорогими.

Поскольку Вы видите, что нет никакого реального среднего числа, если Вы хотели бы рекомендации на том, что купить, не стесняйтесь возвращаться нам с такой информацией, как Вы можете - это должно включать бюджет, тип приложения, размер набора данных, базу пользователей, аппаратные средства/ОС плюс что-либо еще, которое Вы думаете, были бы полезны.

Что касается Вашей копии на 1.5 ТБ, хорошо при выполнении этого к USB 2-приложенный диск SATA на 7200 об/мин, необходимо добраться, по крайней мере, 30MBps-40MBps или таким образом, полные 1.5 ТБ могли принять 10 часов или около этого. Если бы это было типичной профессиональной системой DAS/SAN, то я ожидал бы в регионе 100 Мбит/с, означающих, что потребовалось бы приблизительно 3 часа.

Надежда, которой это помогает, о, и просто для уточнения, MB=megabytes, Мбит, является мегабитами.

19
ответ дан 2 December 2019 в 21:43

Существуют многие, много переменных, вовлеченных в эти виды вычислений. Дисковые системы реального мира имеют много взаимозависимостей. Только в одиночном компьютере:

  • Фактическая номинальная скорость самого диска (обычно RPMs, 5200, 7200, 10K, 15K)
  • Используемая файловая система
  • Используется ли система RAID
    • Если это, производительность платы RAID
    • Тип RAID
  • Используемая Операционная система
  • Операции чтения и Операции записи имеют совершенно другие рабочие характеристики
  • Отношение чтения-записи для операций
  • Для последовательных операций, фактора фрагментации устройства хранения данных

Как Вы видите, скорость самого диска является всего лишь одним из многих факторов. Это - великоватый фактор, но тем не менее один из многих. Если та копия на 1.5 ТБ будет всем на том же диске, то диск будет (95%, вероятно) выполняют 100%-е случайное выполнение чтения-записи, которое обычно поворачивается в худших метриках производительности. Если копия от одного диска до другого, и данные на 100% последовательны, и целевой диск абсолютно пуст, это должно повернуться в самой быстрой производительности, возможной с этой дисковой подсистемой. Производительность реального мира будет где-нибудь между этими двумя экстремальными значениями.

Если Вы копируете между двумя отдельными серверами существует еще больше включенных факторов.

У меня есть массив хранения данных на работе, которая может насыщать (гигабитные) каналы SAS на 3 ГБ при выполнении в основном последовательных операций. Если бы у меня был SAS на 6 ГБ, то это могло бы, вероятно, добраться очень близко к насыщению их также. Для случайного ввода-вывода эта конкретная система работает очень по-другому на основе того, что ОС (OpenSolaris, например, имел худший случайный ввод-вывод и Linux XFS лучшее фактором 3).

Существует только слишком много переменных, чтобы ответить, что это подвергает сомнению окончательно.

8
ответ дан 2 December 2019 в 21:43

То, сколько времени 1.5 ТБ данных берут для копирования, зависит очень от типа данных. Если у Вас будут некоторые 1 500 файлов на 1 ГБ, то, вероятно, только потребуется несколько часов, но если у Вас будет полтора миллиарда файлов 1 КБ, то, вероятно, потребуются дни.

Это из-за двух спорящих спецификаций на дисках: пропускная способность и среднее время доступа. Традиционный диск с 100MB/sec пропускной способностью и время доступа на 10 мс довольно распространен. Если можно передать данные потоком последовательно, можно получить 100MB/sec. Однако, если необходимо перейти к другому месту, требуется 10 мс. Если бы Вы передавали потоком, то Вы, возможно, записали 1 МБ данных во время, которое требуется для перехода к другому местоположению.

Создание файла может взять, несколько ищут, так создание файла 1 КБ может "стоить" столько же сколько потоковая передача нескольких МБ данных.

Так, в некоторых случаях лучше сделать копию неструктурированного диска блочного устройства, чем копирование в файловой системе через что-то как rsync. Если Вы имеете много файлов, в файловой системе то есть, говорите, 50% или более полный, Вы часто более обеспечены просто копирование полного блочного устройства через "dd" до времени, которое требуется. Конечно, Вы не можете сделать этого, в то время как файловая система смонтирована, таким образом, это имеет недостатки также.

SSD могут помочь смягчить это, потому что их времена доступа приблизительно в 100 раз более быстры, но твердотельные диски MLC усложнили проблемы доступа в зависимости от доступности пула предварительно стертых блоков. SLC SSD может помочь этому.

RAID-контроллеры со встроенным кэшем могут помочь с исканием, как может что-то как flashcache модуль ядра, который позволяет Вам кэшировать блочное устройство через SSD.

Системы RAID могут допускать, несколько находят что-либо подобное, ищет, эффективно уменьшая среднее время доступа и также распараллеливание для увеличения пропускной способности. Но Ваша общая производительность будет часто зависеть от того, сколько файлов включено.

3
ответ дан 2 December 2019 в 21:43

Теги

Похожие вопросы