Is it better practice to buy RAID disks individually vs. in bulk?

This may sound like an odd question, but it's generated some spirited discussion with some of my colleagues. Consider a moderately sized RAID array consisting of something like eight or twelve disks. When buying the initial batch of disks, or buying replacements to enlarge the array or refresh the hardware, there are two broad approaches one could take:

  1. Buy all the drives in one order from one vendor, and receive one large box containing all the disks.
  2. Order one disk apiece from a variety of vendors, and/or spread out (over a period of days or weeks) several orders of one disk apiece.

There's some middle ground, obviously, but these are the main opposing mindsets. I've been genuinely curious which approach is more sensible in terms of reducing the risk of catastrophic failure of the array. (Let's define that as "25% of the disks fail within a time window equal to how long it takes to resilver the array once.") The logic being, if all the disks came from the same place, they might all have the same underlying defects waiting to strike. The same timebomb with the same initial countdown on the clock, if you will.

I've collected a couple of the more common pros and cons for each approach, but some of them feel like conjecture and gut instinct instead of hard evidence-based data.

Buy all at once, pros

  • Less time spent in research/ordering phase.
  • Minimizes shipping cost if the vendor charges for it.
  • Disks are pretty much guaranteed to have the same firmware version and the same "quirks" in their operational characteristics (temperature, vibration, etc.)
  • Price increases/stock shortages unlikely stall the project midway.
  • Each next disk is on-hand the moment it's required to be installed.
  • Serial numbers are all known upfront, disks can be installed in the enclosure in order of increasing serial number. Seems overly fussy, but some folks seem to value that. (I guess their management interface sorts the disks by serial number instead of hardware port order...?)

Buy all at once, cons

  • All disks (probably) came from the same factory, made at the same time, of the same materials. They were stored in the same environment, and subject to the same potential abuses during transit. Any defect or damage present in one is likely present in all.
  • If the drives are being replaced one-at-a-time into an existing array and each new disk needs to be resilvered individually, it could be potentially weeks before the last disk from the order is installed and discovered to be faulty. The return/replacement window with the vendor may expire during this time.
  • Can't take advantage of near-future price decreases that may occur during the project.

Buy individually, pros

  • If one disk fails, it shares very little manufacturing/transit history with any of the other disks. If the failure was caused by something in manufacturing or transit, the root cause likely did not occur in any other disk.
  • If a disk is dead on arrival or fails during the first hours of use, that will be detected shortly after the shipment arrives and the return process may go more smoothly.

Buy individually, cons

  • Takes a significant amount of time to find enough vendors with agreeable prices. Order tracking, delivery failure, damaged item returns, and other issues can be time-consuming to resolve.
  • Potentially higher shipping costs.
  • A very real possibility exists that a new disk will be required but none will be on-hand, stalling the project.
  • Imagined benefit. Regardless of the vendor or date purchased, all the disks came from the same place and are really the same. Manufacturing defects would have been detected by quality control and substandard disks would not have been sold. Shipping damage would have to be so egregious (and plainly visible to the naked eye) that damaged drives would be obvious upon unpacking.

If we're going simply by bullet point count, "buy in bulk" wins pretty clearly. But some of the pros are weak, and some of the cons are strong. Many of the bullet points simply state the logical inverse of some of the others. Some of these things may be absurd superstition. But if superstition does a better job at maintaining array integrity, I guess I'd be willing to go along with it.

Which group is most sensible here?

UPDATE: I have data relevant to this discussion. The last array I personally built (about four years ago) had eight disks. I ordered from one single vendor, but split the purchase into two orders of four disks each, about one month apart. One disk of the array failed within the first hours of running. It was from the first batch, and the return window for that order had closed in the time it took to spin everything up.

Four years later, the seven original disks plus one replacement are still running error-free. (knock on wood.)

96
задан 23 August 2017 в 19:28
10 ответов

На практике люди, которые покупают у корпоративных поставщиков (HPE, Dell и т. Д.) , не беспокоятся по этому поводу .

Диски этих поставщиков уже распространены от нескольких производителей под одним и тем же номером детали.

Диск HP с определенным артикулом может быть HGST, Seagate или Western Digital.

Тот же номер детали HP, вариации по производителю, номеру партии и прошивке enter image description here

Не следует пытаться перехитрить / перехитрить вероятность пакетный сбой, однако. Вы можете попробовать, если это дает душевное спокойствие, но, возможно, это не стоит усилий.

Хорошие практики, такие как кластеризация, репликация и надежное резервное копирование, являются реальной защитой от сбоев пакетов. Добавьте горячее и холодное блюдо. Внимательно следите за своими системами. Воспользуйтесь преимуществами умных файловых систем, таких как ZFS :)

И помните, сбои жестких дисков не всегда являются механическими ...

56
ответ дан 28 November 2019 в 19:22

Другой потенциальный недостаток К индивидуальному заказу приводов относится упаковка и транспортировка.

Жесткие диски почти никогда не поставляются в розничной упаковке. Если вы покупаете их по одному, продавец почти наверняка их перепакует. Я обнаружил, что эта переупаковка сильно варьируется. Иногда вы получаете красивую коробку с большим количеством набивок, но в других случаях вы не получаете никакой прокладки вообще.

Коробка меньшего размера также более уязвима для того, чтобы ее бросили носители, без видимых внешних повреждений.

4
ответ дан 28 November 2019 в 19:22

В ответ на ответ от ewwhite, некоторые системные администраторы заказывают пакетами. Сам я бы никогда не стал заказывать диски на индивидуальной основе, но стандартные операции в последнее время, когда я работал в таком объеме, заключались в том, чтобы заказывать диски партиями. Для машины с двенадцатью приводами СОП требовало, чтобы диски были разделены на три партии, давая машине трехуровневый профиль резервирования.

Однако другие небольшие компании, с которыми я консультировался, следовали другим протоколам, некоторые не были связаны с пакетом, а другие разделяли пакеты на два или четыре массива. Краткий ответ: делайте то, что кажется подходящим для уровня обслуживания, которого вам нужно достичь.

Примечание: последнее место, где я работал, определенно было правильным. Машина для хранения приложений решила выйти из строя на всей партии дисков, и мы обнаружили, что у этой конкретной партии была одна и та же ошибка. Если бы мы не следовали пакетному протоколу, мы бы понесли катастрофическую потерю данных.

43
ответ дан 28 November 2019 в 19:22

Я всегда покупаю б / у оптом. Заказы, которые я отслеживаю, почти всегда относятся к одной и той же модели устройства, и их использование, по крайней мере, снижает беспокойство по поводу «плохой партии». В Интернете так много оборудования для распродажи, что мне трудно оправдать покупку новых дисков (или чего-то еще в этом отношении), если только оно не предназначено для критически важного оборудования (а все наше оборудование для резервного копирования все еще ремонтируется!)

+ PRO: Конкурентоспособные онлайн-цены и постоянный поток оборудования из меняющейся бизнес-среды означает, что для получения скидки 50-80% на рабочую среду практически не требуется усилий.

+ PRO: Цена низкая цена высвобождает бюджет для перепродажи и поддерживает солидный запас запасного оборудования.

+ PRO: Отношения с продавцами У меня есть несколько онлайн-продавцов, которым я получаю небольшие скидки от уже значительной скидки на восстановленное / использованное оборудование. Обычно этого не происходит с Monoprice, если вы не покупаете в больших количествах или не имеете с ними SLA. Кроме того, особенно с жесткими дисками, просто убедитесь, что вы протестировали их прямо из коробки. У меня никогда не было проблем с продавцом, который не возмещал или не заменял оборудование DOA (если только это не была афера, которую я не смог поймать).

-CON: Гарантия, проблемы с законностью Гарантия основана на дате изготовления устройства, вам также нужно будет следить за онлайн-торговцами, пытающимися продать вам ребрендинг, клоны и т. Д.

-CON: Testing Необходимо учитывать накладные расходы на тестирование. Тем не менее, вы должны тестировать и новое оборудование, поэтому не уверены, применимо ли это.

-CON: срок службы трудно судить; немного более подвержен сбоям диска.

Примечание: если это клиентская сборка, и они явно не запрашивают обновление / использование, всегда shiny / new!

2
ответ дан 28 November 2019 в 19:22

Можно повысить надежность, используя жесткие диски разных партий и в идеале производителей. Иначе они могут выйти из строя слишком близко по времени. Отличный ответ @Eliodorus объясняет это достаточно.

Конечно, не имеет значения, кто перемешивает диски. Если ваш провайдер подтвердит, что уже делает это за вас, не о чем беспокоиться. Однако кажется неразумным проводить судебную экспертизу, возможно, даже другого провайдера, и делать вывод, что кто-то делает за вас, если вам не сказали напрямую. Провайдеры обычно не ленятся рекламировать различные меры, которые они принимают для повышения надежности своих приводов.

1
ответ дан 28 November 2019 в 19:22

Если вы пытаетесь смягчить сценарий «плохой партии», который означает, что каждый диск в конкретной закупочной партии может / выйдет из строя примерно в одно и то же время, также важно учитывать размер массив и используемый уровень RAID.

Если вы рассматриваете возможность выполнения нескольких заказов, ни один установленный стандарт не применим повсеместно. Люди, рекомендующие 2–4 уровня закупки, должны спросить себя, будет ли массив оставаться в сети в случае отказа всего одного уровня дисков? Поэтому для уровней RAID с избыточностью, таких как 1/5/10/50, вам придется покупать диски по одному. Для RAID6 вы можете приобрести 2 за раз.

Я бы порекомендовал, независимо от того, как вы приобретаете диски, для которых регулярно выполняете резервное копирование, и приобретать адекватные горячие / холодные резервы для вашего размера массива и типа RAID.

2
ответ дан 28 November 2019 в 19:22

Собственно, это зависит от Избыточного массива недорогих дисков (Raid) уровня. В Raid два, три, четыре, пять и шесть действительно помогает наличие дисков из нескольких разных партий, но это не имеет решающего значения: один уже по своей сути теряет надежность и производительность при использовании этих уровней.

Теперь для обычно здравомыслящих людей. выбор, использование Raid 1 (зеркальное отображение) или 1 + 0 (чередование зеркал), действительно полезно иметь разные диски с разных сторон каждого зеркала (каждый массив Raid 1), чтобы зеркало не выходило из строя во время выздоровление. Кроме того, должны быть «горячие» резервы, чтобы минимизировать окно восстановления.

Для получения дополнительной информации посетите насмешливый, но информативный веб-сайт Battle Against Any Raid 'F'2 (Baarf), созданный престижным Сеть дубовых столов старших администраторов баз данных. Википедия также хорошо резюмирует проблему.

1
ответ дан 28 November 2019 в 19:22

Пару лет назад мне пришлось рассмотреть эту проблему для клиента. У меня есть сочетание практического опыта и исследований, подтверждающих рекомендацию по использованию нескольких источников.

Если отбросить ваши плюсы и минусы на данный момент, а также отличный ответ ewwhite , благоразумие подсказывает, что если вы покупаете приводы сами, вы их из нескольких источников. Беглый взгляд на обсуждение слабых мест RAID в Википедии указывает на две интересные ссылки.

Первая ссылка - это документ ACM RAID: высокопроизводительное, надежное вторичное хранилище (Chen, Lee, Gibson, Katz and Patterson. ACM Computing Surveys. 26: 145-185). В разделе 3.4.4 авторы указывают, что сбои оборудования не всегда являются статистически независимыми событиями, и объясняют, почему. На момент написания этого ответа статья доступна в Интернете; стр. 19-22 обсуждают надежность ( http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.41.3889 ).

Вторая ссылка - Отказы дисков в реальном мире: что для вас означает наработка на отказ в 1 000 000 часов? (Шредер, Гибсон. 5-я конференция USENIX по файловым технологиям и технологиям хранения). Авторы представляют статистические данные, подтверждающие утверждение о том, что отказы дисков могут быть кластеризованными. вовремя со скоростью выше, чем прогнозировалось для независимых событий. На момент написания этого ответа этот документ также доступен в Интернете ( https://www.usenix.org/legacy/events/fast07/tech/schroeder/schroeder_html/index.html ).

Dell прямо рекомендовала не использовать RAID 5 еще в 2012 году из-за коррелированных сбоев дисков в больших дисковых средах; Прогнозируется, что RAID 6 станет ненадежным по тем же причинам примерно в 2019 году (статья ZDNet под названием «Почему-raid-6-перестает работать-в-2019»: http://www.zdnet.com/article/why- raid-6-stop-working-in-2019 / ). Хотя ключевым элементом обоих из них является размер диска и время восстановления,диски меньшего размера и мультисорсинг были рекомендованы в качестве решения проблемы RAID 5.

Так что да, используйте несколько источников для дисков, если можете; если вы покупаете у корпоративного поставщика, как описано в ewwhite answer , это может происходить для вас прозрачно. Однако ... мой клиент купил 16 дисков емкостью 2 ТБ у корпоративного поставщика. Просто они были от одного производителя и производились в одно и то же время. Два диска вышли из строя в течение двух недель после настройки массивов RAID01. Так что проверьте диски, когда получите их. (Вы ведь все равно их проверяете?)

9
ответ дан 28 November 2019 в 19:22

Честный ответ от человека, который потратил много времени на то, чтобы иметь дело с умирающими массивами рейдов и сложными дисками: не делайте все свои диски из одной партии, если вы можете этого избежать.

Мои опыт применим только к вращающимся дискам, у твердотельных накопителей есть свои проблемы и преимущества, которые следует учитывать при массовом заказе.

Точно лучший способ решения проблем в основном зависит от того, насколько велик массив, с которым вы работаете, если вы работаете с что-то вроде 6 дисковых массивов с резервированием 2 дисков, вы, вероятно, можете безопасно купить аналогичные диски у 3 производителей и разделить массив таким образом.

Если вы используете нечетный диск или работаете с массивами, которые нелегко разделенные таким образом, вы можете попробовать другие подходы, например, купить один и тот же диск у разных поставщиков, или, если вы покупаете оптом, вы можете просмотреть и попытаться разделить диски на основе вероятности того, что они будут произведены вместе.

запуск достаточно небольшого массива с правильной базовой технологией, это может Не стоит даже потратить время на его постепенное создание из разнородных дисковых ресурсов. Начните с минимального количества приводов, которое вам может сойти с рук, и купите следующий запас через месяц или два или при заполнении системы. Это также позволяет вам почувствовать любые проблемы, которые могут возникнуть с конкретными моделями, которые вы выбрали.

Причина этого совета - комбинация двух причуд дисков.

  1. Среднее время безотказной работы заметно снижается, когда у вас много дисков с аналогичным происхождением. В статистике мы бы назвали это систематической ошибкой выборки, поскольку из-за схожести ваших выборок эффекты усреднения будут менее полезными. Если есть неисправность в партии или даже в самой конструкции, а это происходит чаще, чем вы думаете, то диски из этой партии выйдут из строя раньше, чем можно было бы предположить.

    Если диски разнесены, вы можете получить [50%, 90%, 120%, 200%] MTBF, но если все диски поступают из этой 50% партии, у вас на руках беспорядок.

  2. Повторная сборка массива Raid уничтожает диски. Нет, правда. Если произойдет сбой диска и массив будет перестроен, он создаст дополнительную нагрузку на другие диски, пока сканирует данные с них. Если ваш диск находится на грани отказа, восстановление может вывести его из строя, или у него уже может быть место сбоя, о котором вы просто не знали, потому что этот раздел недавно не читался.

    Если у вас есть При большом количестве дисков из одной партии вероятность возникновения такого каскадного сбоя намного выше, чем вероятность, если они разные. Вы можете смягчить это, проводя регулярное патрульное сканирование, очистку, повторное обновление, независимо от того, что рекомендуется делать для типа массива, который вы используете,но обратная сторона этого заключается в том, что это повлияет на производительность и может занять несколько часов.

Для некоторого контекста того, насколько сильно меняется долговечность дисков, Backblaze составляет регулярный отчет о сбоях дисков ... Я не связан с компания в любом случае, но они должны знать, о чем они говорят по поводу надежности привода. Пример: https://www.backblaze.com/blog/hard-drive-failure-rates-q1-2017/ ... ваш набор образцов, вероятно, будет меньше, поэтому удаленные данные могут испортиться на собственном опыте, это все еще хороший справочник.

38
ответ дан 28 November 2019 в 19:22

എനിക്കറിയാവുന്നിടത്തോളം ഫാക്ടറിയിലെ ഡിസ്ക് സംഭരണത്തിന്റെ ഗുണനിലവാരം വളരെ ഉയർന്നതാണ്, കൂടാതെ നിർമ്മാണ കാരണങ്ങളാൽ വലിയ തോതിൽ ഹാർഡ്‌വെയർ തകരാറുണ്ടാകുമെന്ന് ഞാൻ വ്യക്തിപരമായി ഭയപ്പെടില്ല.

കൂടാതെ ഞാൻ അല്പം ഭ്രാന്തനാണെങ്കിൽ, ഒരേ വെണ്ടർ വഴി ഫാക്ടറികൾ പങ്കിടരുതെന്ന് എനിക്കറിയാവുന്ന രണ്ട് വ്യത്യസ്ത നിർമാണശാലകളിൽ നിന്ന് ഞാൻ സ്റ്റോറേജ് വാങ്ങും.

സംഭരണം വളരെ വിലകുറഞ്ഞതാണ്, ഒരു കമ്പനിയെ മൊത്തത്തിൽ വാങ്ങരുതെന്ന് അർത്ഥമില്ല, കൂടാതെ നിങ്ങൾ കമ്പനിക്കുള്ളിൽ കുറച്ച് വർഷങ്ങൾക്ക് ശേഷം സ്റ്റോറേജ് എഴുതിത്തള്ളും, അതിനാൽ നിക്ഷേപം അത്ര മികച്ചതല്ല. വ്യക്തിഗത വെണ്ടർമാരിൽ നിന്ന് വാങ്ങാൻ എടുക്കുന്ന സമയം ചിലവഴിച്ചതിനാലാണ് കൂടുതൽ ചിലവാകുന്നത്.

ബൾക്ക് ഡിസ്ക് പരാജയപ്പെടുമെന്ന് നിങ്ങൾ ഇപ്പോഴും ഭയപ്പെടുന്നുവെങ്കിൽ, നിങ്ങൾക്ക് ആവശ്യമുള്ളതിനേക്കാൾ കൂടുതൽ വാങ്ങുക. 5 മുതൽ 7 വരെ സ്പെയർ വാങ്ങുന്നതിനേക്കാൾ 12 ഡിസ്കുകൾ വേണമെന്ന് നിങ്ങൾക്കറിയാമെങ്കിൽ. അത് ഒരു ടെറാബൈറ്റിന് 48 മുതൽ 5 മുതൽ 7 വരെ ഡോളർ മാത്രമായിരിക്കും, മാത്രമല്ല ഞങ്ങളുടെ സിസ്റ്റം അസ്ഥിരമോ സുരക്ഷിതമല്ലാത്തതോ ആക്കാതെ വിലകുറഞ്ഞതായി തുടരാം, കാരണം ബൾക്ക് അല്ലെങ്കിൽ സെക്കൻഡ് ഹാൻഡ് ഡിസ്കുകളിൽ കിഴിവ് ഉണ്ടെങ്കിൽ (എന്തുകൊണ്ട് സുരക്ഷിതമാണ്). ഞങ്ങൾ‌ റെസിൽ‌വർ‌ / അറേ വീണ്ടും സമാരംഭിക്കുന്നതിനെക്കുറിച്ച് സംസാരിക്കുന്നതിനേക്കാൾ‌, ഇപ്പോൾ‌ നിങ്ങളുടെ സംഭരണ ​​പരിഹാരം എത്ര വലുതാണെന്ന് അറിയാൻ‌ എനിക്ക് തീർച്ചയായും ഒരു മാർ‌ഗ്ഗവുമില്ല, പക്ഷേ നിങ്ങൾ‌ ഈ ജോലിക്കായി ആഴ്ചകൾ‌ ചിലവഴിക്കുകയാണെങ്കിൽ‌, ഈ ശബ്‌ദം മുതൽ‌ ഓർ‌ഗനൈസേഷണൽ‌ സ്റ്റോറേജ് പുന f ക്രമീകരിക്കുന്നതിന് ഞാൻ‌ പരിഗണിക്കും. (എന്നോട്) മറ്റെന്തിനെക്കാളും ഒരു വിധത്തിൽ അല്ലെങ്കിൽ മറ്റൊന്നിനേക്കാൾ ഒരു മിസ്-കോൺഫിഗറേഷനായി.

ഞങ്ങൾ ശരിക്കും ഭ്രാന്തനാകുകയാണെങ്കിൽ, നിങ്ങളുടെ ഓർഗനൈസേഷൻ ഒരു സംഭരണത്തോട് എത്രത്തോളം സെൻസിറ്റീവ് ആണ് എന്നതിനെ അടിസ്ഥാനമാക്കി നിങ്ങൾ പ്രവർത്തിപ്പിക്കുന്ന സംഭരണ ​​പരിഹാരത്തിന്റെ 2 മടങ്ങ് നേടുക. ബ്രേക്ക്ഡ down ൺ ഇത് വിലകുറഞ്ഞതായിരിക്കാം, ഇത് ഭാഗ്യ 500 കമ്പനികൾക്കുള്ള ഒരു ഓപ്ഷൻ മാത്രമല്ല.

കൂടാതെ ഇവിടെയും ഇപ്പോളും ഞങ്ങൾക്ക് ആവശ്യമില്ലാത്ത ഡാറ്റ ഓഫ് ലോഡുചെയ്യുന്നതിനെക്കുറിച്ചും സംസാരിക്കാം, (ക്രമരഹിതമായ ഉദാഹരണം) ചരിത്രപരമായ സാമ്പത്തിക ഡാറ്റയുടെ “ക്ല cloud ഡ് "ഞങ്ങൾ ആദ്യം എൻ‌ക്രിപ്റ്റ് ചെയ്യുന്ന വെണ്ടർമാർ. ഇത് ഞങ്ങളുടെ സ്വന്തം സംഭരണത്തിൽ നിന്ന് സംഭരണ ​​ആവശ്യങ്ങൾ നീക്കംചെയ്യും, അത് സാമ്പത്തികമായും പ്രവർത്തനപരമായും ഞങ്ങളെ സ്വതന്ത്രമാക്കും.

നിങ്ങൾ ആരാണെന്നും നിങ്ങൾ എവിടെയാണെന്നും നിങ്ങൾ ചെയ്യുന്നതെന്താണെന്നും അടിസ്ഥാനമാക്കി നിങ്ങൾക്ക് മികച്ച പ്രവർത്തനത്തിനുള്ള വ്യത്യസ്ത പരിഹാരങ്ങൾ ആയിരിക്കും.

-1
ответ дан 28 November 2019 в 19:22

Теги

Похожие вопросы