This may sound like an odd question, but it's generated some spirited discussion with some of my colleagues. Consider a moderately sized RAID array consisting of something like eight or twelve disks. When buying the initial batch of disks, or buying replacements to enlarge the array or refresh the hardware, there are two broad approaches one could take:
There's some middle ground, obviously, but these are the main opposing mindsets. I've been genuinely curious which approach is more sensible in terms of reducing the risk of catastrophic failure of the array. (Let's define that as "25% of the disks fail within a time window equal to how long it takes to resilver the array once.") The logic being, if all the disks came from the same place, they might all have the same underlying defects waiting to strike. The same timebomb with the same initial countdown on the clock, if you will.
I've collected a couple of the more common pros and cons for each approach, but some of them feel like conjecture and gut instinct instead of hard evidence-based data.
If we're going simply by bullet point count, "buy in bulk" wins pretty clearly. But some of the pros are weak, and some of the cons are strong. Many of the bullet points simply state the logical inverse of some of the others. Some of these things may be absurd superstition. But if superstition does a better job at maintaining array integrity, I guess I'd be willing to go along with it.
Which group is most sensible here?
UPDATE: I have data relevant to this discussion. The last array I personally built (about four years ago) had eight disks. I ordered from one single vendor, but split the purchase into two orders of four disks each, about one month apart. One disk of the array failed within the first hours of running. It was from the first batch, and the return window for that order had closed in the time it took to spin everything up.
Four years later, the seven original disks plus one replacement are still running error-free. (knock on wood.)
На практике люди, которые покупают у корпоративных поставщиков (HPE, Dell и т. Д.) , не беспокоятся по этому поводу .
Диски этих поставщиков уже распространены от нескольких производителей под одним и тем же номером детали.
Диск HP с определенным артикулом может быть HGST, Seagate или Western Digital.
Тот же номер детали HP, вариации по производителю, номеру партии и прошивке
Не следует пытаться перехитрить / перехитрить вероятность пакетный сбой, однако. Вы можете попробовать, если это дает душевное спокойствие, но, возможно, это не стоит усилий.
Хорошие практики, такие как кластеризация, репликация и надежное резервное копирование, являются реальной защитой от сбоев пакетов. Добавьте горячее и холодное блюдо. Внимательно следите за своими системами. Воспользуйтесь преимуществами умных файловых систем, таких как ZFS :)
И помните, сбои жестких дисков не всегда являются механическими ...
Другой потенциальный недостаток К индивидуальному заказу приводов относится упаковка и транспортировка.
Жесткие диски почти никогда не поставляются в розничной упаковке. Если вы покупаете их по одному, продавец почти наверняка их перепакует. Я обнаружил, что эта переупаковка сильно варьируется. Иногда вы получаете красивую коробку с большим количеством набивок, но в других случаях вы не получаете никакой прокладки вообще.
Коробка меньшего размера также более уязвима для того, чтобы ее бросили носители, без видимых внешних повреждений.
В ответ на ответ от ewwhite, некоторые системные администраторы заказывают пакетами. Сам я бы никогда не стал заказывать диски на индивидуальной основе, но стандартные операции в последнее время, когда я работал в таком объеме, заключались в том, чтобы заказывать диски партиями. Для машины с двенадцатью приводами СОП требовало, чтобы диски были разделены на три партии, давая машине трехуровневый профиль резервирования.
Однако другие небольшие компании, с которыми я консультировался, следовали другим протоколам, некоторые не были связаны с пакетом, а другие разделяли пакеты на два или четыре массива. Краткий ответ: делайте то, что кажется подходящим для уровня обслуживания, которого вам нужно достичь.
Примечание: последнее место, где я работал, определенно было правильным. Машина для хранения приложений решила выйти из строя на всей партии дисков, и мы обнаружили, что у этой конкретной партии была одна и та же ошибка. Если бы мы не следовали пакетному протоколу, мы бы понесли катастрофическую потерю данных.
Я всегда покупаю б / у оптом. Заказы, которые я отслеживаю, почти всегда относятся к одной и той же модели устройства, и их использование, по крайней мере, снижает беспокойство по поводу «плохой партии». В Интернете так много оборудования для распродажи, что мне трудно оправдать покупку новых дисков (или чего-то еще в этом отношении), если только оно не предназначено для критически важного оборудования (а все наше оборудование для резервного копирования все еще ремонтируется!)
+ PRO: Конкурентоспособные онлайн-цены и постоянный поток оборудования из меняющейся бизнес-среды означает, что для получения скидки 50-80% на рабочую среду практически не требуется усилий.
+ PRO: Цена низкая цена высвобождает бюджет для перепродажи и поддерживает солидный запас запасного оборудования.
+ PRO: Отношения с продавцами У меня есть несколько онлайн-продавцов, которым я получаю небольшие скидки от уже значительной скидки на восстановленное / использованное оборудование. Обычно этого не происходит с Monoprice, если вы не покупаете в больших количествах или не имеете с ними SLA. Кроме того, особенно с жесткими дисками, просто убедитесь, что вы протестировали их прямо из коробки. У меня никогда не было проблем с продавцом, который не возмещал или не заменял оборудование DOA (если только это не была афера, которую я не смог поймать).
-CON: Гарантия, проблемы с законностью Гарантия основана на дате изготовления устройства, вам также нужно будет следить за онлайн-торговцами, пытающимися продать вам ребрендинг, клоны и т. Д.
-CON: Testing Необходимо учитывать накладные расходы на тестирование. Тем не менее, вы должны тестировать и новое оборудование, поэтому не уверены, применимо ли это.
-CON: срок службы трудно судить; немного более подвержен сбоям диска.
Примечание: если это клиентская сборка, и они явно не запрашивают обновление / использование, всегда shiny / new!
Можно повысить надежность, используя жесткие диски разных партий и в идеале производителей. Иначе они могут выйти из строя слишком близко по времени. Отличный ответ @Eliodorus объясняет это достаточно.
Конечно, не имеет значения, кто перемешивает диски. Если ваш провайдер подтвердит, что уже делает это за вас, не о чем беспокоиться. Однако кажется неразумным проводить судебную экспертизу, возможно, даже другого провайдера, и делать вывод, что кто-то делает за вас, если вам не сказали напрямую. Провайдеры обычно не ленятся рекламировать различные меры, которые они принимают для повышения надежности своих приводов.
Если вы пытаетесь смягчить сценарий «плохой партии», который означает, что каждый диск в конкретной закупочной партии может / выйдет из строя примерно в одно и то же время, также важно учитывать размер массив и используемый уровень RAID.
Если вы рассматриваете возможность выполнения нескольких заказов, ни один установленный стандарт не применим повсеместно. Люди, рекомендующие 2–4 уровня закупки, должны спросить себя, будет ли массив оставаться в сети в случае отказа всего одного уровня дисков? Поэтому для уровней RAID с избыточностью, таких как 1/5/10/50, вам придется покупать диски по одному. Для RAID6 вы можете приобрести 2 за раз.
Я бы порекомендовал, независимо от того, как вы приобретаете диски, для которых регулярно выполняете резервное копирование, и приобретать адекватные горячие / холодные резервы для вашего размера массива и типа RAID.
Собственно, это зависит от Избыточного массива недорогих дисков (Raid) уровня. В Raid два, три, четыре, пять и шесть действительно помогает наличие дисков из нескольких разных партий, но это не имеет решающего значения: один уже по своей сути теряет надежность и производительность при использовании этих уровней.
Теперь для обычно здравомыслящих людей. выбор, использование Raid 1 (зеркальное отображение) или 1 + 0 (чередование зеркал), действительно полезно иметь разные диски с разных сторон каждого зеркала (каждый массив Raid 1), чтобы зеркало не выходило из строя во время выздоровление. Кроме того, должны быть «горячие» резервы, чтобы минимизировать окно восстановления.
Для получения дополнительной информации посетите насмешливый, но информативный веб-сайт Battle Against Any Raid 'F'2 (Baarf), созданный престижным Сеть дубовых столов старших администраторов баз данных. Википедия также хорошо резюмирует проблему.
Пару лет назад мне пришлось рассмотреть эту проблему для клиента. У меня есть сочетание практического опыта и исследований, подтверждающих рекомендацию по использованию нескольких источников.
Если отбросить ваши плюсы и минусы на данный момент, а также отличный ответ ewwhite , благоразумие подсказывает, что если вы покупаете приводы сами, вы их из нескольких источников. Беглый взгляд на обсуждение слабых мест RAID в Википедии указывает на две интересные ссылки.
Первая ссылка - это документ ACM RAID: высокопроизводительное, надежное вторичное хранилище (Chen, Lee, Gibson, Katz and Patterson. ACM Computing Surveys. 26: 145-185). В разделе 3.4.4 авторы указывают, что сбои оборудования не всегда являются статистически независимыми событиями, и объясняют, почему. На момент написания этого ответа статья доступна в Интернете; стр. 19-22 обсуждают надежность ( http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.41.3889 ).
Вторая ссылка - Отказы дисков в реальном мире: что для вас означает наработка на отказ в 1 000 000 часов? (Шредер, Гибсон. 5-я конференция USENIX по файловым технологиям и технологиям хранения). Авторы представляют статистические данные, подтверждающие утверждение о том, что отказы дисков могут быть кластеризованными. вовремя со скоростью выше, чем прогнозировалось для независимых событий. На момент написания этого ответа этот документ также доступен в Интернете ( https://www.usenix.org/legacy/events/fast07/tech/schroeder/schroeder_html/index.html ).
Dell прямо рекомендовала не использовать RAID 5 еще в 2012 году из-за коррелированных сбоев дисков в больших дисковых средах; Прогнозируется, что RAID 6 станет ненадежным по тем же причинам примерно в 2019 году (статья ZDNet под названием «Почему-raid-6-перестает работать-в-2019»: http://www.zdnet.com/article/why- raid-6-stop-working-in-2019 / ). Хотя ключевым элементом обоих из них является размер диска и время восстановления,диски меньшего размера и мультисорсинг были рекомендованы в качестве решения проблемы RAID 5.
Так что да, используйте несколько источников для дисков, если можете; если вы покупаете у корпоративного поставщика, как описано в ewwhite answer , это может происходить для вас прозрачно. Однако ... мой клиент купил 16 дисков емкостью 2 ТБ у корпоративного поставщика. Просто они были от одного производителя и производились в одно и то же время. Два диска вышли из строя в течение двух недель после настройки массивов RAID01. Так что проверьте диски, когда получите их. (Вы ведь все равно их проверяете?)
Честный ответ от человека, который потратил много времени на то, чтобы иметь дело с умирающими массивами рейдов и сложными дисками: не делайте все свои диски из одной партии, если вы можете этого избежать.
Мои опыт применим только к вращающимся дискам, у твердотельных накопителей есть свои проблемы и преимущества, которые следует учитывать при массовом заказе.
Точно лучший способ решения проблем в основном зависит от того, насколько велик массив, с которым вы работаете, если вы работаете с что-то вроде 6 дисковых массивов с резервированием 2 дисков, вы, вероятно, можете безопасно купить аналогичные диски у 3 производителей и разделить массив таким образом.
Если вы используете нечетный диск или работаете с массивами, которые нелегко разделенные таким образом, вы можете попробовать другие подходы, например, купить один и тот же диск у разных поставщиков, или, если вы покупаете оптом, вы можете просмотреть и попытаться разделить диски на основе вероятности того, что они будут произведены вместе.
запуск достаточно небольшого массива с правильной базовой технологией, это может Не стоит даже потратить время на его постепенное создание из разнородных дисковых ресурсов. Начните с минимального количества приводов, которое вам может сойти с рук, и купите следующий запас через месяц или два или при заполнении системы. Это также позволяет вам почувствовать любые проблемы, которые могут возникнуть с конкретными моделями, которые вы выбрали.
Причина этого совета - комбинация двух причуд дисков.
Среднее время безотказной работы заметно снижается, когда у вас много дисков с аналогичным происхождением. В статистике мы бы назвали это систематической ошибкой выборки, поскольку из-за схожести ваших выборок эффекты усреднения будут менее полезными. Если есть неисправность в партии или даже в самой конструкции, а это происходит чаще, чем вы думаете, то диски из этой партии выйдут из строя раньше, чем можно было бы предположить.
Если диски разнесены, вы можете получить [50%, 90%, 120%, 200%] MTBF, но если все диски поступают из этой 50% партии, у вас на руках беспорядок.
Повторная сборка массива Raid уничтожает диски. Нет, правда. Если произойдет сбой диска и массив будет перестроен, он создаст дополнительную нагрузку на другие диски, пока сканирует данные с них. Если ваш диск находится на грани отказа, восстановление может вывести его из строя, или у него уже может быть место сбоя, о котором вы просто не знали, потому что этот раздел недавно не читался.
Если у вас есть При большом количестве дисков из одной партии вероятность возникновения такого каскадного сбоя намного выше, чем вероятность, если они разные. Вы можете смягчить это, проводя регулярное патрульное сканирование, очистку, повторное обновление, независимо от того, что рекомендуется делать для типа массива, который вы используете,но обратная сторона этого заключается в том, что это повлияет на производительность и может занять несколько часов.
Для некоторого контекста того, насколько сильно меняется долговечность дисков, Backblaze составляет регулярный отчет о сбоях дисков ... Я не связан с компания в любом случае, но они должны знать, о чем они говорят по поводу надежности привода. Пример: https://www.backblaze.com/blog/hard-drive-failure-rates-q1-2017/ ... ваш набор образцов, вероятно, будет меньше, поэтому удаленные данные могут испортиться на собственном опыте, это все еще хороший справочник.
എനിക്കറിയാവുന്നിടത്തോളം ഫാക്ടറിയിലെ ഡിസ്ക് സംഭരണത്തിന്റെ ഗുണനിലവാരം വളരെ ഉയർന്നതാണ്, കൂടാതെ നിർമ്മാണ കാരണങ്ങളാൽ വലിയ തോതിൽ ഹാർഡ്വെയർ തകരാറുണ്ടാകുമെന്ന് ഞാൻ വ്യക്തിപരമായി ഭയപ്പെടില്ല.
കൂടാതെ ഞാൻ അല്പം ഭ്രാന്തനാണെങ്കിൽ, ഒരേ വെണ്ടർ വഴി ഫാക്ടറികൾ പങ്കിടരുതെന്ന് എനിക്കറിയാവുന്ന രണ്ട് വ്യത്യസ്ത നിർമാണശാലകളിൽ നിന്ന് ഞാൻ സ്റ്റോറേജ് വാങ്ങും.
സംഭരണം വളരെ വിലകുറഞ്ഞതാണ്, ഒരു കമ്പനിയെ മൊത്തത്തിൽ വാങ്ങരുതെന്ന് അർത്ഥമില്ല, കൂടാതെ നിങ്ങൾ കമ്പനിക്കുള്ളിൽ കുറച്ച് വർഷങ്ങൾക്ക് ശേഷം സ്റ്റോറേജ് എഴുതിത്തള്ളും, അതിനാൽ നിക്ഷേപം അത്ര മികച്ചതല്ല. വ്യക്തിഗത വെണ്ടർമാരിൽ നിന്ന് വാങ്ങാൻ എടുക്കുന്ന സമയം ചിലവഴിച്ചതിനാലാണ് കൂടുതൽ ചിലവാകുന്നത്.
ബൾക്ക് ഡിസ്ക് പരാജയപ്പെടുമെന്ന് നിങ്ങൾ ഇപ്പോഴും ഭയപ്പെടുന്നുവെങ്കിൽ, നിങ്ങൾക്ക് ആവശ്യമുള്ളതിനേക്കാൾ കൂടുതൽ വാങ്ങുക. 5 മുതൽ 7 വരെ സ്പെയർ വാങ്ങുന്നതിനേക്കാൾ 12 ഡിസ്കുകൾ വേണമെന്ന് നിങ്ങൾക്കറിയാമെങ്കിൽ. അത് ഒരു ടെറാബൈറ്റിന് 48 മുതൽ 5 മുതൽ 7 വരെ ഡോളർ മാത്രമായിരിക്കും, മാത്രമല്ല ഞങ്ങളുടെ സിസ്റ്റം അസ്ഥിരമോ സുരക്ഷിതമല്ലാത്തതോ ആക്കാതെ വിലകുറഞ്ഞതായി തുടരാം, കാരണം ബൾക്ക് അല്ലെങ്കിൽ സെക്കൻഡ് ഹാൻഡ് ഡിസ്കുകളിൽ കിഴിവ് ഉണ്ടെങ്കിൽ (എന്തുകൊണ്ട് സുരക്ഷിതമാണ്). ഞങ്ങൾ റെസിൽവർ / അറേ വീണ്ടും സമാരംഭിക്കുന്നതിനെക്കുറിച്ച് സംസാരിക്കുന്നതിനേക്കാൾ, ഇപ്പോൾ നിങ്ങളുടെ സംഭരണ പരിഹാരം എത്ര വലുതാണെന്ന് അറിയാൻ എനിക്ക് തീർച്ചയായും ഒരു മാർഗ്ഗവുമില്ല, പക്ഷേ നിങ്ങൾ ഈ ജോലിക്കായി ആഴ്ചകൾ ചിലവഴിക്കുകയാണെങ്കിൽ, ഈ ശബ്ദം മുതൽ ഓർഗനൈസേഷണൽ സ്റ്റോറേജ് പുന f ക്രമീകരിക്കുന്നതിന് ഞാൻ പരിഗണിക്കും. (എന്നോട്) മറ്റെന്തിനെക്കാളും ഒരു വിധത്തിൽ അല്ലെങ്കിൽ മറ്റൊന്നിനേക്കാൾ ഒരു മിസ്-കോൺഫിഗറേഷനായി.
ഞങ്ങൾ ശരിക്കും ഭ്രാന്തനാകുകയാണെങ്കിൽ, നിങ്ങളുടെ ഓർഗനൈസേഷൻ ഒരു സംഭരണത്തോട് എത്രത്തോളം സെൻസിറ്റീവ് ആണ് എന്നതിനെ അടിസ്ഥാനമാക്കി നിങ്ങൾ പ്രവർത്തിപ്പിക്കുന്ന സംഭരണ പരിഹാരത്തിന്റെ 2 മടങ്ങ് നേടുക. ബ്രേക്ക്ഡ down ൺ ഇത് വിലകുറഞ്ഞതായിരിക്കാം, ഇത് ഭാഗ്യ 500 കമ്പനികൾക്കുള്ള ഒരു ഓപ്ഷൻ മാത്രമല്ല.
കൂടാതെ ഇവിടെയും ഇപ്പോളും ഞങ്ങൾക്ക് ആവശ്യമില്ലാത്ത ഡാറ്റ ഓഫ് ലോഡുചെയ്യുന്നതിനെക്കുറിച്ചും സംസാരിക്കാം, (ക്രമരഹിതമായ ഉദാഹരണം) ചരിത്രപരമായ സാമ്പത്തിക ഡാറ്റയുടെ “ക്ല cloud ഡ് "ഞങ്ങൾ ആദ്യം എൻക്രിപ്റ്റ് ചെയ്യുന്ന വെണ്ടർമാർ. ഇത് ഞങ്ങളുടെ സ്വന്തം സംഭരണത്തിൽ നിന്ന് സംഭരണ ആവശ്യങ്ങൾ നീക്കംചെയ്യും, അത് സാമ്പത്തികമായും പ്രവർത്തനപരമായും ഞങ്ങളെ സ്വതന്ത്രമാക്കും.
നിങ്ങൾ ആരാണെന്നും നിങ്ങൾ എവിടെയാണെന്നും നിങ്ങൾ ചെയ്യുന്നതെന്താണെന്നും അടിസ്ഥാനമാക്കി നിങ്ങൾക്ക് മികച്ച പ്രവർത്തനത്തിനുള്ള വ്യത്യസ്ത പരിഹാരങ്ങൾ ആയിരിക്കും.