Высокая частота отказов больших дисков?

SEO Blackhat

  • http://contempt.me/ - Полностью толчок, возможно недопустимый. Спам блога, кольца спама, и т.п.. Но интересный взгляд в администрирование сотен или тысяч крошечных сайтов.

Масштабирование

  • http://highscalability.com/ - Часто о коде, но так же, как часто о масштабирующихся серверах и системе настраивает для оптимизации. Как эта статья и оптимизирующий даже балансировку загрузки ЦП

Безопасность

  • http://gentoo-portage.com/GLSA - Поскольку я выполняю хинду. Список безопасности любых основных продуктов, которые Вы используете, является стандартным, я думаю
  • http://xorl.wordpress.com/ - Он читает патчи для дыр в системе безопасности и шоу, где ошибка. Это - код, но часто в ядре или главных пакетах
  • http://www.darknet.org.uk/ - Часто имеет сообщения об инструментах, включая судебную экспертизу, SCADA, и т.п.
  • http://digg.com/security - Часто пух или несколько дней позади, но это медленно, таким образом, легко всунуть и забыть
  • http://ha.ckers.org/blog/ - Больше конфигурации вводит сообщения, но также и переговоры о крупномасштабном внедрении исправлений безопасности и методов
  • http://www.net-security.org/ - Я нахожу, что это почти общий пух и рынки больше при поиске CIOs модных словечек, но время от времени некоторый сигнал проходит
  • http://www.net-security.org/insecuremag.php - Потрясающий журнал, который выходит каждые несколько месяцев
  • http://jeremiahgrossman.blogspot.com/ - Он запускает веб-приложение компания Брандмауэра, таким образом, его сообщения часто фокусируются вокруг который, числа, касающиеся промышленности и общей безопасности в Интернете
  • http://www.schneier.com/blog/ - Оплот
  • http://www.secguru.com/ - Что-то как reddit для безопасности. Это часто получает хорошие статьи, но часть из затем является пухом
  • http://www.windowsecurity.com/ - Имеет хорошие учебные руководства и объяснения установки вещей как Аутентификация домена и Kerberos в Windows.
  • http://seclists.org/#bugtraq - Я контролирую это для чего-либо интересного или приложений, которые я запускаю. Часто получает первые отчеты
  • http://seclists.org/#dailydave - Очень высокий сигнал к списку коэффициента шума, выполненному Dave Aitel
  • http://seclists.org/#pen-test - Низко предупредите к шуму, но я просматриваю его так или иначе
  • http://seclists.org/#basics - Низко предупредите к шуму, но я просматриваю его так или иначе. Я могу на самом деле ответить на некоторые из них!
  • http://seclists.org/#webappsec - Низко предупредите к шуму, но я просматриваю его так или иначе

24
задан 9 June 2009 в 12:44
13 ответов

Вы, вероятно, получили дефектную партию. Я озабочен развертыванием массивов, созданных из дисков от того же пакета по этой причине - у них, вероятно, будет подобная продолжительность жизни, которая делает получение замен потенциально очень увлекательным, когда каждый перестал работать.

Не невозможно, что существует некоторый дефект дизайна с дисками, это определенно произошло прежде; однако обычно Интернет полон жалоб на диск, если существует действительно что-то не так с ним, в противоположность обычному фоновому шуму, который Вы найдете о чем-либо.

19
ответ дан 28 November 2019 в 20:14
  • 1
    +1 Попытка или растянуть Ваши покупки, источник от различных продавцов или соединения выпускается под брендом для облегчения этого. –  Rob Allen 9 June 2009 в 15:56

Это - трудный вопрос ответить, если у Вас нет ресурсов крупной организации. Посмотрите исследование Google отказов жесткого диска.

При выполнении значительной покупки дисков я определю грубый размер диска с самой низкой ценой на байт, который обычно является одним поколением, более старым, чем последнее. Это имеет смысл, что они будут улучшенный что надежность поколения.

13
ответ дан 28 November 2019 в 20:14
  • 1
    1.5 к 2 ТБ новейшее прямо сейчас, таким образом, wouldn' t 1 ТБ соответствуют Вашим критериям? They' довольно дешевое ре. –  Mark Ransom 9 June 2009 в 16:57
  • 2
    Очень положительная сторона. –  Knox 9 June 2009 в 18:11

Я верю более высокому, чем нормальная интенсивность отказов показательна из какой-либо новой технологии. Мне всегда никогда не не говорили купить первый модельный год автомобиля, ожидать, пока они не разрабатывают ошибки. Я сказал бы, что то же самое, вероятно, сохраняется для многих других вещей, включая жесткие диски.

3
ответ дан 28 November 2019 в 20:14
  • 1
    Я могу засвидетельствовать целую автомобильную аналогию (автомобильные аналогии никогда не теряются, не так ли?). Я признаю, что спешил и didn' t исследуют его вообще правильно, и I' m оплата цены теперь! –  Mark Henderson♦ 10 June 2009 в 00:20

Я не уверен, что справедливости ради стоит отметить, 'большие' диски имеют более высокое СВБР или нет. У меня есть известная система с горсткой дисков на 750 ГБ и в прошлых 2 + годы, которые ни один не привел к сбою (750, был "большой" 2 года назад). Но я также знаю известную систему, которая была сборкой, когда 250 ГБ были большими, и тот массив имеет, упал несколько раз. Дебаты СВБР являются чем-то вроде священной войны.

Первоочередной задачей с 'большими' дисками является восстановить время, когда отказ происходит. Чем больше диск, тем дольше восстанавливание, большее окно для дополнительного сбоя диска и возможных потерь массива. С "большими" дисками бизнес-возможность доступности должна определить уровень приемлемого риска (потеря массива), который будет управлять Вашим выбором уровня RAID и количеством дисков (Больше дисков = больше возможностей сбоя диска).

Бизнес-SATA / RAID пришел путь в прошлом небольшом количестве лет. Я не думаю, что знаменитости предложили бы его, если бы они знали, что это будет главная проблема поддержки, или источник клиента подвел. Мне было бы любопытно знать Ваше продвижение надежности теперь, когда Вы заменили часть исходного пакета.

3
ответ дан 28 November 2019 в 20:14

Они все находятся на том же компьютере или дисковом контроллере? Вы действительно говорили, что необходимо было восстановить массив. Если это верно, затем возможно, что-то является дефектным с контроллером, источником питания или памятью. Если не я также предположил бы дефектный пакет дисков. Кроме того, могла бы быть проблема совместимости с любыми конкретными дисками, которые Вы используете с тем конкретным контроллером.

Кроме того, интересно, когда люди говорят, что большие диски имеют более высокое СВБР, как это вычисляется. Позволяет говорят, что у Вас есть диски на 1x500 ГБ и на 2x250 ГБ. Возможно, это наивно, но не было бы диск, который содержит дважды, как имеют больше данных, это могло перестать работать с? Я предполагаю, что не знаю, включает ли СВБР кого-либо неправильно читавшего, или неверно напишите, или если это означает, что диск становится механически поврежденным. Кто-либо знает, существует ли строгий промышленный стандарт и определение СВБР для жестких дисков?

1
ответ дан 28 November 2019 в 20:14

Вот несколько вещей, которые я проверил бы: 1) достаточно близки порядковые номера на дисках? Раз так у Вас мог бы быть дефектный пакет 2), Как среда то, что Ваш сервер живет в? У Вас были проблемы с другими аппаратными средствами, переставшими работать недавно? 3) Диски, оказывается, диски Барракуды Seagate? Существуют проблемы с теми дисками. См. эту computerworld статью о нем. 4) Эти диски стали частью системы? или Вы покупали их сами? При покупке дисков OEM нет никакого способа гарантировать, что диски были обработаны с осторожностью перед покупкой их.

У меня лично была невероятная удача с жесткими дисками. У меня только было два сбоя дисков на мне. Только один из тех отказов был на диске, который я на самом деле использовал. Однако все вокруг меня я видел, что много людей теряет данные по жестким дискам.

1
ответ дан 28 November 2019 в 20:14
  • 1
    Хм, да они все очень близки, но они были WD' s, не Seagate и да они были дисками OEM... несколько вещей i hadn' t рассмотренный там... –  Mark Henderson♦ 10 June 2009 в 00:18

Большая частота отказов больших дисков могла просто быть функцией размера дисков. Диск с пятьюдесятью миллионами секторов имеет десять раз шанс наличия поврежденного сектора, чем диск с пятью миллионами секторов. Я предполагаю, что интенсивность отказов среди больших дисков и маленьких дисков является тем же здесь, которое является, вероятно, не хорошим предположением - поскольку кто-то еще сказал, то, что диски терабайта являются все еще относительно новыми, у них, вероятно, есть большая частота отказов для начала.

В Вашем случае это просто походит на дефектную партию дисков.

1
ответ дан 28 November 2019 в 20:14

При покупке всех дисков одновременно у того же места, возможно, что они все происходят из единственного сомнительного пакета.

При соединении RAID-массива я обычно рекомендую смешаться, управляет немногим, т.е. соединением производителей или по крайней мере управляет от различных поставщиков (для снижения риска всех дисков, являющихся от одной дефектной партии).

Другая рекомендация, которую я предоставил бы, состоит в том, чтобы использовать диски меньшего размера, если возможный (т.е. у Вас есть физическое пространство для дисков и портов контроллера для зависания их прочь), таким образом, вместо объема RAID 1 или двух дисков на 1 ТБ имеют RAID 10 четырех единиц на 500 ГБ. Таким образом, когда диск разлагается, Вы только восстанавливаете меньший массив, который является частью большего массива вместо того, чтобы восстановить целый массив (уменьшающий отрезок времени, в течение которого массив не завершен), и это также предлагает немного больше дублирования (в четырех из шести из "двух сбоев дисков сразу" сценарии 4 диска, массив RAID10 будет жить). Можно сделать то же с расчесыванием меньших массивов R5 в массив R50 слишком, если поддерживается RAID-контроллером / программное обеспечение.

Возможно, я чрезмерно параноик, но я опасался бы доверять 1 ТБ данных к одному единственному диску, даже если тот диск является частью избыточного массива.

Очевидно, существуют физические ограничения в действии, которые могут сделать технику непрактичной Вам, передаваемая мощность ограничивает также, таким образом, YMMV. Как, "например", когда массив или массивы не практичны: у меня было бы четыре диска как R10 в одном из наших серверов здесь вместо более крупных дисков в массиве R1, но он физически не имеет пространство, покупание/создавание внешнего массива было вне бюджета, и мы не могли использовать пространство на существующем массиве, поскольку данные должны были быть сохранены физически отдельными от всех других данных из-за требований защиты данных.

1
ответ дан 28 November 2019 в 20:14

Всегда используйте полные жесткие диски меньшего размера для производственного использования. Никогда не проверял физику позади него, но меньшие диски просто имеют тенденцию ломаться менее часто. Это - то, что все всегда говорили мне.

1
ответ дан 28 November 2019 в 20:14

Вы создавали массив с дисками все от того же пакета, и все поставлялись от того же поставщика? Мне сказали, что это - плохая вещь сделать...

0
ответ дан 28 November 2019 в 20:14

Больше дисков + больше голов равняется более высокому шансу отказа.

Возьмите два общих жестких диска WD

640 ГБ = два диска
1 ТБ = три диска

    WD Black 640GB vs 1TB comparison

Drive Ready Time 11 sec  13
R/W Power watts  8.3     8.4
Idle Power watts 7.7     7.8
Standby watts    1       1
Max shock        300g    250g
Performance seek 29      33
Quiet seek       26      29

Тот дополнительный диск = больше шума, больше энергопотребления, больше тепла, медленнее управляет готовым временем, более восприимчивым для испытания на удар повреждения и большего количества вибрации.

Если бы они сделали тот же дизайн диска только с одним диском, то он имел бы еще лучшие спецификации. В этом случае это диски на уровне конечного пользователя, но они - высококачественные диски на уровне конечного пользователя с дважды кэшем и 5-летней гарантией. Вы будете видеть подобную математику при близком осмотре документации относительно какого-либо бренда или стиля традиционного жесткого диска (вращающий диски). Это - просто вопрос физики, что больше дисков делает диск менее надежным.

Jeff Hengesbach был также прав, когда он сказал

Первоочередной задачей с 'большими' дисками является восстановить время, когда отказ происходит. Чем больше диск, тем дольше восстанавливание, большее окно для дополнительного сбоя диска и возможных потерь массива. С "большими" дисками бизнес-возможность доступности должна определить уровень приемлемого риска (потеря массива), который будет управлять Вашим выбором уровня RAID и количеством дисков (Больше дисков = больше возможностей сбоя диска).

добавьте в некоторой малой дозе Graeme Perrow

Диск с пятьюдесятью миллионами секторов имеет десять раз шанс наличия поврежденного сектора, чем диск с пятью миллионами секторов. Я предполагаю, что интенсивность отказов среди больших дисков и маленьких дисков является тем же здесь, которое является, вероятно, не хорошим предположением

Больше дисков = плохо
Больше пространства памяти является ассортиментом. За и против на этом являются многочисленными.
Больше секторов действительно является большим шансом для ошибок. Не обязательно линейный по своим масштабам, но определенно фактор.

Если Вы не должны расположить больше с интервалами, чем надежность, я предложил бы придерживаться единственного диска или двойных дисков диска. Это берет исследование и в некоторых случаях удачу для знания то, что Вы получите при упорядочивании дисков, поскольку некоторые производители не только стараются не публиковать количество дисков, они могут на самом деле продать больше чем один диск под тем же номером детали.

Возьмите, например, WD3200AAKS существует единственная версия диска 320 ГБ и двойная версия (160GB x 2) диска 320 ГБ. К тому же существует несколько маркировок и управляют корпусами, используемыми, таким образом, Вы не можете легко посмотреть на диск и знать, который диск внутри. Единственный способ знать состоит в том, чтобы искать онлайн, чтобы знать, что WD3200AAKS-00B3A0 и WD3200AAKS-75VYA0 говорят Вам, который является единственным диском, но никакой ритейлер не скажет Вам, которых Вы получите.

10
ответ дан 28 November 2019 в 20:14
  • 1
    Ничего себе. That' s некоторый всесторонний материал!Спасибо! Я hadn' t даже рассмотрел количество подвижных частей (диски) до настоящего времени. –  Mark Henderson♦ 9 October 2009 в 03:50

Рассмотрите RAID-6. Шанс трудной ошибки чтения во время реконструкции RAID-5 это очень реальный. Или RAID-Z с ZFS.

0
ответ дан 28 November 2019 в 20:14

Кто-то сделал очень детальное изучение на этой проблеме с более крупными дисками. Это имеет отношение к коэффициенту битовых ошибок, остающемуся постоянным даже при том, что размер диска увеличился плюс более длительное время, которое требуется для восстановления более крупных дисков. Эти два объединяются для помещения 2-го отказа во время восстанавливания очень в область действительности. Я пошел бы с 500 ГБ или диски меньшего размера на RAID-массивах.

1
ответ дан 28 November 2019 в 20:14

Теги

Похожие вопросы