Масштабирование баз данных с дешевыми жесткими дисками SSD

Я предлагаю переключиться на способность: поскольку Sleeke заявил, что справляется с лучшим разрешением конфликтов, он предлагает ncurses GUI, и в ближайшем будущем это должно получить GTK + GUI.

25
задан 26 June 2011 в 09:49
6 ответов

Если Вы будете иметь действительно, сайт действительно интенсивного трафика, который может извлечь выгоду из SSD для увеличенной производительности записи, то у Вас, вероятно, будет проблема со временем жизни SSD, таким образом, я еще не буду продан на них для этого.

Имея это в виду, что сделать с базами данных, которые имеют высокие уровни чтений? Ответ прост: создайте затор сервер с таким количеством RAM, как можно переварить. Вы найдете, что самые горячие таблицы почти всегда сохраняются в кэше RAM так или иначе, и любой большой хит к диску, вероятно, произойдет из-за большой таблицы или индексирует сканирование, которое может часто оптимизироваться далеко с надлежащей индексацией.

4
ответ дан 28 November 2019 в 20:13
  • 1
    Я пересмотрел бы Ваш комментарий о беспокойстве времени жизни SSD. С точки зрения СВБР SSD имеет намного более высокую оценку, чем жесткий диск. С точки зрения износостойкости цикла записи - ранее проблема, текущее поколение является > 1 миллион циклов записи, делая это надуманным вопросом, особенно в конфигурациях RAID. –  Burly 19 November 2008 в 15:32
  • 2
    (Из символов)... It' s не, что Вы shouldn' t касаться времени жизни SSD, it' s просто, что текущие технические оценки предполагают, что SSD равны или выше дубликата жесткого диска. Факт, что SSD don' t имеют десятилетия опыта в производственных средствах, они бездоказательны. –  Burly 19 November 2008 в 15:33
  • 3
    SSD медленнее при записи, чем HDs –  TravisO 21 December 2008 в 08:29
  • 4
    SSD обычно существенно быстрее, наугад пишет, особенно 4K случайные записи. Они могут быть медленнее для последовательных записей, но that' s не обязательно важный для серверов баз данных. –  ChrisInEdmonton 28 November 2009 в 07:08

Потенциальные проблемы

У меня есть пара точек проблемы с использованием SSD для производственных баз данных в настоящее время

  • Большинство транзакций базы данных на большинство веб-сайтов является чтениями не записи. Как Dave Markle сказал, Вы максимизируете эту производительность с RAM сначала.
  • SSD в новинку для основных и корпоративных рынков, и никакой достойный администратор не собирается переместить производственную базу данных, которая в настоящее время требует 15K об/мин диски U320 в RAID5, связывающемся через fibrechannel с бездоказательной технологией.
  • Стоимость исследования и тестирования перемещения в эту новую технологию, проверки его в их среде, обновление рабочих процессов, и т.д является большей авансовой стоимостью, и с точки зрения времени и с точки зрения денег, чем большинство магазинов должно сэкономить.

Предложенные преимущества

Тем не менее существует много объектов, по крайней мере, на бумаге, в пользу SSD в будущем:

  • Более низкая потребляемая мощность по сравнению с жестким диском
  • Намного более низкое тепловыделение
  • Более высокая производительность на ватт по сравнению с жестким диском
  • Намного более высокая пропускная способность
  • Намного более низкая задержка
  • Актуальнейшее поколение, которое SSD имеют на порядке миллионов циклов износостойкости записи, так износостойкость записи, не является проблемой, как это однажды было. См. несколько датированную статью здесь

Таким образом для данного сравнительного теста производительности при факторинге общей стоимости владения включая прямое питание и косвенные затраты на охлаждение SSD могли стать очень привлекательными. Кроме того, в зависимости от подробных сведений Вашей среды, сокращение количества выбранных устройств для данного уровня производительности могло также привести к сокращению укомплектования персоналом требований, уменьшив затраты на оплату труда.

Стоимость и производительность

Вы добавили, что у Вас есть ограничение стоимости менее чем $50 тысяч, и Вы действительно хотите сохранить его менее чем $10 тысячами. Вы также заявили в комментарии, что можно получить некоторые "дешевые" SSD, уклонившись, что SSD будут более дешевыми, чем DBAs или консультанты. Это может быть верно в зависимости от числа часов, Вам был бы нужен DBA и является ли это повторяющейся стоимостью или нет. Я не могу сделать анализа затрат для Вас.

Однако одной вещью, которой необходимо очень остерегаться, является вид SSD, который Вы получаете. Не все SSD создаются равные. В общем и целом "дешевые" SSD, которые Вы видите в продаже в долларе за $200-400 (2008/11/20), предназначаются для низкой мощности / среды тепла как ноутбуки. Эти диски на самом деле имеют более низкие уровни производительности по сравнению с 10K или 15K об/мин жесткий диск - специально для записей. Диски уровня предприятия, которые имеют уничтожающую производительность, которую Вы говорите о - как серия Mtron Pro - являются довольно дорогими. В настоящее время они вокруг:

  • 400 долларов США для 16 ГБ
  • 900 долларов США для 32 ГБ
  • 1 400 долларов США для 64 ГБ
  • 3 200 долларов США для 128 ГБ

В зависимости от Вашего пространства, производительности и требований дублирования, Вы могли легко унести свой бюджет.

Например, если бы Ваши требования требовали в общей сложности 128 ГБ доступного устройства хранения данных затем, то RAID 0+1/10 или RAID 5 с 1 hotspare составили бы ~ 5 600$

Если бы Вам был нужен ТБ доступного устройства хранения данных однако, то RAID 0+1/10 составил бы ~ $51 тысячу, и RAID 5 с 2 hotspares составит ~ $32 тысячи.

Большое изображение

Тем не менее установка, конфигурация и обслуживание большой производственной базы данных требуют высококвалифицированного человека. Данные в DB и услугах, предоставленных от тех данных, имеют чрезвычайно высокую ценность для компаний с этим уровнем требований к производительности. Кроме того, существует много вещей, которые просто не могут быть решены путем броска аппаратных средств в проблему. Неправильно настроенный DBMS, плохая схема базы данных или стратегия индексации могут/wreck/производительность DB. Только посмотрите на проблемы Stackoverflow, испытанный в их миграции к SQL Server 2008 здесь и здесь. Факт вопроса, база данных является напряженным приложением на не только диск, но и RAM и ЦП также. Балансирование многомерной проблемы производительности наряду с целостностью данных, безопасностью, дублированием и резервным копированием является хитрым битом.

Таким образом, в то время как я действительно думаю любой и все улучшения обоих, которые аппаратная и программная технология приветствуется сообществом, крупномасштабное администрирование баз данных - как разработка программного обеспечения - является тяжелой проблемой и продолжит требовать квалифицированных рабочих. Данное улучшение не может пожинать трудовые затраты сокращения, на которые Вы или компания могли бы надеяться.

Хорошая переходящая точка для некоторого исследования могла бы быть веб-сайтом/блогом Brent Ozar здесь. Вы могли бы распознать его имя - он - тот, который помог stackoverflow команде с их проблемами производительности SQL Server 2008 MS. Его блог и ресурсы он связывается для предложения довольно мало ширины и глубины.

Обновление

Stackoverflow самостоятельно идет потребитель основанный на SSD маршрут для их устройства хранения данных. Читайте об этом здесь: http://blog.serverfault.com/post/our-storage-decision/

Ссылки

20
ответ дан 28 November 2019 в 20:13

Я работал DBA для 5 +, годы и думающий о способах улучшить производительность DB всегда скрываются за моей шахтой. Я наблюдал пространство SSD, и я думаю, что они определенно становятся все большим количеством жизнеспособного варианта.

Проверьте это;

http://i.gizmodo.com/5166798/24-solid-state-drives-open-all-of-microsoft-office-in-5-seconds

Существует также новый продукт, произведенный Acard, названным ANS-9010, который является улучшенной версией GC-Ramdisc, который позволяет, Вы для использования поршня DDR2 для создания Диска SATA (до 64 ГБ), использующих DDR2, придерживаетесь 400MB/s теоретического максимума.

http://techreport.com/articles.x/16255/3

^^, Но другая вещь, это полезно в той статье, - то, что она сравнивает ANS-9010 со всеми плеерами на рынке SSD, и оказывается, что Intel имеет x25-E SSD на 64 ГБ, это в значительной степени сопоставимо с наличием аппаратного электронного диска.

Вещь, которая взволновала бы меня по поводу SSD, изнашивает их со всем напряжением, что большой DB поместил бы их через, и таким образом, необходимо будет использовать набег для зеркального отражения дисков, что означает, что Вы платите вдвое больше;

И оборотная сторона с аппаратным электронным диском - то, что батарея, в случае отключения питания только приводит в действие его так долго, таким образом, необходимо было бы разработать некоторый необычный способ создать резервную копию его. Я полагаю, что можно также купить разъем электросети для них, но затем это все еще полагается UPS.

Я предлагаю, чтобы Вы использовали аппаратный диск поршня для временного DB и файла подкачки окон - и поместили базу данных по Intel X25-E Extreme (приблизительно 600 долларов США для 64 ГБ).

Так или иначе это кричало бы и сделало бы всю остальную часть нас очень ревнивой.

(Также рассмотрите использование другого ANS-9010 для хостинга веб-сайта),

С наилучшими пожеланиями, Dave

1
ответ дан 28 November 2019 в 20:13

Существуют продукты на рынке, такие как Этот, которые делают этот вид вещи. Кроме того, как в другом плакате говорится, добавляя дополнительную RAM к серверу БД, даст Вам лучшие уровни удачного обращения в кэш, которые уменьшат дисковый трафик.

Серверы Opteron с 8 сокетами, такие как Sun X4600 позволят Вам поместить до 256 ГБ RAM в них за цены, которые являются еще более дешевыми, чем многочисленная команда DBA. Вы могли также рассмотреть использование плоских файлов, а не DBMS (как эта компания сделала), который даст Вам лучшую производительность, чем DBMS. В этом случае SAN даст Вам степень целостности данных. Однако необходимо будет разработать стратегию доступа к данным тщательно, чтобы не попадать в беду. По-видимому, довольно много крупных комплектов оборудования доткома делают это. Это значительно более эффективно, чем DBMS, позволяя довольно пешеходным аппаратным средствам обработать большие загрузки, и избегает оплат лицензий DBMS.

0
ответ дан 28 November 2019 в 20:13

Твердотельные диски основаны на флэш-памяти NAND (MLC или SLC). При покупке твердотельных дисков в SATA (2 или 3) форм-фактор Вы ограничиваете производительность, можно выйти из них. Как правило, твердотельные диски на основе быстрой SandForce урожай контроллера SF 1200 220 МБ / вторые чтения и 205 МБ / вторые записи - намного быстрее, чем старомодный диск вращения механического устройства.

Однако, если Вы перемещаетесь в решение PCIe, такое как FusioIO, который не имеет медленного SATA 2 или коннектора SATA 3 включенными, Вы смотрите на решения, которые в 10-50 раз быстрее, чем вращение механических быков (я имею в виду диски).

Таким образом для Вашего "дешевого" решения, пойдите с SATA 2/3 SDD на основе контроллера SF SandForce 1200. Это получит Вас о 3-5 времена по улучшению скорости (на основе опыта реального мира). Если у Вас есть бюджет, то пойдите для FusioIO. Ничто не разобьет его с точки зрения производительности. Это безумно быстро. Ожидайте тратить 20 000$ до 50 000$ все же.

-1
ответ дан 28 November 2019 в 20:13

Мы просто соединяем w2k3 r2 64 бита сервер Sql 2008 на двойной 2.5-дюймовой Seagate Momentus гибридное зеркало XT - 1/4 штрих для ОС и штрих 1/4 для DB. Так использовали 125 ГБ для ОС и 125 ГБ для DB. получали 1500MB/s к 1900MB/s seq чтения. На Intel i7 2600K 3.4Ghz 8GB

1
ответ дан 28 November 2019 в 20:13

Теги

Похожие вопросы