Я не действительно все, что знакомый, но этот блог здесь походит на хорошую рецензию.
http://blogs.oracle.com/bonwick/entry/raid_z
Теперь... блоггер высказывает мнение, Вы делаете компромисс и, вероятно, скоростью по сравнению со способностью. Теперь, он сравнивает RAIDZ с RAID5, но Вы сравниваете его 1+0, который дает Вам N/2 для способности. Я предположил бы, что RAID-Z получает лучшее выполнение восстановления, чем RAID5, но все еще не превзойдет RAID10 по характеристикам. Так как у Вас есть SSD, которые должны быть чертовски быстрыми... Я пошел бы для RAIDZ, но, несомненно, ознакомился бы со сценариями, в которых он ухудшается или восстанавливающий перед введением в эксплуатацию.
Это классический вариант использования с горизонтальным масштабированием, и IMO GlusterFS должен соответствовать всем требованиям. Вы можете попробовать - просто установите несколько виртуальных машин, настройте несколько блоков, которые будут использоваться для хранилища репозитория, и запустите стресс-тест.
DRBD в любом случае не подходит - он не масштабируется. Во всяком случае, я бы посмотрел на другие проекты хранения объектов (например, Swift), если Gluster не работает достаточно хорошо, но ни один из них не ориентирован на высокую производительность
У меня была аналогичная установка для почтовых серверов cyrus, в которой gluster не оказался чтобы выдерживать нагрузку во время стресс-тестов. изначально мы выбрали gluster, потому что это было просто, но пришлось вернуться к drbd. однако, как подчеркнуто dyasny, drbd activs / active cfg не рекомендуется (не говоря уже о боли). если вам нужно, чтобы все серверы одновременно монтировали общее хранилище, drbd не подходит. Еще одна вещь, на которую вы можете захотеть взглянуть, - это clvmd с диспетчером блокировок. lvm2 теперь поддерживает raid type lv и для этой цели используется код man. это в сочетании с соответствующей файловой системой (при необходимости, с некоторыми кластерными системами) может быть вариантом. однако я сам никогда не тестировал его на производстве, только как PoC.
Если вы рассматриваете Gluster (который, по моему опыту, можно использовать со многими небольшими файлами, кроме YMMV), вы можете также взглянуть на Ceph http: // ceph. com /
Проблема, с которой вы столкнетесь с Gluster, в основном заключается в задержке между узлами. Я бы посоветовал вам попробовать и посмотреть, справится ли он с вашей рабочей нагрузкой. Если ваши серверы достаточно мощные и имеют быстрое соединение, вы должны получить довольно хорошую производительность. Также вы можете попробовать встроенный NFS-сервер, который, исходя из моего опыта, обрабатывает небольшие файлы немного быстрее.
Но если вам нужно как можно быстрее ваше решение, GlusterFS, вероятно, не для вас. Другими вариантами могут быть коммерческие продукты, такие как Git Clustering (хотя это не тестировалось), или вы можете создать свое собственное решение с бесплатными инструментами, такими как gitmirror .
Я бы также порекомендовал Glustet ad, самый простой и самый быстрый в установке и настройке. Также он очень хорошо масштабируется. Проблема в скорости, и мой 2c ia в том, что вам нужно выбирать между простой конфигурацией и легким масштабированием, а также между некоторыми техническими трудностями (некоторые причудливые блочные хранилища drbd / ocfs2 / Glances) с увеличением скорости. Но .. сколько скорости вы набираете? Йой должен пройти стресс-тест и выбрать ...