Не решение Вашей проблемы, но Joel Spolsky испытало эту проблему...
Пять whys: http://www.joelonsoftware.com/items/2008/01/22.html
Требования и ограничения:
Неизвестные, которые помогли бы:
Если 50:50 отношение представлено путем чтения и записи целых файлов и довольно больших файлов в этом, то схемы доступа более последовательны, чем случайный, что касается файловой системы. Используйте основанную на степени файловую систему для увеличения sequentiality в файловой системе для лучшей производительности. Так как файлы являются настолько большими, читают вперед, обеспечит значительные повышения производительности, если поддерживается аппаратными средствами (некоторые RAID-контроллеры обеспечивают это).
Это изменяется, если Вы - планирование выполнения операций чтения-записи одновременно, при которой точке это действительно становится значительно случайным. То же применяется, если Вы держите большое количество открытых файлов и читаете/пишете небольшие части в тех файлах, как будто это была база данных.
Одно из самых больших неправильных представлений, с которыми я сталкиваюсь, является идеей, что дефрагментируемая файловая система работает лучше, чем фрагментированная при обработке очень случайного ввода-вывода. Это только верно в файловых системах, где операции метаданных страдают значительно во фрагментированной файловой системе. Для очень высоких уровней фрагментации основанные на степени файловые системы могут на самом деле перенести больше снижения производительности, чем другие стили управления блоком.
Тем не менее эта проблема только становится очевидной, когда схемы доступа ввода-вывода и уровень продвигают диски к своим максимальным возможностям. С 14 ТБ в файловой системе, которая означает между 7 и 50 шпинделями в массиве настоящего хранения, который приводит к обширному диапазону возможностей; в пределах от 630 операций в секунду ввода-вывода для 7x 2 ТБ 7.2K об/мин управляет к 9 000 операций в секунду ввода-вывода для 50x 300 ГБ 15K диски об/мин. 7.2K RAID-массив об/мин поразит насыщенность ввода-вывода намного быстрее, чем 15K RAID-массив об/мин был бы.
Если Ваш операционный уровень ввода-вывода не продвигает Ваши ограничения по объему памяти, выбор файловой системы должен базироваться больше на полной гибкости управления, чем тонкая настройка последних нескольких процентных пунктов производительности.
Однако, если Ваш ввод-вывод на самом деле работает, Ваше устройство хранения данных утончаются, именно тогда тонкая настройка начинает становиться необходимой.
XFS:
-l logdev=/dev/sdc3
EXT4:
-E stride
набор к количеству блоков (или 512b или 4K в зависимости от диска) на дорожке отдельного диска в RAID. -E stripe-width
набор как 'swidth' в XFS-O journal_dev /dev/sdc3/
Я думаю, что настоящей проблемой здесь не является просто файловая система, но и параметры, устанавливающие Вас использование с файловой системой. Одна вещь, которая могла бы влиять, вероятно, читается вперед размер.
Но, хорошо позвольте нам просто говорить об имени. Помимо XFS, я думаю, что ext4 удовлетворит Вашей потребности. Нижняя строка, я думаю, что Вам нужна основанная на степени файловая система для предотвращения фрагментации как можно больше. И XFS и ext4 поддерживают отложенную запись IIRC, таким образом, оба могли бы помочь Вам увеличить шанс сделать слияние записи также.
с уважением,
Mulyadi.
Учитывая масштаб данных Вы имеете, я думаю, что Вы хотите посмотреть на сетевую кластерную файловую систему, как Блеск или собственный GPFS IBM. Они разработаны для предоставления высокоэффективных результатов при требовании рабочих нагрузок как Ваши.