У меня есть этот сценарий:
srv01 srv02 srv03
существует gluster объем "vol1" работающий srv03, и все серверы могут использовать для i/o. vol1 содержит много смешанных изображений стороны, в пределах от немногих kbs к 3-4Mb, общая сумма составляет приблизительно 1.5 ТБ.
Версия Gluster 3.6.2
Это не серебряная пуля, нуждаются в некоторой настройке, но работах вполне прилично.
Теперь я должен копировать кирпич srv03 в другие серверы.
Проблема состоит в том, что сигнальные ракеты CPU srv03 к 100% и не могут служить нормальным запросам. Сетевой трафик является низким.
Опции:
cluster.data-self-heal-algorithm: полный
cluster.self-heal-daemon: прочь
performance.cache-размер: 1 ГБ
Я должен поддерживать сервис в рабочем состоянии, в то время как репликация работает, Ваши предложения приветствуются
Я как-то работаю над аналогичной ситуацией . Если вашим узким местом является ЦП, я думаю, что уменьшение cluster.background-self-heal-count
должно помочь (по умолчанию - 16).
Другими словами, «когда ваш клиент пытается открыть 17 файлов, он зависнет 17-го числа, ожидая самовосстановления» ( https://botbot.me/freenode/gluster/msg/45681458/ ).