Все машины работают под управлением CentOS 6.5. У нас около 85 клиентских машин, выполняющих монтирование Kerberized NFSv4 (sec = krb5p) на сервер. В эти выходные сервер был изменен (serverA заменен на serverB).
Кажется, все работает, кроме , только на одном нескольких клиентских серверах только , и только для одного нескольких специальных пользователей, похоже, что idmapd перестает работать примерно через 30–45 минут.
Простой тест: на рассматриваемой клиентской машине я делаю что-то вроде этого:
while [ 1 ]; do touch test.`date +%H%M%S`.txt ; sleep 1m ; done
А затем наблюдайте за созданием файлов. Они начинают с правильного идентификатора пользователя и группы. Но примерно через 35 минут они внезапно переключаются на nfsnobody: nfsnobody.
Процесс idmapd все еще работает. Другие пользователи и другие машины не пострадали. (Конечно, мы не тестировали всех пользователей и все машины, но выборочное тестирование других пользователей и других машин не выявило проблем.)
Редактировать: Забыл опубликовать некоторые важные детали:
Edit2: При дальнейшем просмотре мы наблюдали следующее:
Рискуя сглазить самому, выяснилось, что перезагрузка сервера NFSv4 исправила проблему. Прошло около трёх часов с момента перезагрузки, и пока никаких проблем не возникло. Раньше мы никогда не проходили больше часа без того, чтобы хотя бы одна учетная запись не попала в плохое "состояние", описанное выше.
Я не могу это объяснить, кроме как догадаться, что на сервере оставался некоторый "мусор", который не смывался при перезагрузке rpc.idmapd-сервера с правильной конфигурацией.
.