У меня есть сервер Solaris 5.10 (я думаю, что он считается Solaris 10) - назовем его «Билл» - которым я владею, но поставщик поддерживает установленное дополнительное программное обеспечение. Они должны вручную остановить службы и убедиться, что данные сброшены в его локальную базу данных перед перезагрузкой. Иначе я бы его перезагрузил.
"Билл" делает резервные копии на сервер NFS под управлением Ubuntu 16 LTS. Другие серверы Unix (5.) 9 на сайте также делают резервные копии на этом сервере.
На «Билле» я получаю пять ошибок с интервалом в минуту: «Не удалось выполнить соединение NFS для сервера 10.0.2.18: ошибка 5 (RPC : Timed out) "когда я пытаюсь смонтировать общий ресурс. После пятого я получаю «nfs mount: mount: / nfsmnt: Connection timed out». Я не полагаюсь на DNS, чтобы найти сервер NFS, 10.0.2.18. showmount -e 10.0.2.18
правильно сообщает об экспорте NFS.
export list for 10.0.2.18:
/data 10.0.0.0/16
Я могу изменить свойства экспорта, перезапустить службы NFS на сервере, и «Билл» увидит изменения.
«Билл» может смонтировать другие общие ресурсы NFS внутри и за пределами той же подсети. Другие клиенты в одной и той же подсети и без нее могут без проблем смонтировать общий ресурс / data на сервере NFS.
rpcinfo -p 10.0.2.18
сообщает о поддержке NFS v4 с tcp / udp. Однако я не хочу использовать udp.
program vers proto port service
100000 4 tcp 111 rpcbind
100000 3 tcp 111 rpcbind
100000 2 tcp 111 rpcbind
100000 4 udp 111 rpcbind
100000 3 udp 111 rpcbind
100000 2 udp 111 rpcbind
100005 1 udp 52533 mountd
100005 1 tcp 33303 mountd
100005 2 udp 52711 mountd
100005 2 tcp 60660 mountd
100005 3 udp 34912 mountd
100005 3 tcp 50746 mountd
100003 2 tcp 2049 nfs
100003 3 tcp 2049 nfs
100003 4 tcp 2049 nfs
100227 2 tcp 2049 nfs_acl
100227 3 tcp 2049 nfs_acl
100003 2 udp 2049 nfs
100003 3 udp 2049 nfs
100003 4 udp 2049 nfs
100227 2 udp 2049 nfs_acl
100227 3 udp 2049 nfs_acl
100021 1 udp 53804 nlockmgr
100021 3 udp 53804 nlockmgr
100021 4 udp 53804 nlockmgr
100021 1 tcp 44612 nlockmgr
100021 3 tcp 44612 nlockmgr
100021 4 tcp 44612 nlockmgr
Кажется, что клиент NFS работает. Сегодняшняя дата отображается, потому что я остановил и перезапустил клиент NFS с помощью svcadm
.
# svcs -xv nfs/client
svc:/network/nfs/client:default (NFS client)
State: online since Sun Dec 11 18:45:40 2016
See: man -M /usr/share/man -s 1M mount_nfs
See: /var/svc/log/network-nfs-client:default.log
Impact: None
Файл журнала, упомянутый в строке «См.» Отчеты
# tail /var/svc/log/network-nfs-client:default.log
[ Nov 17 17:13:47 Stopping because service disabled. ]
[ Nov 17 17:13:47 Executing stop method ("/lib/svc/method/nfs-client stop") ]
[ Nov 17 17:13:48 Method "stop" exited with status 0 ]
[ Nov 17 17:15:29 Executing start method ("/lib/svc/method/nfs-client start") ]
[ Nov 17 17:15:29 Method "start" exited with status 0 ]
[ Dec 11 18:45:39 Stopping because service restarting. ]
[ Dec 11 18:45:39 Executing stop method ("/lib/svc/method/nfs-client stop") ]
[ Dec 11 18:45:39 Method "stop" exited with status 0 ]
[ Dec 11 18:45:39 Executing start method ("/lib/svc/method/nfs-client start") ]
[ Dec 11 18:45:40 Method "start" exited with status 0 ]
Я выключил сервер NFS в понедельник 12/5 для установки памяти. Той ночью, 6 декабря, в 2 часа ночи была последняя удачная резервная копия. Таймауты начались после этого, когда следующее запланированное резервное копирование, 12/7 2am, попыталось запустить.
df -kh
и ls
против точки монтирования, превышающей время ожидания до моего umount /nfsmnt[11104487 visible.
Эта проблема с таймаутом произошла пару месяцев назад, и перезагрузка исправлена поведение. Сервер работал 24 дня, первые 20 из которых были выполнены успешно. Без изменений брандмауэра.
Кажется, проблема указывает на ваш сервер NFS. И, возможно, это связано с перебоями в установке памяти на NFS-сервере.
Также, возможно, вы захотите проверить, что время на серверах синхронизировано.
.