Я переключил свое резервное копирование полностью на rsnapshot (perlscript, это использует rsync и hardlinks, это может скопировать удаленные хосты),
Каждую ночь копии rsync просто более новые файлы и - благодаря hardlinks - каждый backupfolder представляют полные данные.
rsnapshot супер быстр, и восстановление так легко - дают ему попытку!
Если у Вас есть установленный strace (конфетка устанавливают strace), может Вы находить команду, которая является медленной (Вы упомянули su в своем сообщении), и выполните его под strace-cf:
# strace -F -c su - gonzo -c exit
...
Process 3583 detached
Process 3562 resumed
Process 3563 detached
% time seconds usecs/call calls errors syscall
------ ----------- ----------- --------- --------- ----------------
95.10 0.291882 7484 39 18 waitpid
2.01 0.006160 474 13 execve
0.77 0.002359 24 98 munmap
0.75 0.002310 110 21 clone
0.32 0.000973 24 41 mprotect
0.19 0.000586 3 194 rt_sigaction
0.18 0.000556 3 211 read
0.16 0.000497 2 263 mmap2
0.15 0.000471 43 11 write
0.10 0.000301 2 184 2 open
0.05 0.000151 0 418 rt_sigprocmask
0.04 0.000119 7 17 getrlimit
0.04 0.000116 1 157 fstat64
0.03 0.000101 1 75 23 access
0.02 0.000065 0 270 5 close
0.02 0.000061 1 98 fcntl64
0.02 0.000052 2 23 22 connect
0.01 0.000034 1 67 17 stat64
0.01 0.000032 1 25 getuid32
0.01 0.000031 2 18 sigreturn
0.01 0.000030 1 37 brk
0.01 0.000029 7 4 setreuid32
0.00 0.000000 0 1 chdir
0.00 0.000000 0 4 time
0.00 0.000000 0 1 getpid
0.00 0.000000 0 3 alarm
0.00 0.000000 0 9 pipe
0.00 0.000000 0 7 ioctl
0.00 0.000000 0 1 umask
0.00 0.000000 0 28 dup2
0.00 0.000000 0 1 getppid
0.00 0.000000 0 1 getpgrp
0.00 0.000000 0 1 setsid
0.00 0.000000 0 1 setrlimit
0.00 0.000000 0 8 readlink
0.00 0.000000 0 1 getpriority
0.00 0.000000 0 1 setpriority
0.00 0.000000 0 2 uname
0.00 0.000000 0 2 _llseek
0.00 0.000000 0 6 poll
0.00 0.000000 0 1 getcwd
0.00 0.000000 0 16 getgid32
0.00 0.000000 0 16 geteuid32
0.00 0.000000 0 16 getegid32
0.00 0.000000 0 4 setregid32
0.00 0.000000 0 1 setgroups32
0.00 0.000000 0 1 setuid32
0.00 0.000000 0 1 setgid32
0.00 0.000000 0 6 getdents64
0.00 0.000000 0 11 gettid
0.00 0.000000 0 13 set_thread_area
0.00 0.000000 0 3 keyctl
0.00 0.000000 0 29 socket
0.00 0.000000 0 2 send
0.00 0.000000 0 6 sendto
0.00 0.000000 0 12 recvfrom
------ ----------- ----------- --------- --------- ----------------
100.00 0.306916 2500 87 total
Вы затем сможете видеть, в которых системных вызовах израсходовано время, который мог бы дать нам ключ к разгадке то, что вызывает замедление.
strace-tT мог бы также быть полезным.
Можно также присоединить strace к выполнению процессов (strace-p) и узнать больше о том, что они делают.
Вопрос: Если Вы останавливаете все процессы Java загрузка средний запуск для снижения?
50%-е системное использование CPU очень высоко, особенно без любого свопинга или iowait. У Вас есть что-то уровень ядра, который уничтожает ресурсы. Скорее всего, плохой драйвер. Я сказал бы что первое вкусное обновление нового ядра.
Инструменты Install/update VMware. Включите поддержку виртуализации в BIOS физического сервера (у Вас будет такая опция, если Ваш ЦП будет поддерживать это). Какое решение для виртуализации от VMware Вы используете? Проверьте производительность и в гостя (VM) и в хост (сервер VMware) машины. Укажите, ли вершина от гостя или от хоста. Сколько памяти Вы имеете в хосте и сколько присвоено от гостя? У Вас есть память, принимают на себя непосильные обязательства для VMs? Хост подкачивает?
Вы дали Вашему Гостю меньше vCPUs, чем Ваша хост-машина имеет, не имеют Вас? Я подозреваю, что у Вашего гостя есть два vCPUs. Сколько имеет хост?
Превышение намеченной суммы центральных процессоров может вызвать этот вид поведения.
Кроме того, существует опция уменьшить уровень галочки в госте VM с CentOS, который может помочь несколько, хотя я не думаю, что это - первопричина. Посмотрите на первый пункт маркированного списка в разделе 3 из http://wiki.centos.org/Manuals/ReleaseNotes/CentOS5.1
Попробуйте инструменты "iostat" и "vmstat". Они дают Вам намного больше информации о том, что происходит. Возможно, "SAR" помогает Вам также. (Необходимо установить "sysstat" пакет для получения инструментов.)
И распечатайте здесь вывод тех программ. Затем мы могли помочь Вам больше.
Другая хорошая вещь состоит в том, чтобы сделать то, что "davey" сказал Вам.
У меня есть проблема о нескольких машинах, выполняющих VMware Server, посредством чего каждый VM медленно использует все больше ресурса ЦП со временем. Остановка VMs и перезапуск затем решают проблему, хотя перезагрузка их или suspending+resuming их не делает.
Это является самым легким видеть на низком сервере спецификации (старый P4), который выполняет три VMs выполнение основных веб-сервисов: график у основания этой страницы показывает измеренный эффект на использование ЦП со временем, и у основания этой страницы Вы видите эффект, как измеряется "средними чтениями" загрузки. Эффект намного менее noticable на других машинах, я работаю на VMware, потому что они намного более мощны в целом. Эффект кажется пропорциональным количеству VMs, работающего (т.е. фантомная загрузка увеличивается дважды быстро, если вдвое больше VMs работает). К настоящему времени остановка и перезапуск VMs всегда решали проблему - перезагрузка хост-машины не нужна (хотя, если хост должен перезагрузка для чего-то как обновление ядра, он делает с тех пор для координирования этой перезагрузки с VMs, понижающимся).