Есть ли, кто-либо входит в систему SuSe Linux, который говорит, зависает ли машина из-за беглеца?

Выполняйте задание крона каждые две минуты, поэтому просто "*/2 * * * * *" в записи крона.

Затем имейте фактическую проверку сценария, если время> 9:00 и <17:30

1
задан 18 May 2012 в 19:53
4 ответа

Может помочь дополнительная информация. Как вы определяете "зависание"? Предполагая, что у вас есть физический доступ к серверу, вы можете проверить, какие сообщения ядра появляются на экране после зависания. Требуется ли серверу перезагрузка после остановки?

Вы можете отслеживать обычные системные журналы до момента сбоя в / var / log / messages. Если у вас есть открытый сеанс, когда сервер останавливается, посмотрите сообщения драйвера, запустив dmesg .

У вас есть какие-либо подробности об оборудовании? Если это оборудование серверного уровня, вы можете проверить журналы оборудования системы, чтобы узнать, есть ли проблемы, такие как плохой ОЗУ и т. Д.

3
ответ дан 4 December 2019 в 01:07

Нет, как правило, нет механизма, который мог бы сказать вам, что именно сломалось, вызвав «зависание».

Пока ваша машина работает, используйте top для поиска процессов потребляет слишком много ресурсов ЦП, бесплатно для проверки проблем с памятью (переключение на диск может сделать машину очень-очень-очень медленной) и просматривать файлы просмотра / var / log, чтобы убедиться, что что-то не так.

ps aux | grep Z отфильтрует зомби-процессы, если они есть.

0
ответ дан 4 December 2019 в 01:07

I got a case open with SuSE where a server freezes. They recommended these steps:

  • Connect a serial console (not very interesting for freezes), and you got iLO...
  • Redirect syslog to a remote-machine (so you can see "famous last words" - perhaps just before the originating system can sync it to /var/log/messages)
  • Install a KDUMP-Kernel and a debug-kernel (gives you the chance to get a kernel-oops rather than a freeze)

The last helped in my case - but I was able to recrate the problem by triggering a certain action - then I got a Kernel-Debug just before the freeze and with that SuSE was able to provide me a PTF (point-to-fix) Kernel, which removed the problem.

But still you did not describe under which circumstances your problem occurs - in the middle of the night? Never during work?

0
ответ дан 4 December 2019 в 01:07

Чтобы проверить процесс Зомби (несуществующий), мы можем использовать команду.

ps aux|awk '$8 == "Z" {print $0}'

, которая распечатает только процесс, который больше не функционирует.

-2
ответ дан 4 December 2019 в 01:07

Теги

Похожие вопросы