У меня периодически возникала проблема с одним из моих приложений / серверов, за которые я отвечаю. Я в основном был один VPS со всем стеком, необходимым для запуска моего приложения (nginx + postgresql + ruby + ruby on rails + пассажира), поддерживаемого ansible. Была проблема с тем, что сервер был заморожен один раз в 2 дня. Он не получал любые входящие соединения на портах 80 и 22 (так что я даже не смог подключиться к нему по ssh). Единственным решением была его перезагрузка. Я проигнорировал эту проблему, потому что был уверен, что с этой машиной что-то не так, и переход на новую устранит проблему.
Недавно я немного изменил свои доступные playbooks, и мое приложение было разделено на 3 отдельных серверы. Я был уверен, что проблема не возникнет, но, к сожалению, она снова возникла и, что еще хуже, поразила все три машины! Я использую ту же самую роль для базовой конфигурации всех этих трех серверов, но нет ничего опасного. Просто базовые вещи, такие как создание пользователей, генерация ключей SSH и т. Д. В любом случае, это еще не все - теперь для этих трех новых серверов даже перезагрузка не может исправить эту проблему, после перезагрузки из панели Azure я все еще не могу подключиться к любая из этих трех машин на 80 или 22 портах.
I ' m, очевидно, не может отлаживать журналы этих новых серверов, потому что они недоступны, но у меня все еще работает старый, поэтому было бы полезно проверить, что вызывает эти зависания на нем? Я просто не могу найти что-либо в журналах (или я не знаю, что и где мне искать подсказки).
Серверы используют Ubuntu 14.04
Так много всего могло пойти не так. Вот что я бы сделал:
Оставайтесь в системе и запустите tail -f <каждый файл журнала, который может оказаться полезным>
. По крайней мере, вы увидите последнее, что произошло, когда он умер.
Посмотрите журналы после перезагрузки. Также посмотрите dmesg
. Вам придется прокрутить waaaaay назад, чтобы увидеть последнее событие перед перезагрузкой.
Посмотрите журналы консоли. AWS предоставляет их в консоли EC2 (и через API), я не знаю, что с ними делает Azure.