Случайное выключение Google Compute Engine

Наш Compute Engine, который запускает бэкэнд для мобильной игры, сегодня (03.08.18) отключился случайным образом, и журналы не могут сказать мне, какой пользователь или IP-адрес инициировал его .

Я немного покопался и попал в системные журналы, которые отображают следующее:

Mar  8 10:58:10 redis-prod-vm systemd[1]: Started Synchronise Hardware Clock to System Clock.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Session 5 of user redis.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping User Manager for UID 999...
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Default.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Graphical Interface.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopped target Graphical Interface.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Entropy daemon using the HAVEGE algorithm...
Mar  8 10:58:10 redis-prod-vm haveged[369]: haveged: Stopping due to signal 15
Mar  8 10:58:10 redis-prod-vm haveged[369]: haveged starting up
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Multi-User System.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopped target Multi-User System.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Default.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Basic System.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Basic System.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Paths.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Paths.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Timers.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Timers.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Sockets.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Sockets.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Starting Shutdown.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Reached target Shutdown.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Deferred execution scheduler...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping vsftpd FTP server...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping LSB: bitnami init script...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Regular background program processing daemon...
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Starting Exit the Session...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Google Compute Engine user shutdown scripts...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping OpenBSD Secure Shell server...

Это продолжалось, пока виртуальная машина не завершила выключение, вот журнал:

2018-03-08 10:59:46.073 GMT compute.instances.stop {
    "event_timestamp_us":"XXX",
    "actor":{"user":""},
    "resource":{
        "name":"redis-prod-vm",
        "type":"instance",
        "zone":"us-central1-f","id":"XXX"
    },
    "event_type":"GCE_OPERATION_DONE",
    "trace_id":"XXX",
    "operation":{"type":"operation",…

Я заменил некоторые потенциально важные числа на XXX чтобы быть в безопасности. Кто-нибудь может помочь пролить свет на то, что произошло?

1
задан 9 March 2018 в 02:20
1 ответ

Я публикую этот ответ, чтобы сделать рекомендацию, предоставленную @Taher в разделе комментариев, более заметной:

Пожалуйста, ознакомьтесь с документацией Выгружаемые экземпляры ВМ :

Вытесняемая виртуальная машина — это экземпляр, который вы можете создать и более низкая цена, чем у обычных экземпляров. Однако Compute Engine может остановиться (вытеснять) эти экземпляры, если ему требуется доступ к этим ресурсам для другие задачи. Выгружаемые экземпляры — это избыточная мощность Compute Engine, поэтому их доступность зависит от использования.

Если ваши приложения отказоустойчивы и могут выдержать вытеснения, то вытесняемые экземпляры могут уменьшить ваш вычислительный движок стоит значительно. Например, задания пакетной обработки могут выполняться на упреждающие экземпляры. Если некоторые из этих экземпляров остановятся во время обработки работа замедляется, но не останавливается полностью. вытесняемый экземпляры завершают ваши задачи пакетной обработки, не помещая дополнительную рабочую нагрузку на существующие экземпляры и без необходимости вы должны заплатить полную цену за дополнительные нормальные инстансы.

Пожалуйста, проверьте, является ли ваш экземпляр вытесняемым или нет.

Кроме того, вы можете ознакомиться с документацией Просмотр выходных данных последовательного порта и проверить, есть ли в журнале какая-либо полезная информация.

Кроме того, рассмотрите возможность использования Использования обозревателя журналов для сбора дополнительных сведений об устранении неполадок.

1
ответ дан 11 February 2021 в 13:48

Теги

Похожие вопросы