Google Compute Engine - не удается подключиться через SSH? ВМ теряет доступ к сети?

РЕДАКТИРОВАТЬ: Это был неконтролируемый процесс приложения , а не GCE. Вот проблема, ответ на которую приводится ниже:

У меня только что произошел какой-то сбой в работе моей виртуальной машины CE в пробной учетной записи, но я не вижу никаких сбоев в списке сбоев вычислений Google.

Я не точно, как долго это длилось, так как я не уверен, когда это началось. Судя по поведению, это соответствует тому, что, казалось, произошло несколько недель назад (потеря возможности входить в систему с помощью SSH через панель управления Compute Engine до тех пор, пока виртуальная машина не была перезагружена).

Моя тестовая виртуальная машина отключила мое SSH-соединение в последний день или Итак, и когда я заметил сегодня, я не смог переподключиться. Затем я попытался подключиться к SSH с помощью SSH подключиться к списку виртуальных машин Compute Engine, и это не удалось. Единственное, что я мог сделать, это получить приглашение на последовательную консоль ... но у меня вообще не было учетной записи с паролем, я полагался на SSH (теперь исправлено). Мне пришлось остановить виртуальную машину и перезапустить ее ... затем я мог подключиться, используя параметр подключения "SSH" в списке виртуальных машин, хотя я НЕ мог подключиться извне. Я подключился к последовательной консоли и увидел несколько сообщений об ошибках сети, пытающихся подключиться к различным снимкам. Я попытался подключиться к удаленному серверу по SSH из своего окна SSH в виртуальную машину, и сначала не смог. Примерно через минуту это сработало, и внезапно удаленное соединение снова заработало.

РЕДАКТИРОВАТЬ: Я получил ответ на свой запрос в службу поддержки от Google. Они говорят, что я пережил событие живой миграции. Звучит не так. Это было как минимум 10 минут прерывания сети. Я мог подключиться к последовательной консоли, и она казалась отзывчивой. Только после перезагрузки и сбоя инициализации привязок управления Google он внезапно начал работать. Может быть, сбой связи при загрузке вызвал миграцию? Я не знаю.

РЕДАКТИРОВАТЬ: Я снял беспокойство о стабильности GCE, поскольку инфраструктура не имела ничего общего с проблемой.

0
задан 29 September 2018 в 04:36
2 ответа

Экземпляр на последовательной консоли казался работоспособным, но на самом деле он был в очень тяжелом состоянии из-за неконтролируемого процесса с привилегиями root (временное тестирование), поглощающего всю доступную память. Системный убийца OOM постоянно убивал процесс, который мог просто возродиться.

Google Compute Engine должен отслеживать использование системной памяти по умолчанию. Странно, что это не так.

Итак, э ... в данной ситуации полезность этого вопроса для кого-то кажется низкой. Следует ли его удалить?

0
ответ дан 4 December 2019 в 15:50

Это может происходить по ряду причин. Я бы порекомендовал проверить документ по устранению неполадок SSH для получения дополнительных сведений о том, как устранить эту проблему.

Эта проблема также могла возникнуть, если гостевая среда Linux не запустилась должным образом после динамической миграции. Гостевые среды включают в себя набор сценариев и процессов, которые запускают содержимое с сервера метаданных и создают надлежащую среду для запуска виртуальной машины. Возможно, ключи SSH не были правильно установлены во время настройки гостевой среды.

Вы также можете установить для поля «automaticRestart» значение «true», как указано в этом документе. Это автоматически перезапустит ваш экземпляр, если он выйдет из строя из-за проблемы с оборудованием или после динамической миграции. Это обеспечит правильную настройку ключей SSH. Не стесняйтесь читать документацию по живой миграции , если вам нужна дополнительная информация о живой миграции в Google Cloud Platform.

1
ответ дан 4 December 2019 в 15:50

Теги

Похожие вопросы