Мониторинг сообщает о неправильном использовании ЦП на GCP

В настоящее время я администрирую веб-сайт, размещенный на облачной платформе Google, с помощью Kubernetes Engine. Вчера я заметил, что поток CPU% на узле GKE резко упал до значения чуть севернее 0. После исследования стало ясно, что все в порядке - сайт все еще работает, и проверка использования процессора напрямую через SSH показала нормальные уровни нагрузки. Похоже, что управляемый Google агент мониторинга в GKE не может точно сообщить об использовании ЦП, хотя все остальные значения сообщаются правильно.

Кто-нибудь сталкивался с этой проблемой? Есть ли решение для восстановления точных значений мониторинга в этом случае?

- zig

РЕДАКТИРОВАТЬ: Чтобы уточнить мой исходный пост, этот канал точно отражал использование нашего живого экземпляра в течение многих лет до внезапного и неточного отчета о 0 %. Лента также остается точной для наших сред разработки и тестирования.

1
задан 7 February 2019 в 23:08
1 ответ

Использование процессора основной панели GCP отличается от использования процессора экземпляра по отдельности. Использование процессора, показанное в консоли Google Developers Console, является не использованием экземпляра, а использованием контейнера, управляющего экземпляром. Этот контейнер отвечает за предоставление сервисов виртуализации экземпляру и сбор всех метрик, используемых для балансировки нагрузки, автомасштабирования, облачного мониторинга и т.д. Таким образом, большое количество операций ввода/вывода или сетевых операций вызовет всплеск загрузки процессора, показанного в консоли Google Developers Console.

В качестве обходного пути можно использовать пользовательские метрики Stackdriver Monitoring для получения более точных метрик использования процессора.

.
2
ответ дан 3 December 2019 в 20:10

Теги

Похожие вопросы