Нам нужно извлечь журналы обратных прокси-серверов, размещенных на GKE, в необработанном формате, который может быть проанализирован инструментами анализа журналов SEO. К сожалению, эти инструменты категорически отказываются принимать файлы CSV и JSON, они принимают только необработанный текст, как это было бы в файлах .log, созданных Nginx на физическом сервере.
Загрузка их из графического интерфейса GCP не работает, так как это разрешает только экспорт в JSON и CSV. Экспорт, который позволяет GCP, тоже не работает - мы смогли сохранить журналы с открытым текстом в хранилище Google с помощью сценария облачной функции, но только неудобным способом (1 файл в час, по-видимому, это невозможно изменить) и только для будущие журналы, поскольку экспорт журналов применяется только к входящим журналам.
Что нам нужно, так это извлечь журналы в виде открытого текста за последний месяц, и, похоже, не существует документированного и / или поддерживаемого способа сделать это.
Простите за ответ на свой вопрос, но я потратил много времени на изучение этого вопроса и, надеюсь, разместив его здесь, я могу избавить других от хлопот.
Единственный способ достичь того, что мне нужно. похоже, используется google cloud sdk из командной строки и выгружает результат в локальный текстовый файл, например:
$ gcloud logging read 'resource.type=container resource.labels.cluster_name=your_cluster logName=the_specific_deployment_you_want_logs_from timestamp>="2015-05-01T00:00:00Z" (whatever text search filters are needed)' --limit 1000000000000 --order asc --format "value(textPayload)" > total.log