Проверка данных и растеризация

1 000 руб. за проект
28 февраля 2021, 19:04 • 6 откликов • 46 просмотров
Необходимо скачать данные из таблицы хранящиеся в BigQuery (GCP).
В каждой строке, поле content содержит xml string описывающий svg image.

Требуется:
  • Перевести картинку в формат png
  • Сохранить результат в корзине (google bucket)
  • Сохранить ссылку на файл (сохраненный в корзине) и ошибки (если таковые возникли во время процесса) в новые колонки: rendered_image_location, error_status
Код должен быть написан на питоне, в колабе (google collaboratory)
Красивый, хорошо документированный код более чем приветствуется ;)

Схема исходной таблицы:
Url, content, query_time, batch_number, meta

Схема итоговой таблицы:
Url, content, rendered_image_location, error_status, query_time, batch_number, meta

Как оперировать корзинами (google buckets) в колабе:
https://medium.com/analytics-vidhya/how-to-access-files-from-google-cloud-storage-in-colab-notebooks-8edaf9e6c020

Если во время прочтения или выполнения задания возникнут вопросы, не стесняйтесь их задавать :)