Выбрать определенные поля из json файла и залить в таблицу

1 000 руб. за проект
27 февраля 2021, 00:35 • 4 отклика • 66 просмотров
Необходимо перекинуть данные из json файла в таблицу в BigQuery (GCP).

В файле есть поле url, его нужно “вырезать” и сохранить в таблицу.

Пример:

Строчка json файла:

{"urlkey": "com,0--9)/2018/07/blog-post_509.html", "timestamp": "20210122151317", "url": "https://www.0--9.com/2018/07/blog-post_509.html", "mime": "text/html", "mime-detected": "text/html", "status": "404", "digest": "Y3U33JBPLQVAMWA2EA3ADN5KDL2LKMVI", "length": "17895", "offset": "18601639", "filename": "crawl-data/CC-MAIN-2021-04/segments/1610703530835.37/crawldiagnostics/CC-MAIN-20210122144404-20210122174404-00505.warc.gz"}


В итоговой таблице должна выглядеть как отдельная строчка:

url: https://www.0--9.com/2018/07/blog-post_509.html
status: 404
filename: crawl-data/CC-MAIN-2021-04/segments/1610703530835.37/crawldiagnostics/CC-MAIN-20210122144404-20210122174404-00505.warc.gz


Интересует чистый код с комментариями на колабе (google collaboratory).



Отзывы
Аноним
 
4 года назад