Перевести хранилище данных с PostgreSQL на ClickHouse + 3 скрипта

Цена договорная
03 января 2024, 14:57 • 4 отклика • 43 просмотра
Имеется проблема:
В рамках одного из проектов было собранно DWH на базе PostgreSQL.
Для скорости работы были организованны мат представления.
Для загрузки части данных используется airbyte.
При обновлении данных airbyte удаляет исходные таблицы и postgresql удаляет мат представления, что в следствии ломает все отчеты.
В качестве решения предполагается отказаться от postgresql в пользу clickhouse.
Доставка данных планиурется через airbyte.

Требуется реализовать:
1. Организовать инфраструктуру clickhouse - Написать docker-compose файл который будет развертывать clickhouse с нужными параметрами.
2. Подключить драйвер clickhouse к metabase - Организовать сборку сервиса metabase с драйвером для clickhouse на docker-compose.
3. Переписать\\Адаптировать материальные представления написанные для postgresql на clickhouse.
4. Организовать хранение кода материальных представлений в гит - написать скрипт на python для создания мат представлений из шага выше. Каждое мат представление лучше хранить как отдельный файл.
5. Переписать скрипт сбора данных из ERP (протокол OData) с powershell на python. Исходный скрипт 1400 строк кода.
6. Переписать скрипт расчета на базе мат представлений с powershell на python. Исходный скрипт Исходный скрипт 340 строк кода.
Отзывы
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Заказчик
Очень быстро и выше моих ожиданий выполнил поставленную задачу найдя оригинальное и простое решение. Крайне рекомендую!
12 месяцев назад
Отличный заказчик.
12 месяцев назад