Написание конфигов для Prometheus

5 000 руб. за проект
30 июля 2020, 08:58 • 1 отклик • 42 просмотра
Есть некоторый парк из серверов:

- N боксов для расчетов с GPU, иногда больше 1 карты;
- База данных PostgreSQL;
- N серверов для деплоя с GPU;
- Пустой сервер где будет крутиться сам прометей;

Нужно дать compose.yml файлы и config.yml ("infrastructure as code") файлы для прометея и минимальную инструкцию текстом или в markdown как, в каком порядке это все поднимать (и любые другие конфиг файлы если нужно). Экспортеры должны сами подниматься после рестарта системы (поэтому compose кажется простым вариантом). Возможно пара слов какие порты где открыть или прокинуть. Это не проблема, если мне нужно будет отладить часть конфига, но по возможности нужно отладиться на своих железках, допустим кроме nvidia экспортера.

Что должен делать прометей:

- Экспортировать основные логи системы (node exporter, nvidia-exporter)
- Экспортировать основные логи базы (node exporter, postgresql-exporter)
- Я пользовался прометеем, в частности node экспортером, там довольно много метрик, в идеале хотелось бы в конфиг файле указывать хотя бы их группы, там есть бесполезные вещи просто
- Интересующие метрики - CPU load, GPU load, CPU temp, GPU temp, нагрузка на базу, заполнение системного и указанных дисков, переполнение свопа, высокая IO нагрузка, высокая нагрузка на сеть
- На удаленном сервере крутится сам прометей и веб мордочка
- Слать алерты в случае если если заданный показатель превышает указанный threshold
- Алерты слать в телегу и на почту (если телега недоступна?)
- Графана вместо стандартного UI только если у вас есть готовый шаблон, разбираться не надо с нуля

Если что-то важное забыл, велком подсказать. Если не затруднит еще приложить ссылки на доку где надо листинги прописывать.

Цена указана ориентировочная с учетом того, что у вас уже есть готовые конфиги и вам нужно просто их допилить немного. Обычно сам делаю такие вещи, сейчас нет времени и сил.

Нужно в течение 2 дней. Все вопросы в телеграм @snakers41.