Телеграм-бот для Парсинга данных (документы pdf)

1 000 руб. за проект
28 сентября 2021, 09:35 • 8 откликов • 146 просмотров
Основная идея - сделать бота, который будет:

1. выгружать документы со страницы проекта по мере их обновления;
2. выделять определенные данные из документа (проектная декларация) в googleтаблицу.
1. Со страницы проекта (типовая страница проекта _ пример) необходимо выгружать документацию, которая будет размещаться/обновляться на странице (вкладка «Документы»), в телеграмм.

1.1. Количество страниц проектов, которые должны быть включены в рассылку бота от 5 до 20.

1.2. В телеге в сообщениях с выгруженными файлами должно быть добавлено наименование проекта и ID (из примера – это ЖК "Заволжский" и ID дома: 35919).

1.3. Необходимо добавить возможность добавлять новые страницы проектов и удалять старые страницы / или составить инструкцию к боту с функциональном добавления/удаления проекта)) (т.е. владелец бота мог бы добавить/удалить страницу проекта самостоятельно).

2. Из документа «Проектная декларация…» необходимо выцеплять данные под пунктами 19.7.1.1.1.1, 19.7.1.1.2.1, 19.7.1.1.3.1, 19.7.2.1.1.1, 19.7.2.1.2.1, 19.7.2.1.3.1, 19.7.3.1.1.1, 19.7.3.1.2.1, 19.7.3.1.3.1 и выгружать их в googleтаблицу (в определенную форму).