Парсер xml на python или api информации о контрактах с ftp госзакупок

12 000 руб. за проект
02 ноября 2022, 03:30 • 19 откликов • 159 просмотров
Задача получить информацию всю информацию по контрактам, а также обо всех участниках с которыми расторгают контракты, пени и штрафы. Данные хранятся на фтп госзакупок в папке fcs_regions -> наименование региона -> папки начинающиеся на contracts. Данные хранятся в xml (по идее все, с некоторыми разобрались, где хранятся, с некоторыми предстоит). Нужны все данные за 2022 год.

ужны все данные по контракту из xml, связанных с контрактом: пени, штрафы, расторжения, ВСЕ этапы, сроки, наименование заказчика и т.п. Нужно делать ежедневное обновление, ставить парсер на крон для докачки заказчиков. Данные должны выгружаться в mysql таблицы по округам (есть готовый скрипт деления по округам, исполнителю скину). Делать можно пока у себя на локалке, далее нужно будет поставить на сервер.

По итогу у нас должна получиться база данных в MySQL на ежедневном обновлении со всеми данными по контрактам приведённым по ссылкам: данные заказчика, исполнителя, инфо о контракте, этапы контракта, сроки, пени если есть, информация о расторжении если есть.

Данные хранятся на фтп в формате xml, для примера могу скинуть кривой парсер контрактов.

Данные для входа: ftp://ftp.zakupki.gov.ru/ данные для входа free free

Прилагаю пример того что лежит в папке региона в папке ContractProcedureDocs в архиве за 24-25.10 и в папке contracts
Т.е. данные по компании, с которой расторгаются, лежат в папке ContractProcedureDocs, часть данных по контракту лежат в папке contracts. Пени и штрафы вроде также лежат там же.
Как вариант скачать весь регион и сделать поиск по файлам в поиске штрафа или пени по цифре. Также скидываю парсер по этапам контракта, частично он рабочий. Косяк в том, что нам нужны все этапы контракта, но при обновлении бывает что данные затираются.
К уведомлению привязан номер контракта и в этом контракте есть информация

В документе более полное ТЗ со скринами.

Предпочтение тем, кто работал с фтп госзакупок, их структурой и информацией. Иначе будет сложно и разбираться будете долго.
Файлы