Парсер бухгалтерской (финансовой) отчетности с ресурса ФНС-bo.nalog.ru

Добавлено 27 июн 2024 в 23:46
Парсер по списку ИНН из файла собирает информацию по бухгалтероской отчетности и записывает ее в БД. Парсер написан на языке программирования python 3.12 с использованием базы данных MySQL (движок MariaDB). Используемый стек: asyncio, aiohttp, aiomysql, proxy. Парсер работает в асинхронном режиме и при достаточном количестве качественных проски обрабатывает порядка 5000 ИНН в час. Логика парсера: на вход подается текстовый файл со спсиком ИНН (кладется в папку). Парсер работает с использованием массива прокси. На каждый запрос к сайту берется новый прокси из массива, тем самым достигается большая скорость обработки данных. Парсер собирает бух. отчетность с 2017 по 2023 года. Парсятся следующие данные - 1) Сведения об организации из БФО; 2) Бухгалтерский баланс; 3) Отчет о финансовых результатах. Парсер может работать как на локальной машине, так и на удаленном сервере под управлением Linux. Также парсер может работать и на Windows. Имеется возможность вывода полученных данных в таблицу (CSV и XLSX).

stack - console, excel, csv, python, mysql, mariadb, proxy, aiohttp, asyncio, requests, beautifulsoup
4a68091e98