Мы с важной новостью: с 28 февраля 2025 года сервис Хабр Фриланс прекратит свою работу.

Купить услуги можно до 28 февраля 2025, но пополнить баланс уже нельзя. Если на вашем счете остались средства, вы можете потратить их на небольшие услуги — служба поддержки готова поделиться бонусами, на случай, если средств немного не хватает.
R50 7b61f8c9525c544c3853f8505344bcd5
python backend developer

Парсер бухгалтерской (финансовой) отчетности с ресурса ФНС-bo.nalog.ru

Добавлено 27 июн 2024 в 23:46
Парсер по списку ИНН из файла собирает информацию по бухгалтероской отчетности и записывает ее в БД. Парсер написан на языке программирования python 3.12 с использованием базы данных MySQL (движок MariaDB). Используемый стек: asyncio, aiohttp, aiomysql, proxy. Парсер работает в асинхронном режиме и при достаточном количестве качественных проски обрабатывает порядка 5000 ИНН в час. Логика парсера: на вход подается текстовый файл со спсиком ИНН (кладется в папку). Парсер работает с использованием массива прокси. На каждый запрос к сайту берется новый прокси из массива, тем самым достигается большая скорость обработки данных. Парсер собирает бух. отчетность с 2017 по 2023 года. Парсятся следующие данные - 1) Сведения об организации из БФО; 2) Бухгалтерский баланс; 3) Отчет о финансовых результатах. Парсер может работать как на локальной машине, так и на удаленном сервере под управлением Linux. Также парсер может работать и на Windows. Имеется возможность вывода полученных данных в таблицу (CSV и XLSX).

stack - console, excel, csv, python, mysql, mariadb, proxy, aiohttp, asyncio, requests, beautifulsoup
4a68091e98