Извлечение данных/парсинг из pdf (тамож. декларация) в excel или др

10 000 руб. за проект
09 января 2025, 15:25 • 22 отклика • 85 просмотров
Здравствуйте,
Требуется разработать решение для извлечение данных из pdf файлов определенного формат (таможенные декларации) которые формируются в основном из 3 программ для декларирования (Альта-ГТД, ВЭД-Декларант, Контур Декларант). Данные требуется выгружать в структурированном виде для дальнейшей возможности их обработки и формирования отчетов (например в excel).
Задачи:
1. Возможность периодичного использование и обработка нескольких файлов (возможно последовательно)
2. Разработка оптимальной формы для сбора данных для структурирования внутри одного документа и между разными документами (индексация) при условии наличия совпадений (БД или общий файл excel).

На данный момент ручной метод: вид - эксель таблица:
1- строчка одна ДТ, и все данные по столбцам. совпадающие по типу столбцы можно суммировать.
Более подробные детали по запросу.