Написать парсер для распознавания экспортируемого из софта pdf файл (не скан)

Цена договорная
08 ноября 2021, 11:30 • 10 откликов • 53 просмотра
Коллеги, всем доброго времени суток!

Нам необходимо написать парсер для распознавания экспортируемого из софта pdf файл (не скан) и преведение полученных данных к единому формату.

По факту экспортируется 4-5 (количество зависит от размеров схемы) типов файлов (все в pdf), которые и будут служить данными на "вход", а именно:
1. Цвет + черно-белые блоки
2. Цвет блоки
3. Цвет символы
4. Ч/б символы

Экспортируемые файлы содержат в себе:
Схему
Координатную сетку
Расположение (цвета, символа, типа стяжка) в каждой клетке
Цвет
Символ
Символ стяжка
Ключ схемы (легенду)

Все это необходимо распознать и на выходе получить в понятной кодировке перечисленные данные из которых соберется полноценная схема, из входящих файлов.

Реализация возможна на любом языке, но предпочтительно С/С++/C#/Java

Пишите Ваши предложения, с исполнителем обсудим детали