Сравнение содержимого пдф файлов

Цена договорная
14 июня 2020, 17:15 • 9 откликов • 86 просмотров
Наладить механизм сравнения пдф файлов.
Начать со сравнения 2 файлов приложенных к проекту

Уточняю текущую постановку. Из пдф выгрузили тексты готовым скриптом и сравнили в гите.

Резудьтат сравнения тут https://github.com/TEBESKASHI/pdfdiffchecker


Сейчас надо избавится от отличий текстов из-за разного количества пробелов и из за изменения нумерации подразделов.

Различия нумерацией можно решить либо промежуточной технической версией с новой нумерацией либо переводом текстов в MarkDown формат.


Если переходить к нейтральной нумерации тогда надо заменить
Как пишут бюрократы

1.
1.2
1.2.1
1.3 ... как написано в 1.2

Как можно написать, что бы уйти от расхождений в тексте

F(n)
F(n,m), id=5
F(n,m,v)
F(n,m) как написано в #id =5

Прошу оценить эту, более частную постановку, в цепочке решения общей задачи.
Файлы