Разработать / доработать конвертер DOCX -> HTML

10 000 руб. за проект
03 апреля 2024, 20:25 • 10 откликов • 56 просмотров
Нужен конвертер на node.js или python, который корректно сконвертирует файл формата DOCX в HTML.
Конвертер должен работать в закрытом контуре на linux, можно использовать open source библиотеки.

Основное требование: визуально HTML должен совпадать с тем что видно в Word.

Принципиально параграфы, списки (включая нумерацию, заданную в ворде - с этим основная проблема во всех либах которые мы перепробовали), таблицы, якоря.
Комментарии желательно.

Основная проблема существующих open source библиотек - они некорректно записывают многоуровневые нумерованные списки. (Либо вообще нумерацию не отображают, либо отображают некорректно)

Сами пробовали libreoffice, pandoc, mammoth, apache POI. Возможно их надо доработать, но мы не знаем как и что именно.

Это проект, но если все пойдет хорошо то будут ещё задачи постоянно.
Реализация может быть на python или под node.js
Пример файла прилагаю
Файлы
Отзывы
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Заказчик
Очень профессионально и грамотно. Спасибо
11 дней назад
R50 644c0f06e5156d81e41fd4f5bd491a07
Фрилансер
Несмотря на сложность, задание было описано вполне подробно, с приложением тестовых файлов. На уточняющие вопросы были получены ответы. Доводы и предложения были приняты во внимание. В целом, нормальный заказчик.
10 дней назад