Написать обновление для скрипта конвертации pdf

Цена договорная
17 июля 2023, 11:08 • 1 отклик • 22 просмотра
1. Обработка ошибок

По ходу конвертации pdf возникают ошибки из-за "битых" pdf-файлов, ошибки бывают 3 видов:

  • Скрипт останавливается, пишет ошибку, и новая папка под конвертированные файлы не создается.
  • Скрипт останавливается, создается директория под “битый” pdf, но в ней в зависимости от ошибки не хватает либо html, либо webp, либо постраничных pdf (смотря на каком этапе ошибка).
  • Бывает так что скрипт зависает, ошибку не выдает, и просто висит, пока вручную не остановишь.При этом также создается директория в которой не хватает файлов.

Нужно сделать так, чтобы при какой либо ошибке директория была создана, но внутри нее было пусто, чтобы скрипт при следующей обработке пропускал этот файл. И при этом чтобы он не останавливался и продолжал работу.

Нужно чтобы скрипт не зависал или был некий таймаут на пропуск файла, который долго обрабатывается (остается только пустая директория по имени этого файла).

2. Удаление лишних html

Иногда встречаются отсканированные pdf без текста. Они конвертируются в html, но по сути содержат в себе только тег img и ничего более.

В скрипт нужно внедрить проверку итоговых html файлов после конвертации и если все страницы содержат только тег img, то тогда удаляется вся папка html.



Отзывы
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Заказчик
Отлично сделано обновление скрипта из предыдущего заказа, все работает как нужно! Спасибо!
9 месяцев назад
R50 939079d353a675d3c75c59a605d7f15b
Фрилансер
Заказчик отлично объясняет свои желания, приятно общается и всегда на связи! Рад сотрудничеству!
9 месяцев назад