Написать конвертер из PDF в TXT на Python

Цена договорная
27 февраля 2022, 13:05 • 11 откликов • 63 просмотра
Нужно написать скрипт на python который будет доставать текст из pdf файлов.

  • Pdf файлы могут быть текстом, а могут быть просто набором картинок, то есть текст нужно будет распознать
  • Pdf файлы могут быть на разных языках
  • Желательно использовать пакеты Poppler и Tesseract для извлечения текста