RESTful сервис для извлечения текста из PDF файлов на python

20 000 руб. за проект
21 ноября 2023, 18:37 • 15 откликов • 118 просмотров
Алексей, [21 нояб. 2023 г., 17:22:11]:


Pdf файл и извлекается в плоский обычный текст, с разбиением на страницы потом вызывается сервис для индексирования документа в базу данных.

При индексировании используется морфология для приведению слов к начальной форме, затем делается статистика, считается количество слов в документе и на каждой странице.

Создается общая база в которой написано сколько встречается слов в тексте


Необходимо выполнить на python в виде рест сервиса


К часам 10 у меня будет Исходник программы которая достает текст

Координаты сервиса который индексирует

И описание рест апи этого сервиса

Можете предложить свою цену за проект!