GetDocs - это проект, предоставляющий возможность извлекать информацию из документов различных форматов. Проект написан на языке Python с использованием FastAPI. Проект включает в себя следующие возможности:
Извлечение текстовой информации из PDF, DOCX и других форматов.
Обработка и анализ структуры документов.
Поиск документовс использованием полнотекстного поиска.
Проект доступен на GitHub по
https://github.com/EvgeniBondarev/GetDocs. Вы можете ознакомиться с исходным кодом и протестировать приложение.