Мы с важной новостью: с 28 февраля 2025 года сервис Хабр Фриланс прекратит свою работу.

Купить услуги можно до 28 февраля 2025, но пополнить баланс уже нельзя. Если на вашем счете остались средства, вы можете потратить их на небольшие услуги — служба поддержки готова поделиться бонусами, на случай, если средств немного не хватает.
R50 13972065dc6e6ba709e1653e5ded45a7
Бэк-энд и фронтенд-разработка

Создание приложения для распознавания текста с изображений и аудиофайл

Добавлено 16 янв 2024 в 20:34
Приложение для распознавания текста с изображения или аудио из файла. Сервер реализован на Java и Python, фронтенд — на JavaScript, база данных — PostgreSQL.
Архитектура реализована как клиент-сервер, в парадигме MVC.
Для выполнения задачи распознавания текста с изображения используется технология OCR –
обнаружение текстового содержимого на изображениях и перевод изображений в закодированный текст, который компьютер может легко понять.
Для целей OCR использовался пакет PyTesseract, являющейся оболочной для Google Tesseract-OCR Engine.
Для обработки аудио была использована библиотека Speech Recognition.
Исходный код приложения находится в репозитории https://github.com/vadimpechenin/RecognizingTextFromImageApp.git
39fea5a823 D13db8b6c6 9dabdf40ac 71c1d0d738 886a06df54 A7894aec8c 42649b1641 1f930fee57