WEB - приложение для преобразования текста в речь и обратной транскрибации речи в текст
WEB - приложение для преобразования текста в речь и транскребации аудио в текст с помощью удобного графического интерфейса. Так же после преобразования в аудио файл его можно скачать и пользоваться по своему усмотрению. Все преобразованные файлы хранятся static/voice/
Для того чтобы попробовать проект:
- Скопируйте репозиторий себе на локальную машину
- Установить зависимости из файла requirements.txt python -m pip install -r requirements.txt
- Для работы с библиотекой whisper воспользуйтесь официальной документацией Whisper
Для простого запуска: установить ffmpeg и выбрать одну из доступных моделей: tiny, base, small, medium, large model = whisper.load_model("medium")
Модель загрузится автоматически перед первым запуском приложения. - Запустить код
В проекте используется:
- мини-фреймворк Flask
- библиотека Whisper
- библиотека gtts