Разработка Text 2 Speech API

100 000 руб. за проект
02 февраля 2024, 11:22 • 17 откликов • 133 просмотра
Нам в проекте 123apps.com необходимо разработать Text 2 Speech API для внутреннего использования которое предоставляет единый интерфейс как к популярным open source библиотекам и моделям, собранным на нашем сервере, так и проксирует запросы в популярные коммерческие API (Google, OpenAI)


Задачу можно разделить три части:

  1. Сборка и настройка локального движка и моделей. Здесь нужно будет найти одно или несколько подходящих open-source решений и подготовить shell-скрипт или docker-файл, который разворачивает окружение под Ubuntu 22.04. Важно покрыть большое количества языков и голосов.
  2. Написание API, которое использует для обработки запросов настроенную в первой части программную часть. API и программный бэкенд находятся в пределах одной машины. Пример возможных полей в запросе к API: text, model, voice, language, audio_format, speed, pitch.
  3. Расширение написанного API функциональностью, которая проксирует запросы в коммерческие API (Google TTS API, OpenAI TTS API). Возможно, имеет смысл сделать этот пункт вторым этапом, чтобы было проще со схемой API.

Что касается оплаты, то изначально не ясно, сколько времени понадобится на задачу, поэтому можно работать либо вашей ставке за час, либо вам нужно будет предварительно погрузиться в задачу и оценить ее. Мы готовы платить больше за профессионализм и всегда выберем более дорогого кандидата, но с большим опытом, скоростью работы и уровнем ответственности.

Пожалуйста, в ответе на проект, обязательно, расскажите о своем опыте в подобных задачах. Подробности о проекте расскажу в личном общении.