Discord-бот, Speech-to-text, OpenAI API

50 000 руб. за проект
09 мая 2023, 16:27 • 22 отклика • 114 просмотров
Коротко:
Discord-бот, отслеживающий активность на заданных голосовых каналах и автоматически присоединяющийся к ним при появлении участников для начала записи. По завершении разговора и отсоединении всех участников, бот отправляет аудиозапись на сервис распознавания речи (speech-to-text, вызов API) и ожидает возвращения текстового представления записи. Затем бот использует OpenAI API для создания резюме данной записи. По получении сформированного резюме, бот отправляет его в виде текстового сообщения в соответствующий голосовой канал. Готов по T&M с трекером или, если уверены в себе, Fixed price.

Развёрнуто:
Техническое задание

1. Название проекта:
Discord-бот для записи и создания резюме голосовых каналов

2. Цель проекта:
Создание бота для Discord, который будет записывать разговоры в выбранных голосовых каналах, преобразовывать их в текст и составлять резюме с использованием OpenAI API.

3. Основные функции и задачи:

3.1. Мониторинг выбранных голосовых каналов:
- Бот должен следить за активностью на выбранных голосовых каналах.

3.2. Запись разговоров:
- Как только на канале появляются участники, бот автоматически присоединяется и начинает запись.
- Запись должна быть сохранена в подходящем формате (например, MP3).

3.3. Распознавание голоса:
- После того как все участники покинули канал, бот должен отправить запись на распознавание голоса с использованием speech-to-text сервиса.
- Бот должен ожидать ответа от сервиса и получать текстовое представление записи.

3.4. Создание резюме:
- Бот должен использовать OpenAI API для составления резюме текстовой версии записи.

3.5. Отправка резюме в голосовой канал:
- После получения резюме, бот должен отправить его в виде текстового сообщения в соответствующий голосовой канал.

4. Технические требования:

4.1. Язык программирования: Python или любой другой подходящий язык программирования.

4.2. Интеграция с Discord API для работы с голосовыми каналами и сообщениями.

4.3. Использование предоставленного speech-to-text сервиса через вызов API.

4.4. Интеграция с OpenAI API для составления резюме.

5. Этапы разработки:

5.1. Разработка и тестирование алгоритма записи голосовых разговоров.
5.2. Интеграция с сервисом распознавания речи и получение текстовой версии записи.
5.3. Интеграция с OpenAI API для составления резюме.
5.4. Разработка и тестирование функционала отправки резюме в голосовой канал.
5.5. Интеграция всех компонентов и тестирование полной функциональности бота:
- Провести объединение всех разработанных компонентов в рабочий бот.
- Проверить корректность работы всех функций бота в различных сценариях, исправить возможные ошибки и недочеты.

6. Бюджет проекта: T&M