Доработать код

5 000 руб. за проект
19 марта 2024, 11:15 • 7 откликов • 96 просмотров
Бюджет по заказу проставлен символичный, т.к. сложно оценить объём работ, если есть стоящие предложения, готов к обсуждению суммы.

Задача:
С около 50 микрофонов в режиме реального времени приходят аудио потоки, которые необходимо транскрибировать в онлайне и проверять на слова триггеры.

Что есть:
Есть написанный для данных целей код на Python с использованием библиотеки vosk.

Необходимо сделать доработку, чтобы выделить определённый голос говорящего( по слепку голоса например) из общего потока. Или если не использовать библиотеку vosk, то ваши предложения как это можно сделать. К примеру есть 3 говорящих, и чтобы можно было выделить именно Васю из потока речи. Возможно ли сделать подход как у Алисы? Т.е. запомнить голос на основе 5 произнесённых фраз к примеру и т.д.