Сделать VAD (voice activity detection) адаптивным

111 000 руб. за проект
17 апреля 2024, 19:49 • 8 откликов • 78 просмотров
Имеется фронт на react+next.js , в нем есть VAD (voice activity detection), на библиотеке от ricky0123 (на гитхабе есть код [/ricky0123/vad]).


Необходимо допилить, чтобы этот VAD был Адаптивным в процессе работы (в течение одной сессии).

Для чего это нужно? Делаем голосового бота. VAD нужен для того чтобы фильтровать только фразы человека, и после того как человек закончил фразу, только после этого бот начинал обработку этой фразы целиком. У каждого человека свои паузы между словами и предложениями. VAD должен подстраиваться к каждому конкретному человеку.

В нашем случае, в начале разговора с ботом, человек может делать (например) 1-2сек паузы между словами/предложениями, к середине разговора с ботом, паузы между предложениями у человека могут составлять 3-5сек (у каждого человека свои показатели).



Схема работы следующая:
Никаких предоплат ( скамеры идут в даль ). Сделал у себя, показал что работает, мы поюзали (в твоей среде), убедились что работает, закинули оплату за работу, получили исходники. Все счастливы.

---
в отклике сразу пишите:
1. какой имеется опыт, близкий с задачей?
2. сумма/сроки (ваши предполагаемые) на решение данной задачи.
3. контакт в телеграме (для связи и созвона).