Реализация модели Speaker Diarization с HuggingFace и распозн голоса

2 000 руб. за проект

27 февраля 2024, 22:54 • 3 отклика • 27 просмотров

Ищем опытного специалиста в области обработки аудиоданных и машинного обучения для выполнения следующих задач:

Раскатать и настроить модель Speaker Diarization31 из библиотеки Hugging Face для разделения аудиоданных на отдельные фрагменты по говорящим.
Реализовать аудио-распознавание с использованием модели Whisper от OpenAI или другой подходящей модели для преобразования аудиофайлов в текст.
Интегрировать результаты диаризации и распознавания для создания итогового вывода, который позволит идентифицировать говорящих в аудиозаписи и транскрибировать их речь.

Условия:

Временные рамки проекта - до (указать срок).
Оплата обсуждается индивидуально в зависимости от опыта и квалификации исполнителя.

Просим предоставить портфолио или примеры ранее выполненных проектов в области обработки аудиоданных и машинного обучения при подаче заявки.

Пожалуйста уделите хоть одну минуту на написание отклика. Типовые отклики на все задания и отклики типа "пишите - обсудим" не рассматриваются.

Благодарим за проявленный интерес к проекту и ждем вашего отклика!

Войдите или зарегистрируйтесь, чтобы откликаться на заказы