Реализация модели Speaker Diarization с HuggingFace и распозн голоса

2 000 руб. за проект
27 февраля 2024, 22:54 • 3 отклика • 26 просмотров
Ищем опытного специалиста в области обработки аудиоданных и машинного обучения для выполнения следующих задач:

  1. Раскатать и настроить модель Speaker Diarization31 из библиотеки Hugging Face для разделения аудиоданных на отдельные фрагменты по говорящим.
  2. Реализовать аудио-распознавание с использованием модели Whisper от OpenAI или другой подходящей модели для преобразования аудиофайлов в текст.
  3. Интегрировать результаты диаризации и распознавания для создания итогового вывода, который позволит идентифицировать говорящих в аудиозаписи и транскрибировать их речь.
Условия:

  • Временные рамки проекта - до (указать срок).
  • Оплата обсуждается индивидуально в зависимости от опыта и квалификации исполнителя.
Просим предоставить портфолио или примеры ранее выполненных проектов в области обработки аудиоданных и машинного обучения при подаче заявки.

Пожалуйста уделите хоть одну минуту на написание отклика. Типовые отклики на все задания и отклики типа "пишите - обсудим" не рассматриваются.

Благодарим за проявленный интерес к проекту и ждем вашего отклика!