Web service интегрированный с Yandex speech-to-text + Yandex mystem

Цена договорная
06 марта 2021, 23:17 • 5 откликов • 35 просмотров
Разработать инструмент, который, обращаясь к публичным ресурсам Яндекс «speech-to-text» + Yandex mystem, трансформирует аудио файл в текст, а затем в таблицу.

Форма реализации: или утилита на устройстве Заказчика, или web-сервис – решается в процессе консультации Заказчика.

  • Шаг 1 = при помощи сервиса распознавания голоса перевести аудиофайл (запись разговора) в текст.
  • Шаг 2 = при помощи сервиса лемматизатор (стеминга) объединить все повторяющиеся словоформы, у однокоренных слов убрать суффиксы и окончания, определить все части речи слов.
  • Шаг 3 = удалить из файла не несущие значения части речи: предлоги, союзы, числительные, знаки препинания.
  • Шаг 4 = трансформировать файл в табличный формат (доступный для открытия в Excel):
Используются следующие открытые сервисы и форматы:

1. Аудиофайл формата Zoom. Аудио/видеофайл (MP4), аудиофайл (m4a). https://support.zoom.us/hc/ru/articles/201362473-%D0%9B%D0%BE%D0%BA%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F-%D0%B7%D0%B0%D0%BF%D0%B8%D1%81%D1%8C

2.Использования утилиты Яндекс «speech-to-text» https://cloud.yandex.ru/services/speechkit. Опция распознавания длительных аудио 30-45 минут. На период 3 месяца (март-апрель-май).

3.Использование утилиты Yandex mystem https://yandex.ru/dev/mystem/doc/index.html
Он используется для лемматизации или стеминга - https://ru.wikipedia.org/wiki/%D0%9B%D0%B5%D0%BC%D0%BC%D0%B0%D1%82%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F
По другому его называют морфологический анализатор русского языка - https://nlpub.ru/Mystem)