Интеграция Google Cloud Speech API на сайт на Wordpress

7 000 руб. за проект • безналичный расчёт, электронные деньги
09 августа 2016, 23:32 • 1 отклик • 21 просмотр
Мы с коллегой запустили сайт egenglish.ru - интерактивный тренажёр устной части ЕГЭ по английскому языку. Идея состоит в том, чтобы дать возможность ученику прочитать в микрофон ответ на вопрос, затем распознать речь, перевести в текст, проверить ошибки, оценить ответ по критериям ЕГЭ.

На сайте установлена LMS Academy на основе Wordpress. Подключена проверка грамматики от сервиса TextGears в форму комментариев (javascript). Также установлен сервис распознавания речи, протестировать который можно на странице https://egenglish.ru/lesson/1-zadanie-ege-free-version/ (работает только в Chrome).

Что происходит сейчас на сайте:
- ученик нажимает на кнопку "подключиться", "начать запись", читает свой ответ, нажимает "остановить запись", и его ответ появляется в кастомной форме для комментариев.

Что не нравится:
- работает распознавание только в хроме
- не работает на мобильных устройствах
- длится до 30 секунд.

Что нужно сделать:
- оставить одну кнопку "запись" (судя по вебвизору, до кнопки "остановить запись" доходит только десятая часть посетителей сайта - при этом придётся продумать, когда останавливать запись - в крайнем случае, вставить вторую кнопку "остановить запись")
- подключить гугловский speech api в нашу форму (поскольку в ней уже подключена проверка грамматики) - квоту мы обсудили, ключи получили.
- для этого, очевидно из примеров, нужен промежуточный сервер на Node.js для передачи нашей микрофонной записи в гугл.

Что было бы неплохо иметь при этом:
- текст распознанной речи отдельно. Нам нужно искать в нём тематические слова и словосочетания, поэтому нужно будет иметь возможность его распарсить.
- кроссбраузерность; возможность включать распознавание в браузерах explorer, firefox и safari.
- возможность включать всё на мобильном устройстве. Это не самый важный фактор, поскольку мы нацелены на работу со школами, а учителя вряд ли будут работать с мобильными, но было бы неплохо.

Примеры от гугла:
https://cloud.google.com/speech/docs/samples
https://cloud.google.com/speech/docs/rest-tutorial
https://github.com/GoogleCloudPlatform/java-docs-samples/tree/master/speech/grpc

Срок выполнения - неделя.
Оплата договорная (бюджет до 10 т.р.).