Увеличить кол-во входных токенов в работающей Open source TTS модели

10 000 руб. за проект
27 сентября 2024, 00:11 • 2 отклика • 61 просмотр
Есть работающая open source модель (https://github.com/metavoiceio/metavoice-src). Принимает на вход максимум 140 символов (около 960 токенов).
Необходима доработка - возможность передавать за 1 раз не менее 300 символов (2048 токенов)

Ожидаемый результат: ветка в моем форке, которая соберется и отработает в колабе.

PS По факту подойдут любая TTS модель с открытой лицензией и качеством генерации не ниже указанной (человеко-подобная речь с эмоциями)