- ставишь текст - выбрал голос - нажал озвучить - книга за 4 мин.
Тут всё-таки вопрос скорость или качество
и скорость и качество - от движка зависит
качество звука высокое но качество произношения низкое
это 10 летней давности движок
В Vosk есть современные движки, а также в Silero
так он говорит за ту штуку где не с нейронками, а как я понял аудио нарезки совмещаются
Обсуждают сегодня