Всем привет! А как в синтезе речи сделать поддержку SSML

Question

Всем привет! А как в синтезе речи сделать поддержку SSML

(speech synthesis markup language)? Это делается на уровне обучения - добавляются токены тишины и ускорения там, например. Или на моменте инференса мы запускаем его несколько раз и склеиваем как диктует SSML разметка. Второй вариант может неправильно учесть интонацию и добавить артефакты склейки, например, но интуитивно проще.

В общем, какие best practices существуют на это?

#it #russian #speech-recognition

0

01.06.2022

1 ответов

51 просмотр

Andrei ivanov · Accepted Answer

Andrei ivanov

Чтива нет, но видел по такой штуке у нас доклад. Искажения там на спектрограмму накладывается, а потом озвучиваются вокодером

0

01.06.2022

26 похожих чатов

Всем привет! А как в синтезе речи сделать поддержку SSML

1 ответов

Похожие вопросы