Кто кстати видел какие-нибудь бумажки/статьи по модификации fastPitch ?

Обучал разные версии миксера для русского на RUSLAN’е - с ЛМ, без ЛМ, с ручным проставлением ударений и без - все завелись, работают неплохо. Без ударений с ЛМ не всегда правильно ударения проставляет, но по длительности слов вроде нормально угадывает. Правда пришлось ещё HiFiGan файн-тюнить, из коробки немного робовойс получался.

0

06.02.2022

Nik Автор вопроса

Vladislav Lupanov
Обучал разные версии миксера для русского на RUSLA...

Git есть?

0

06.02.2022

Vladislav Lupanov

Nik
Git есть?

Пока нет, я прям в немо правил код, мб причешу и выложу

0

06.02.2022

Korovsky · Accepted Answer

Погуглите MixerTTS. В Nemo есть реализация. У меня на русском ванильная версия завелась, а улучшенная (MixerTTSX) нет. В улучшенной версии в оригинале используют ALBERT (просто добавляя токены для слов перед декодером), но поскольку на русском его нет, я пробовала обычный BERT. У меня очень быстро портятся длительности звуков и питч почему-то. Интересно, конечно, было бы посмотреть, если бы кто-то ещё попробовал эту архитектуру на русском.

26 похожих чатов

Кто кстати видел какие-нибудь бумажки/статьи по модификации fastPitch ?

10 ответов

Похожие вопросы