Здравствуйте, вопрос для людей которые шарят за синтез: Как лучше всего реализовать интонации? Какие технологии и методы существуют для этого?
Кто кстати видел какие-нибудь бумажки/статьи по модификации fastPitch ?
Интересно какие архитектуры используют другие в синтезе речи. Просто раньше кроме Tacotron я ничего не использовал, но FlowTron меня приятно удивил. Какие ещё есть интересные...
вот например на 2 x A100 сколько трениться будет условный Tacotron?
Всем привет. Видели какие-нибудь обучалки по GAN? Очень интересно.
Кто знает норм библиотеку которая может и создавать и читать midi?
Мне вот интересно: почему мало кто тут использует fastPitch и fastSpeech? Вроде они же максимально гибкие и файтюн можно за 30 минут обучить.
Разве не круто иметь историю о том как ты отказался от халявных пары лямов?
"Вы все хотите увидеть новую карту 3dfx Voodoo?" Перевод
А почему флопа в запрете?
А вы как думаете?