я обучал фастспич дня три на Руслане, он заговорил приемлимо на мос 3.6 по оценкам ~25 человек (но не помню остановил, потому что лосс перестал падать или меня колаб тогда довел таимаутами сессии 😅).
Сову и сильеро оценили тогда на ~4. Но сколько они часов обучали модель, вроде, не писали. Есть ли информация?
3 дня мало, надо недельку минимум
а вообще думаю лучше самому модельку реализовать т.к качество у Sova и Silero почему-то хуже, чем просто обученный Tacotron
Хотя возможно дело в том что в примерах на сайте до исторический Вокодер
Обсуждают сегодня