для CTC моделей?
https://arxiv.org/abs/2002.07650
Я немного научился с помощью wav2vec это делать, но подход надо тестить )))
Недавно тестил wav2latter++, по качеству получилось как QuartzNet но намного медленнее. Тоже хотел посмотреть wav2vec, но теперь думаю стоит или нет. Получилось ли достичь супер качества как в статьях?
Обсуждают сегодня