14 декабря, то доклады можно посмотреть в записи.
👉 Мультиспикер и многоязычные модели синтеза речи. Генерация несуществующих голосов. Борис Жестков, Team Lead RnD TTS
👉 Как (не)правильно задавать вопросы синтезом речи? Элчин Керимов, ML Engineer, TTS
👉 Когда TensorRt недостаточно: ускоряем синтез на CUDA. Артём Хорошев, Senior C++ developer в группе разработки синтеза речи
👉 Детекция ключевых слов в устройствах Сбера: ML-техники для наилучшего качества. Павел Богомолов, руководитель команды качества распознавания речи
👉 Улучшение качества распознавания речи за счёт неразмеченных данных: Pre-training, Active Learning, Pseudo-Labeling. Георгий Господинов, Research Engineer, ASR
Остальные доклады с этой встречи будут доступны также в ближайшее время.
Приятного просмотра и не забывайте делиться нашими видео🫶
ребята, посоветуйте, пожалуйста, что почитать про pseudo labelling для asr'ки без доступа к разметке, может быть какие-то крутые подходы есть нашла вот это сообщение с интересной работой, но тут кейс с разметкой
Спасибо)
Обсуждают сегодня