При миграции сервиса синтеза речи с CPU нод на ноды

Question

При миграции сервиса синтеза речи с CPU нод на ноды

с GPU ускорителями встретились с проблемой, что одна из важных компонент синтеза на GPU с использованием TensorRT стала работать ощутимо медленнее.

Так происходит из-за того, что наша архитектура нейронной сети рекурентная – нам надо успевать отработать 240 последовательных итераций за 10мс (~42 микросекунды на один вызов). TensorRT не дает сделать полноценный fusion (склевание) большого количества итераций в одну, из-за чего существенно теряет в производительности
Мы взяли низкоуровневый инструмент (CUDA), и написали решение, которое опережает по производительности TensorRT в несколько раз. На встрече 14 декабря поговорим о том, какие особенности архитектуры GPU и решаемой задачи являются определяющими и как мы справились с проблемой, написав низкоуровневое решение
Артём Хорошев Senior C++ developer в группе разработки синтеза речи, поделится деталями разработки решения. Начало в 18:00
https://jazz.sber.ru/3bomfa?psw=OAoTBkQBUUcdGhQQGxVGVBIQCQ

#conf

#c++ #embedded #programming #russian

0

14.12.2022

1 ответов

22 просмотра

Манкурт Кобейн · Accepted Answer

Манкурт Кобейн

Есть ли запись?

0

04.08.2023

170 похожих чатов

При миграции сервиса синтеза речи с CPU нод на ноды

1 ответов

Похожие вопросы