CTC-based ASR? Кроме beam-search. Интересуют такие методы, которые предполагают отдельное обучение ASR и LM. То есть использование декодера с LM только в инференсе. Если я правильно понял термин, то это называется shallow fusion LM.
Если не beam-search то можно в сторону трансформеров посмотреть, в доке NeMo есть инфа
Обсуждают сегодня