Всем привет! Кто-нибудь может подсказать подход по интеграции LM в CTC-based ASR? Кроме beam-search. Интересуют такие методы, которые предполагают отдельное обучение ASR и LM....
ну то есть на входе корректора, как вы сказали, исковерканные тексты. А в качестве таргетов - корректно транскрибированная речь?
любопытно) А можете поделиться подходом / статьей? Если конечно, есть возможность )