42к дата сете.
Возможно ли к такими RNN-T моделям KenLM приделать?
Сложно, но думаю можно. На каждом рекурентном шаге RNN-T учитывать вероятности из лингвистической модели. Делать это придется для поиска луча, то-есть по несколько раз. Надо будет переписать код из NEMO и код из КеnLM. Вероятно , будет долго обрабатываться.
Спасибо за ответ, буду думать)
Обсуждают сегодня