N-граммную модель она же должна влиять на подсчет лосс функции (т.е. фунцкия будет считаться поверх исправленных с помощью языковой модели примеров) и соответственно на обучение в целом?
(По вот этому вот гайду она вроде как никак не влияет)
Не должна, только при распознавании используется
Спасибо! А в целом, есть ли смысл ее подключить в ручную, даст ли это позитивный эффект?
Обсуждают сегодня