с помощью чего-то трансформерного и ему сопоставить в таблице, то сильно упадёт в качестве? В случае, если токенам и будут Nграммы букв
Можно обучить свой fasttext и сжать его по этой статье https://habr.com/ru/post/489474/
Если цель - ускорение, сжимать не надо. В моей статье цель сжатия - уменьшить расходы памяти, а по скорости fasttext лучше брать нежатый.
А его же получится адекватно применять при отсутствии видеокарт?
А ну да, прошу прощения, действительно у сжатого скорость меньше.
Да, я его вообще делал для применения на heroku со слабеньким CPU и 500мб памяти
Обсуждают сегодня