готовым эмбединг генераторам c tf-hub и torch трансформерам для эффективной работы по классификации текстов (не считая, конечно, переобучение этих же структур на своих данных)? Задача классификации смс, тексты короткие, эмбеддинги кидаю в более простые модели. Работает нормально, но ветка задач будет расширяться и усложняться, хочется понимать, можно ли как-то расширить возможный стек. Методы типа topic modelling, классика с lda и пр. реально работают хуже, как по ощущениям/отзывам, так и по метрикам:).
Word2vec, fasttext
Обсуждают сегодня