из множества предложений. Можно ли эти документы закластеризовать с использованием кодеров, например bertа?
BERTopic?
Я делал такой трюк. Делил текст на предложения, получал их вектора. Потом с помощью k-means получал k векторов центроид и их усреднял
Потом данные "вектор-документы" класторизовать в помощью dbscan либо birch
Обсуждают сегодня