Добрый день! Возможно уже был данный вопрос. Есть N-докумкнтов, состоящие

Question

из множества предложений. Можно ли эти документы закластеризовать с использованием кодеров, например bertа?

#nlp #programming #russian

0

18.04.2022

31 просмотр

Я делал такой трюк. Делил текст на предложения, получал их вектора. Потом с помощью k-means получал k векторов центроид и их усреднял

0

18.04.2022

Потом данные "вектор-документы" класторизовать в помощью dbscan либо birch

0

18.04.2022

Nikolay Karelin · Accepted Answer

BERTopic?

0

18.04.2022