на группы?
Использовал fuzzy k-means, результаты неплохие, но нужно задавать кол-во кластеров и соответсвенно придумывать дополнительный алгоритм поверх кластеризатора.
Есть лучше подходы?
Если это что-то похожее на классификацию/кластеризацию текстов, то можно посмотреть на https://github.com/bigartm/bigartm или вообще погуглить термин topic modeling.
Обсуждают сегодня