каким признаком нужно кластеризировать? сколько признаков?) и визуализировать их в попытке посмотреть примерное количество кластеров. снижение размерности полезно проводить и перед самой кластеризацией, UMAP например круто умеет это делать: https://umap-learn.readthedocs.io/en/latest/clustering.html
Спасибо)
umap будет работать до скончания времен, если там действительно много данных, быстрее будет обычный кодировщик сделать
Обсуждают сегодня