которой не известно количество кластеров. Алгоритмы где не нужно знать количество кластеров не проходят по памяти. С какой стороны подойти?
Можно подойти со стороны ближайшего магазина, где продают ОЗУ. Или сервак арендовать
Задать этот вопрос в чате дибиэйщиков
Можно алгоритм на машинном коде написать.
можно попробовать уменьшить размерность имеющихся данных (сколько данных есть? по каким признаком нужно кластеризировать? сколько признаков?) и визуализировать их в попытке посмотреть примерное количество кластеров. снижение размерности полезно проводить и перед самой кластеризацией, UMAP например круто умеет это делать: https://umap-learn.readthedocs.io/en/latest/clustering.html
Посчитать попарные расстояния, только не всю матрицу сразу, а в цикле, потом либо пихать в scipy agglomerative, или в dbscan или писать свою аггломеративную кластеризацию на дисджоинт сетах.
Обсуждают сегодня