буду работать с ds много, в общем погружаюсь.
Подскажите, задача поиска способов сегментации пользователей по разным факторам (в т.ч. поведенческим) с учётом разницы по этим сегментам определенных метрик - это же типичная задача сегментации в ds?
Т.е. чтобы модель сама искала разные способы разделения пользователей на сегменты, у которых будет значимо отличаться важная метрика, и выдавала описание этих сегментов
в зависимости от факторов подойдут алгоритмы кластеризации, например, k-means. но для него нужно изначально знать количество кластеров. их можно определить разными способами, например, наивным образом или через построение дендрограммы
Я так понимаю, кластеров всегда будет 2. "Все" и те, кто из них выбивается по метрике. От алгоритма требуется подбор факторов как раз, чтобы на выходе был некий список. Типа есть вот такой кластер, у него метрика ниже на столько. И так по фактору для каждого способа выделения кластера
Норм
А метрика известна что ли?
Обсуждают сегодня