есть одна фича в которой 15 уникальных значений. Я исользую эту колонку в процессе сегментации. Какие есть варинты принять 2 и более значений как одно ? то есть например a, b, c принять как одну категорию d? Думаю надо копать в сторону стат тестов, но хотел бы узнать может есть альтернативы ?
А не проще попробовать кластеризовать данные по этой и другим фичам?
Обсуждают сегодня