переменными с большим(Скажем, 10) количеством вариантов? Если просто разбить на 10 новых признаков, то не будут ли они неоправданно большой вклад вносить (как в бустинге, например)?
2) Правильно понимаю, что при кластеризации необходимо нормировать все переменные? Что в таком случае делать с категориальными?
По-моему, тут классный вариант: https://habr.com/ru/post/556882/
Обсуждают сегодня