Можно ли посчитать или может есть какая-то эвристика, сколько значений должно присутствовать в столбце( или просто быть ненулевыми), чтобы этот признак можно было брать в модель?
Information gain от бинарного разделения?
Корреляцию с другими признаками посчитать. Если нет - то на мороз
Обсуждают сегодня