фичи из датасета?
А типы столбцов не помогают? select_dtypes и взять object и category
Есть разные подходы. Например https://adalabucsd.github.io/papers/TR_2019_SortingHat.pdf Или более «семантическая» https://arxiv.org/abs/2006.14806 Мы в своём автомл используем набор эвристик, которые позволяют определить тип переменной (а заодно и тип ее кодирования) так, чтобы максимизировать итоговое качество модели.
Обсуждают сегодня