от датасета:
- проверить пропуски, если слишком много - можно отбросить признак
- заполнение пропущенных значений - есть разные варианты
- трансформация вещественных признаков при необходимости
- кодирование категориальных значений: ohe, le или другие варианты
- всякие аггрегаты типа суммирования, средних значений по категориям и т. д.
Трансформация вешественных?
Обсуждают сегодня