меня есть 100000 сэмплов. Там 13 колонок. И в этих 13 колонках есть такая колонка категорий, при энкодировании которых появляется 200 дамми колонок, вроде и не много. Там также и другие категоричные колонки, но они дают меньше дамми. Так вот при обучении с вот этой колонкой с большим количеством дамми, MAE у предсказания невозможно большой, как только убираю эту колонку, все нормально становится. Вроде как бы сэмплов много - должна дообучаться, не до конца понимаю что происходит. Модель на scikit-learn. Может там лимит на количество эпох?
Ты одну колонку убираешь или 200 порожденных ей дамми?
Обсуждают сегодня