занести в данные, есть категориальные данные, там много категорий, сама фича коррелирует с таргетом, в этих категориальных данных есть миссинги, восстановить с методами MICE, max likelihood не получится, потому что много категорий, сбросить варианта тоже нет, лучший ли это выбор заменить миссинги на категорию «другое»?
Как по мне - да. Сделал такой выбор в задаче классификации заявок в ТП. Но он тоже не очень хороший, т.к. будут как fp так и fn ошибки. Поищите возможность обогатить данные искусственно.
Обсуждают сегодня