следующий вопрос: Пропуски в данных. Что если пропуск заполнять путем нахождения ближайшей точки? Например эвклидовым расстояние. Понятно что если векторы бинарные, в таком случае подойдёт другой способ измерения (думаю посыл мой понятен). Либо вообще строить модель для того чтобы заполнить данные (предсказать значение пропуска). Кто - нибудь практиковал такой подход?
median, mean, mode, строить модель для заполнения норм но может быть переобучение, такой себе псевдолейблинг. Вообще для сложных моделей типа бустингов лучше вообще ничем не заполнять, они сами с пропусками работают
Обсуждают сегодня