много пропущенных значений? Методы с заменой пропущенных значений, например, на среднее или удаление записей с пропущенными значениями не подходят
среднее - не всегда работающая история. В свое время уважаемый г-н Аббакумов в одной из своих лекций говорил так: если у вас есть пропуски и дропать строки - не вариант, то попробуйте: а/ среднее (если данные распределены нормально) б/ медиана - чуть лучше, но тоже не панацея в/ мода - редко вспоминают, но тоже может сработать г/ (самое важное) - кластеризуйте данные по другим имеющимся значениям и потом уже заполните средними / медианой и т.д. внутри кластера
Обсуждают сегодня