дилетант в DS, но.
Почему бы автору вопроса не взять выборку данных, посчитать средние/медианные значения, выяснить 3 сигма диапазон, объявить все, что выпадает за 3 сигма аномалией, а потом пройтись скриптом по новым данным для выявления аномалий?
Все квартиры по 100метров и стоят 1М. И появятся 1 на 1000м и стоит 10М. С точки зрения сигм - ошибка, но по факту - нет
Обсуждают сегодня