использовать регрессионные модели , то обязательно ли выдерживать условие нормальности распределения признаков и таргета (или остатков)? И как можно проверить нормальность распределения остатков в sklearn ? В частности интересуют регрссоры : линейная, дерево решений регрессор, knn regressor? Читал на stack overflow - что требование нормальности необязательно и лишь формально
Для линейной регрессии да. Нужно выдерживать условия Гаусса Маркова
Это если применять линейную модель с МНК, тогда макс. правдаподобие достигается при нормальности признаков, но можно использовать и другие методы типа метода Тейла или RANSAC
Там не нужно требование нормальности?
Деревья вообще не из этих условий выводятся. А про knn регрессию не слышал. Но вот knn классификация тоже насколько я знаю не базируется на каких либо условиях о нормальности данных.
Обсуждают сегодня