целевой переменной и оставить только их, и потом на них построить модель нейронной сети ? Что тогда будет ? Будут ли какие-то проблемы? И наоборот , предсказания получаться хорошими ?
Технически, корреляция говорит нам, насколько вектора переменных сонаправлены и насколько между ними острый угол. Однако, корреляция ничего не говорит о влиянии, то есть, эти две переменные могут быть сонаправлены почти из-за чего угодно. Если пробовать искать обладающие наибольшей предиктивной силой по отношению к целевой переменной предикторы, то, я думаю, будет более эффективно использовать коэффициенты частных корреляций, которые убирают из коэффициента примесь возможного влияния других измеренных нами переменных. А, вообще, лучше использовать тогда BORUTA алгоритм, он позволяет достаточно эффективно находить сильные переменные.
Спасибо... А есть ли библиотека, которая находит коэффициенты частых корреляций, чтобы...исключить влияние других переменных смешанных ?
Наверняка есть. Попробуйте загуглить: "partial correlation python". Я преимущественно пишу на R.
Всё еще смотрите Сираджа ? 😂 Зашел в коменты и наткнулся на ваш
Обсуждают сегодня