на него, получилось, что на ввп наиболее сильно воздействуют 7 независимых переменных.
Т.е модель с 7ю переменными, показывает самые правильные результаты (анализировал через stepAIC() )
Но научный руководитель говорил, что должно в итоге получится 2-3 основные независимые переменные, которые будут сильнее всего влиять на модель
Не до конца понимаю, что делать сейчас, то ли оставлять 7 независимых переменных, то ли каким-то образом приходить к 2-3
И если приходить к 2-3, то каким образом?
Через шаги уже пробовал, через regsubsets (пакет leaps) тоже.
Во всех случаях получаются 7 независимых переменных
Подскажите, пожалуйста, как лучше решить этот вопрос?
Странный руководитель. Ну можете посмотреть в сторону уменьшения размерности... PCA и т. п
Т.е в целом не обязательно приходить к 2-3 переменным? Меня просто это запутало, не совсем понимаю, для чего именно к 2-3 приходить
Думаю, идея человека, который хочет 2-3 переменных, заключается в том, что 7-9 переменных особо не поинтерпретируешь. Я считаю, что этот переход делать не нужно. Особенно, если Вы уже получили результат: типа, "мне не нравится результат, получи другой" — совсем не похоже на науку. Если это упражнение, тогда нужно спрашивать подсказки.
Понял, благодарю Тогда, думаю, остановлюсь на 7 переменных
По определению ВВП состоит из 5 слагаемых, поэтому в теории все должно свестись к таким слагаемым. На практике эти слагаемые могут быть ещё и коррелированный между собой. Хорошо бы посмотреть p-value для факторов: все ли они значимы?
если предикторы скоррелированы, то это нарушение ограничений на применение регрессии...
Я бы сказал, что есть техники работы с мультиколлинеарностью
Понял, посмотрю p-value, спасибо
Обсуждают сегодня