169 похожих чатов

Добрый день. Вопрос по логистической регрессии. Моя регрессия должна показать

уйдет клиент или нет в зависимости от локации. Всего 4 локации. Я вижу, что локация 1 стат значимо не отличается от базовой локации (то, что в интерсепте), как и локация 3. Нам нужно исключить эти локации из модели. Мой вопрос: как это правильно сделать?
Мое предположение было таким: закодировать так: если это локация базовая или первая или третья, то 0. если это локация 2, то 1. И после этого снова запускать логист.регрессию. Так нужно делать?

7 ответов

14 просмотров

для этого нужно построить confusion matrix на тестовых данных для начала. Коэффициенты модели с ее прогнозирующей способностью связаны примерно никак

1. Обычно в логистической регрессии работают с численными переменными-предикторами, а не факторными/номинальными. Использование последних уже является логистической регрессией с контрастами или что-то в этом роде 2. Соответсвенно Intercept - это параметр регрессии на константу и к кодированию отношения не имеет 3. Переменные можно просто исключить из модели. Собственно т.к. они не значимы, то и удаление/добавление таки переменных не должно сильно влиять на модель. Ваша Anova об этом и говорит. 4. Для того чтобы параметры регресси можно было анализировать на существенность то рекоменудется делать центрирование и нормирование. Тогда можно будет наглядно увидеть, что одни параметры существенные, а другие нет. Существенность и значимость - это разные вещи, естественно. 5. Обычно исключение переменных из модели линейной регрессии делается для того чтобы исключить мультиколлиниарность т.е. исключить многократное влияние одной экзогенной переменной

Ekaterina- Автор вопроса
Dm Kb
1. Обычно в логистической регрессии работают с чис...

Под существенностью Вы имеете в виду как сильно влияет на зависимую переменную независимая переменная, т.е значение коэффициентов (при условии, что мы стандартизировали переменные), под значимостью p-value? О факторных и численных переменных я думала, как и Igor

да, отличий от линейной регрессии нет... принцип работы моделей очень схожий... glm - чуть сложнее из-за проекции непрерывного численного множества в бинарное... просто, если на вход подается факторная/категориальная переменная (я не знаю, я тут гадаю), то она автоматически перекодируется в группу переменных с 0 и 1. т.е. была переменная location со значениями: location1, location2, location2, а стало три переменных у которых исключающая единица. Нам это особо не видно. Модель все делает автоматом, но знать что там происходит очень полезно. В таком случае Intercept также играет роль регрессии на константу и перекодировать ничего не нужно. Про контрасты можно почитать тут: https://r-analytics.blogspot.com/2013/03/blog-post_30.html#.XSHefpOPn6C

Ekaterina
Под существенностью Вы имеете в виду как сильно вл...

да, существенность - это сила влияния... переменная может объяснять всего 5-10% вариации, но быть очень существенной. Например ваши личные доходы могут объясняться на 5% выигрышами в лотерею с призовым фондом 1 млн. рублей. Значимость не такая большая как значимость переменной вашей ЗП, но вот влияние большое.

наверное можно и так сказать... просто переменную можно измерять в рублях, а можно в миллионах рублей... соответсвенно коэффициенты будут разные для рублей и миллионов рублей... но вы правы, чем меньше значимость тем ближе к нулю коэффициенты...

В статистике уровень значимости определяет вероятность совершить ошибку 1 рода. Эту вероятность задаёт сам исследователь.

Похожие вопросы

Обсуждают сегодня

Какой-то там пердун в 90-х решил, что есть какая-то разная типизация. Кого вообще это волнует?
КТ315
49
void terminal_scroll() { memmove(terminal_buffer, terminal_buffer + VGA_WIDTH, buffer_size - VGA_WIDTH); memset(terminal_buffer + buffer_size - VGA_WIDTH, 0, VGA_WIDTH); ...
Егор
47
Всем привет! Подскажите, пожалуйста, в чем ошибка? Настраиваю подключение к MySQL. Либы лежат рядом с exe. Все как по "учебнику"
Евгений
16
А можете как-то проверить меня по знаниям по ассемблеру?
A A
132
Здравствуйте! У меня появилась возможность купить книгу "Изучай Haskell во имя добра!". Но я где-то слышал, что эта книга устарела. Насколько это правда??
E
22
Здравствуйте! Я вот на stepic решаю задачи на хаскеле https://stepik.org/lesson/8443/step/8?unit=1578 мой код import Data.List (isInfixOf) removing :: String -> [String] ->...
E
10
Камрады, кто тесно работал с vtv, хотел уточнить. Ширина column задаётся жёстко на этапе создания дерева или можно в рантайме ее менять программно (не мышкой)?
Ed Doc
10
да ладно ... что там неочевидного ? глянуть в исх-ки датасета и/или кверика чтобы понять в каком месте и как выполняется обращения к св-вам blablaSQL - минутное дело, даже е...
Сергей
7
Здесь для arm кто-нибудь кодит ?
Nothing
52
Всем привет, у меня есть сервер принимающий входящие HTTP подключения, как проверить, что подключение было через прокси или нет, есть какие то поля в заголовках по которым мо...
Кибер Бомж
8
Карта сайта