в качестве overall significance test в случае логистической регрессии: Wald test, Chi-square или Likelihood Ratio (or Deviance) Test"?
Задача следующая:
Зафигачить много парных логистических регрессий (не спрашивайте зачем) с одной и той же зависимой переменной (aka таргет) и отобрать значимые предикторы (или, как принято в DS - фичи). Проблема в том, что все предикторы категориальные/номинальные и p-value выдаётся для каждой категории внутри переменной (фичи).
Хороший вопрос.. Тоже думал над близким вопросом...
Правда не ясно как вопрос связан с проблемой....
Обычно так и делают отбор....по каждой переменной строим логрег и смотрим на рокаук, маленькие обрасываем... Обычно делаем woe и не надо one hot
Обсуждают сегодня