проходит нормальное распределение и имеет явно выраженное отклонение вправо (выбросы) . Данные панельные. Выбросы выкинуть не могу, т.к. как раз регион с наивысший значением и нужен. Хотела построить модель с фиксированный и случайными эффектами, но как её скорректировать? Кто может подсказать в какую сторону мне смотреть ?
Если вы спрашиваете в контексте применения линейной регрессии, то тут скорее надо, чтобы ошибки были распределены нормально, а не сама целевая переменная. Однако, вы можете попробовать general linear model, подобрать распределение и функцию связи.
Ошибки то нормально .... сама зависимая переменная вот так ....
логарифмировать таргет пробовали? или PowerTransformer из sklearn еще лучше
Обсуждают сегодня