к колонкам-фичам применяют логарифмирование при помощи df.apply(np.log)? Увидела этот приём и объясняю себе цель такого преобразования как приведение к единому масштабу величин, сильно различающихся по абсолютам, верно ли это утверждение? Возможно, есть другие принятые способы нормирования? Хотелось бы прочитать про преимущества и недостатки такого подхода
стандарт скейлер же вычитает среднее и делит на стд, чтобы величины оказались распределены вокруг нуля. Если в столбце данные отличаюся на порядки, то и среднее у такого столбца будет очень большое и если его отнять от всех примеров, то получится плохо распределенная ерунда
Ну вообще это может быть для того чтобы распределение было похоже на нормальное
Обсуждают сегодня