Коллеги, добрый день! Подскажите, зачем перед стандартизацией данных при помощи StandartScaler

Question

Коллеги, добрый день! Подскажите, зачем перед стандартизацией данных при помощи StandartScaler

к колонкам-фичам применяют логарифмирование при помощи df.apply(np.log)? Увидела этот приём и объясняю себе цель такого преобразования как приведение к единому масштабу величин, сильно различающихся по абсолютам, верно ли это утверждение? Возможно, есть другие принятые способы нормирования? Хотелось бы прочитать про преимущества и недостатки такого подхода

#database #programming #russian #software

0

28.01.2020

2 ответов

43 просмотра

Maxym Shyrchenko

Ну вообще это может быть для того чтобы распределение было похоже на нормальное

0

28.01.2020

Yevhen Kolodko · Accepted Answer

стандарт скейлер же вычитает среднее и делит на стд, чтобы величины оказались распределены вокруг нуля. Если в столбце данные отличаюся на порядки, то и среднее у такого столбца будет очень большое и если его отнять от всех примеров, то получится плохо распределенная ерунда

215 похожих чатов

Коллеги, добрый день! Подскажите, зачем перед стандартизацией данных при помощи StandartScaler

2 ответов

Похожие вопросы