= scaler.transform(data)
, на выходе numpy.array. потом я его кидаю опять в dataframe.
data_scaled_df = pd.DataFrame(data_scaled, columns=data.columns, index=data.index)
я правильно понимаю, что одно и то же наблюдение в
data
и
data_scaled_df
будет под одним и тем же индексом?
Зачем так сложно? MinMax scaler же руками на numpy в одну строку пишется
Вообще, кстати, не обязательно. Если index в DataFrame не Range Index, инфа об индексе пропадет.
Обсуждают сегодня